分子人类学吧 关注:49,578贴子:2,650,195
  • 33回复贴,共1

转载王传超教授2015年的博文:川西羌语支人群的遗传结构

只看楼主收藏回复

这篇博文很不错,转载给大家学习。如果之前有人发过这篇文章,请原谅我重发了。
正文:
汉藏语系包含汉语、藏缅语族这两个分支的400多种语言,使用人数超过10亿,是仅次于印欧语系的第二大语系。汉语和藏缅语族之间的语言学关系已经非常清楚了,原始汉语和原始藏缅语有300多个同源词。基于词汇证据以及系统进化原理,王士元曾估算汉语与藏缅语约在6千年前分开。羌语支语言被认为是汉藏语系中最古老的类型,可能是其他汉藏语的源头。考古学证据也揭示汉藏族群的祖先至少6千年前就生活在中国西部。
尽管有众多的语言和考古学研究,我们对汉藏群体在中国西部的起源和迁徙过程还是知之甚少。过去二十年里,遗传学研究,特别是母系线粒体DNA和父系Y染色体,为汉藏群体的源流历史提供了非常有价值的参考。在母系方面,藏族中高频的北亚特有mtDNA单倍群A,D, G和M8揭示其可能的北亚起源。但是也有证据显示南部藏缅族群的遗传混合有性别差异,南部藏缅群体的遗传结构主要由两个亲本群体形成:北方移民和南方土著居民。在混合中,男性和女性世系是有差异的,在现存南部藏缅中北方移民对男性世系影响力更强(~62%),南方土著居民对女性世系做出的贡献更多(~56%)。同样的,南方土著在母系上对南方汉族的遗传贡献也更大。在父系Y染色体方面,宿兵等发现几乎全部的汉藏人群都有一个共同的遗传特征,那就是高频出现的Y染色体O3-M122支系,包括了O3*-M122,O3a2c1*-M134和O3a2b-M7等单倍群。他们指出在黄河中上游的有高频O3支系、使用原始汉藏语的氐羌族群是现代汉藏人群的祖先。但他们没有合理解释为什么Y染色体Alu插入(YAP)也在藏族中高频出现。YAP突变在日本和安达曼群岛高频分布,但在东亚的其他群体中几乎没有出现。单倍群D-M174是YAP+下的一个子单倍群,石宏等认为D-M174是南方起源并在6万年前向北迁徙。我们现在看到的D-M174的零散分布可能是带有高频O3支系的原始汉族群在新石器时代大规模扩张的结果。另外,宿兵等论文中的O3-M122众多支系中的一支O3a2b-M7后来被发现是孟高棉和苗瑶人群的代表类型。单倍群O3a1c-002611在宿兵等当时的研究中被归为O3*-M122这一未识别类群,现在我们发现其占到汉族的17%,但这一单倍群在藏缅族群里的频率极低,暗示这一支系并没有参与藏缅族群的形成。我们最近的研究还发现羌族的Y染色体STR多样性在藏东的汉藏族群里是最高的,揭示了羌人群可能是汉藏扩张的产物。


IP属地:广东1楼2016-01-27 21:17回复
    羌语支语言在汉藏语系中是一支比较保守的语言,也是保留古老面貌比较多的一些语言,主要分布在四川西部的河谷地区,这个地区被称为“藏彝走廊”,连接着黄河中上游和藏东,极有可能是汉藏群体起源和迁徙的通道,是汉藏族群乃至整个东亚人群起源的关键地区。羌语支包括羌语、嘉戎语、尔龚语、拉坞戎语、普米语、木雅语、扎巴语、却域语、贵琼语、尔苏语、史兴语、纳木依语等活着的语言及其文献语言西夏语,这么多羌语支语言在川西起源、交流和融合让藏彝走廊在解析汉藏源流上意义更重大。


    IP属地:广东2楼2016-01-27 21:17
    回复

      MtDNA
      mtDNA单倍群频率分布、群体遗传参数以及PCA分析
      四个羌语支群体中共有396个个体的线粒体高变一区被成功测序,共发现134个多态位点可将这396个样本分为214种单倍型。这四个群体的单倍型多样性是由0.978到0.994,道孚尔龚的多样性最低,而丹巴尔龚的多样性最高。与单倍型多样性类似,两两序列比较的平均碱基差异数和核苷酸多样性也是在丹巴尔龚中最高而在道孚尔龚中最低。然而,雅江藏族的单倍型多样性却比新龙藏族高,但两两序列比较的平均碱基差异数和核苷酸多样性却比新龙藏族低。Tajima’s D, Fu’s Fs, Fu and Li’s D*, 和Fu and Li’s F*等检测群体增长的参数在此次研究的四个群体里都是负值,但Tajima’s D, Fu & Li’s D* and F*在道孚尔龚里统计学上不显著。道孚尔龚在统计学上不显著的群体增长参数以及较低的多样性可能是由于其较小的样本量或遗传漂变造成的。
      依据mtDNA高变一区测序以及编码区的SNP分型数据,有397个样本被成功划分为了79个单倍群,这些单倍群都属于出非洲的两大超级单倍群M和N(包括R)。超级单倍群M及其下游支系占到了此次研究的羌语支人群母系基因库的59.70%,超级单倍群N及其下游支系占到了49.30%。单倍群D和G是超级单倍群M下最常见的类型,分别占到了全部样本的18.14%和13.60%。在超级单倍群N下,单倍群A和F是最常见的类型,分别占到了全部样本的13.60%和10.58%。大部分的单倍群属于欧亚东部特异类型,包括东北亚常见的A, D4, D5, G, C, 和Z,以及中国南部和东南亚常见的B, F, M7,和R9等。只在雅江藏族里发现了两例单倍群U的样本,可能追溯到欧亚西部或南部,仅占到全部样本的0.5%。中国南部和东南亚特异单倍群在丹巴尔龚、道孚尔龚、新龙藏、雅江藏里的比例分别是26.09%, 22.50%, 27.73% 和21.35%,然而东北亚支系在雅江藏、丹巴尔龚、道孚尔龚鹤新龙藏里分别占到了56.77%, 56.52%, 55.00%和43.70%。与青藏高原上的其他藏族群体类似,川西羌语支人群在母系上也与东北亚人群很相近。
      我们用羌语支人群和其他已发表的68个族群的mtDNA的单倍群数据进行PCA分析。第一主成分将北方群体(阿尔泰和北方汉)与南方群体(南方汉、壮侗和苗瑶)可以很好地分开,羌语支人群因高频A和G单倍群而被聚在了北方群体中。汉族和藏缅群体在第二主成分上有很大差异,而羌群体因M9a’b和M13而被聚到藏缅群体中。


      IP属地:广东5楼2016-01-27 21:27
      回复

        超级单倍群N下的主要支系是单倍群R及其下游分支B和F,分别占到了丹巴尔龚、道孚尔龚、新龙和雅江藏的母系基因库的26.09%, 22.50%, 28.57%, 和23.44%。B4*是单倍群B中频率最高的支系,占到了全部样本的4.53%。在B4*的网络图中,组成其根部的几乎全是非藏缅的样本,藏缅样本只是形成了一些小簇或共享一些末端单倍型,这表明B4*在进入西藏前就已经分化了。F1*是单倍群F下频率最高的支系,占到全部样本的5.54%,在道孚尔龚中竟高达12.5%。羌语支中F1*样本的共祖时间约在5千年前,其在网络图中形成的独有分支簇表明其在向青藏高原的迁徙中可能经历了较强的瓶颈或奠基者效应,且显著负值的群体增长参数揭示了F1*在适应高原过程中可能有群体扩张或受到选择作用。
        羌语支样本中的单倍群N*几乎都可划分到单倍群A。单倍群A在北亚和东亚广泛分布,在各群体中的比例在5%-10%之间。单倍群A在青藏高原上的平均频率是在9%左右。单倍群A4*主要分布在亚洲中部、东北部和西南部,也是羌语支单倍群A下的主要支系,分别占到了丹巴和道孚尔龚人群、新龙和雅江藏族人群的2.17%, 5.00%, 4.20%, 和12.50%。单倍群A4*的网络图分析也发现了星状结构,表明其在高原上经历过群体扩张,而且其他群体增长参数也支持其经历过扩张。单倍群A11是很早就从单倍群A的基部分出的,其下的两个分支A11a和A11b有着不同的分布模式。西藏的大部分A11样本属于A11*或A11a,只有一小部分在高变区有16234突变的样本属于单倍群A11b,但云南的藏缅和汉族中的A11样本都可被划分为A11b。在我们的羌语支样本中,有3个A11样本属于A11*,另外2个是A11b。




        IP属地:广东7楼2016-01-27 21:32
        回复

          讨论
          汉藏语系包含了广泛分布在东亚、东南亚、南亚部分地区的近460种语言,有汉语和藏缅语两个分支。尽管在语言学、考古学和遗传学上针对汉藏族群已有大量研究,但汉藏群体从哪里来、经历了怎样的迁徙扩散仍是有待进一步厘清的问题。现阶段被广泛接受的假说是汉藏族群源自新石器时代在黄河中上游的氐羌族群。氐族自后凉政权衰败之后逐渐演变成了汉族和羌语支人群。在本研究中,我们通过分析川西羌语支人群父系Y染色体和母系mtDNA来进一步阐明汉藏族群的源流历史。
          从父系Y染色体角度,单倍群D*-M174在其向东亚大陆迁徙过程中分出了D1-M15。在大约5-6万年前,单倍群D*-M174和D1-M15的一部分开经由川西走廊北上达到现今的青海省,而后很可能经由藏彝走廊进入喜马拉雅山区。单倍群D*-M174很可能在西藏分化出了D3a-P47。单倍群D3a-P47在青藏高原经历了近期的人口扩张之后可能经由川西走廊南下并逐渐成为了现今四川、云南和广西等地去藏缅族群的主要遗传组分。单倍群D很可能代表了旧石器晚期青藏高原上人类活动的证据。在母系mtDNA方面,我们也发现了旧石器时期的遗传,比如单倍群M62b。同样,青藏高原上一系列的旧石器考古遗址也是2-3万年前早期人类活动的强有力证据。
          在2-4万年前,一个带有高频O3-M122单倍群(包括O3a1c-002611,O3a2c1*-M134, http://O3a2c1a-M117以及其他O3支系)的族群达到了黄河中上游地区,并形成了氐羌族群。在新石器时代,氐羌族群经历了强烈的人口扩张。氐羌中的带有高频O3a2c1*-M134和O3a2c1a-M117的一支,也就是现在所称呼的原始藏缅族群,很可能也经由藏彝走廊经大规模西迁到达现今的青海省而后南迁至喜马拉雅山区,并非常可能经由川西走廊南下到云南和广西等地,而后和那里的D-M174混合形成了藏缅族群。有一点需要说明的是,从O3a2c1*-M134的STR网络图上判断,其很可能在上述与O3a2c1a-M117一起南迁到西藏之前就已经在西藏了。氐羌的另外一支,带有高频O3a1c-002611的人群在5-6千年前向东迁徙到中部大平原、黄河中下游地区,并逐渐与当地的土著(很可能是单倍群C和D的人群)融合。其后,黄河中上游带有高频O3a2c1*-M134和O3a2c1a-M117的氐羌人群形成了现今熟知的炎黄部落,而向东迁徙的带有高频O3a1c-002611的人群演变成了东夷部落。炎黄部落和东夷部落逐渐融合最终形成了现今的汉族,随着汉族的不断南迁并与南方土著壮侗、苗瑶等族群融合,汉族成为了中国最大的族群。
          单倍群O3-M122在藏缅族群起源中的作用揭示了北方族群对藏缅有着大量的遗传贡献,已有的常染色体STR、Y染色体和mtDNA研究也都支持这一观点。羌语支群体的母系基因库有大量北方族群的贡献,例如单倍群A、C、D和G等,其实这并不奇怪。黄河中上游特有的文化形式,比如彩陶、粟(小米)以及瓮棺藏等在川西的新石器遗址中很常见,这很可能就是由人经川西走廊传播来的。


          IP属地:广东8楼2016-01-27 21:33
          回复
            补充下我个人的见解,不是王教授的原文讲法。
            川西藏羌系民族的母系线粒体基因中有F类型,王教授在文中提到F1类型。我觉得川西的藏羌民族的母系中也应该有F下游中的另一支类型,那就是F3。
            F3就是原先的R9a,在英文维基百科中介绍到,F3在台南与马来群岛之间相对最为常见,但在中国的西南部和中南部的许多族群也很常见,在新疆汉族里也发现一例mt-F3。
            其实在抽样检测中,安徽合肥、江苏南京和陕西等华东和北方地区也发现有mt-F3。既然F3能在西部北上到陕西和新疆,明显在四川西部也应该有F3的踪迹,F3在川西应该也不少。
            我觉得最早的F原始类型应该是诞生在云南地区。因为F下游的F1、F2、F3和F4在云南均有发现,很明显F这些下游类型也是最早诞生于云南。F最早以云南为分化的大本营,扩散到湖北、湖南还有广西与广东。F以两湖作为新的分化中心扩散到安徽、江西和东部沿海的江浙。F1a的一些下游类型和F3、F4等以两广为跳板,传至海南、台湾和南洋群岛甚至达到日本,F2也传到了日本。
            不过南洋群岛的南岛语系民族的母系依然以M系为主体,并没有被F3和F4占据主体。M9的下游E和一些其他的M系占据着南岛语系人群的主流母系。
            王传超教授在2012年写的博文《文面独龙族的基因密码》中提到西南的藏羌系民族独龙族约有13.3%的mt-R9a。R9a现在并入到F下游成了F3。很明显F3在西南部和中南部还是很常见,藏羌和苗瑶的母系中必定少不了mt-F3。F3向北扩散到陕西,最北到达新疆。向东传至两湖,湖北的母系检测中有不少mt-F但却没有发现F3,湖南长沙仅发现一例F3。在两广F3也很多,再向南传到了南洋群岛。


            IP属地:广东10楼2016-01-27 21:35
            回复
              至于藏族人的mt-A11,看现在最新至2014年的母系基因树分支排行中,A11和A4、A3、A7、A9等母系有直接的共祖上游,那就是A-T152C!。但最新的的母系基因树分支排行中没有了A4这个序号。
              在文中,王教授依然认为mt-A是北方母系类型。我反而赞成陈致勇教授的说法:A这种N系母系是起源于南方。其实王教授在谈独龙族的基因的那篇博文中就提出,A这种母系最早分化于两广。


              IP属地:广东11楼2016-01-27 21:36
              回复
                欢迎大家前来指点讨论我的个人见解,欢迎讨论。


                IP属地:广东12楼2016-01-27 21:37
                回复

                  我知道有吧友回复了我,可怎么不见有人回复的言论呢?
                  没人对王教授的文章感兴趣了吗?


                  IP属地:广东15楼2016-01-28 15:24
                  收起回复
                    原来东夷和炎黄是一家


                    IP属地:陕西来自Android客户端17楼2016-01-28 19:34
                    回复
                      所以你认为东夷是西来而不是中路?


                      来自Android客户端18楼2016-01-28 22:43
                      收起回复
                        羌系母系比率图有没有?


                        来自Android客户端20楼2016-02-07 14:04
                        回复