追踪曹操基因释疑

1. 为什么做这个项目?

2009 年末,河南省安阳市宣布发现了曹操墓,出土了一男两女三具尸骨,考古人员推测男尸可能是曹操。消息一发表,立即在国内舆论界掀起轩然大波,质疑者甚众,引起对曹操墓真伪的争议。当时由于没有可以作为标准的曹操家族DNA 特征来作为骨骸验证的对照,遗传学无法就骨骸的身份作出判断。能否找到明确的曹操家族DNA 特征,从而分析曹操的身世,对曹操及汉魏历史的研究都有极为重要的意义。 同时,复旦大学正在积极推进历史人类学学科的发展,期望使用遗传学工具来准确定位历史上的民族和家族,解决单纯的历史学方法所无法解决的问题。曹姓作为一个重要的姓氏,同时又具有不大不小的适当规模,被选择为第一个深入研究的姓氏。2010 年1月26 日,复旦大学现代人类学教育部重点实验室和历史学系联合启动复旦大学文科科研推进计划项目-曹操后代的历史人类学调查,利用姓氏和Y 染色体相关性原理,调查分析曹氏Y 染色体,进而给曹操身世血统的研究提供科学的证据,也开始了人类基因调查从民族分析向家族分析的转变,从史前时期向历史时期的迈进。

2. 中间遇到哪些波折?

我们刚刚发布新闻说我们准备鉴定曹操遗骨真假的时候,很多网友、很多专家都出来问。甚至我们还没有鉴定,他们就出来“辟谣”。有考古专家表示:“考古不必要以DNA为佐证”,骨骼现在也是重要文物,为了鉴定他身份在上面钻个洞取DNA本身就是一个破坏文物的事情,好像完全没必要。如果为了鉴定他身份,完全可以从墓的形制等等鉴定。所以考古学不需要用这些新的技术新的方法作无谓的事情。但是大多数网友不买账,表示“DNA是最权威可信的证据,如果确认这个墓是曹操的话,为什么不作(鉴定)呢?”所以要解决遗骨的身份问题,只能通过DNA的手段,没有什么其他手段可以来做。当然,证明了这个骨头不是曹操的,也不能确认这个墓不是曹操的。比如这个墓里面随便躺一个人,或许是盗墓贼。反过来,如果证明了这个骨头是曹操的,那么这个墓是曹操的,就基本上没有问题了。当然这个墓里面现在躺的人太多了,有了三个人了,他/她们分别是谁,都是需要DNA解决的问题了。

实际上通过我们的DNA宣传,现在有部分考古学专家有了针对性的回应,他承认DNA鉴定是一个很好的方法,但称DNA鉴定曹操有两大难题。一个是只有在专业的实验室里面测试之后才能有科学的、客观的答案,才能知道这骨骼能不能作DNA鉴定。当然我们从照片上看到,这个骨骼保存得很好,没有受酸性物质的污染,没有被什么金属锈迹浸染过,而且一直保存在比较阴冷的环境下,所以做古DNA的鉴定条件还是相当成熟的。另外一点,必须要找到确定的曹操后裔,成功地提取遗传数据作为参考。这两点好像都是给我们的工作做铺垫用的。实际上这两大难题在其他学校可能是难题,但是在复旦绝不是难题,因为我们有国际一流的专业古DNA实验室,这解决了第一个难题。第二个,如何找曹操的后代,魏晋南北朝史的优秀历史学家韩昇教授已经用历史学方法找到了。我们课题组对上海图书馆收藏的118 件曹氏族谱进行了全面查阅和筛选,将家谱所载世系同历史记载相比较,挑选出比较可靠的家谱,其中包含自称是曹操后裔的家谱。把曹氏取样的面铺得广一些,多取一些样本,能够更加全面地反映出自古以来多支曹氏家族的基因状况,获得整体的把握。家谱调查反映出,与曹参或者曹操有关系的曹氏,大量分布于长江流域,与史料所见五胡十六国以后曹操家族迁居于江南的情况是吻合的。据此,我们大致确定了几处最接近曹操后裔的居住地,一是位于安徽、山东、河南、江苏四省的交界处,以安徽亳州为中心,这里是曹操政权的发源地,也是安阳汉墓被发现的地区;二是江东地区,包括安徽泾县、繁昌、歙县、绩溪、浙江的金华、东阳、绍兴、余姚、萧山和江西赣州等地;三是湖南等省沿江地区,如湖南兴化、郴州、益阳、长沙等地。曹操后裔在哪里,我们都抽一遍血就都可以验证了。

3. 技术手段和理论依据有哪些?

现代社会中,几乎每人都有自己的姓氏。一个人的姓氏不仅仅是简单的符号,还有着丰富的文化、历史、宗族背景。以血缘为脉络的姓氏记录着各家族甚至于各民族的源流,常被用于寻根溯源、族群识别、婚姻关系等相关研究。数千年来大部分姓氏都从父传递,而人类基因组中的Y染色体更严格地遵循父系遗传,因此姓氏与Y染色体有很好的平行对应关系。随着Y染色体上众多遗传标记的发现,用Y染色体结合姓氏分析人类学问题的方法,在分子人类学领域发挥出了重要作用。

与姓氏不同,人类的Y染色体直接代表着父系遗传,永远是父子相传的,不会受到任何社会文化和自然因素的影响。人体内有23对染色体,其中22对常染色体中,每一对染色体都有一条来自父系,一条来自母系,两条染色体在传代过程中对应的部分会发生交换,从而造成混血的效应,就是遗传学上说的重组。另一对性染色体包括X染色体和Y染色体。在女性体内,X染色体也是成对的,分别来自父母双方,所以也不能避免混血的影响。而在男性体内,却只有一条来自母亲的X染色体和一条来自父亲的Y染色体,也就是说男性的Y染色体只能来源于父亲,所以人体性染色体的遗传方式决定了Y染色体遵从严格的父系遗传。

Y染色体与X染色体之间是否会发生重组呢?要回答这个问题,必须先了解Y染色体的结构。人类Y染色体DNA大约包含六千万个碱基对,其中染色体两端的5%为拟常染色体区域(pseudoautosomal region),在传代过程中与X染色体相应区段会发生重组,而主干部分的95%为非重组区域(NRY, non-recombinating portion of Y chromosome),不与任何染色体发生重组。所以,Y染色体主干部分的此特性,保证了子代能完整地继承父代的Y染色体主干而不受混血影响,保证了Y染色体主干的严格父系遗传。

所以,以现代的分子生物学技术为基础,研究Y染色体主干的类型分布,是直接追溯群体或者家族的父系起源的最佳方法,是验证祖先与后代的父系关联的关键手段。例如,在曹操的后人中分析Y染色体特征,我们就可以了解曹操本人的Y染色体特征。实际上,在一段有较可信历史记录的时期内,整个家族的姓氏与父系遗传的关联是可以保证的,所以家族的姓氏往往与固定的Y染色体类型共同传递,紧密关联。

在一代一代的父子相承的传递过程中,Y染色体也在慢慢地积累着变化。正是因为遗传突变的积累,使得人类父系遗传体系中,距离越远的个体的Y染色体差异也越大。Y染色体上的突变形成的个体差异主要有两大类,有一种叫做短串联重复,缩写叫STR,如果大家看过分子生物学的有关书籍,经常会看到。在基因组里面一个固定的区段,由几个碱基组成一个单位,不断地重复,重复数在人和人之间是不同的。打个比方,就像一辆火车,它有不同的车皮数,每节车皮都是一样的。这辆火车可以装10节车皮,也可以装12节车皮,每个人对应的区段上装的数量都不一样,这就构成了重复数的差异。另外一种叫单核苷酸多态,SNP,这个更流行。我们研究曹操的基因,关键就是要找到相应的SNP。SNP是固定的点上面的一种碱基类型的差异,从一种类型变到另外一种类型,这个点的旁边的其他序列都是一样的,但就这一个点上会发生变化,比如人类基因组中这个点原始型是A,有些人突然变成了G,这种变化会造成特定点上的性质的彻底改变。打个比方,这就像两辆卡车。一辆卡车装的是可口可乐,一辆卡车装的是七喜,这是完全不同的两个类型。只要看一个点,就知道这两辆车完全不同。

要确立父系遗传体系,最重要的前提是祖先的突变可以稳定的保留在后代的Y染色体上。SNP突变因为突变速率极低,可以做到在后代中永久地保留,后代只能在祖先的突变基础上积累新的突变,而不会丢失祖先的突变特征。通过比较人类与黑猩猩的Y染色体差异,以及大家系中的Y染色体的差异程度,Y染色体上的SNP突变的速率被计算了出来。每出生一个男子,一个染色体位置上发生SNP突变的概率为大约三千万分之一。实际上由于Y常染色质区的保守性,以及人类历史上大量男子都没有男性后代保留至今的事实,实际的群体中突变率应该低几个数量级。而我们通常研究的是Y染色体非重组区大约三千万个碱基对的常染色质区,按照每个碱基对三千万分之一的突变率,这个区段内每个男子平均都会有一个新的突变。这个新的突变随机地出现在Y常染区的任意一个点上,如果这个突变了的点上再发生一次突变,那么这个突变就在后代中丢失了,我们就无法通过后代确定祖先的Y染色体突变谱。但是同一个点上先后发生两次突变的概率,按照概率计算方法就是三千万分之一的平方,也就是九百万亿分之一,相对于人类自古以来的人口,这个概率就近似于零。所以我们可以说,绝大多数情况下,祖先的Y染色体上出现的SNP突变特征在后代中能够找到,而后代只能在祖先Y染色体突变谱的基础上增加新的突变。

由多个SNP突变构成的一种突变谱被称为一种单倍型。祖先型与所有后代型合称为一个单倍群。一个家族的所有Y染色体理论上都属于一个单倍群,因为其中所有的男性都应该来自同一个祖先。当然,单倍群的概念可大可小。大而言之,全世界的Y染色体都属于一种单倍群,都来自二十多万年前的一个东非晚期智人男子。进而,全世界又可以分为20种主干单倍群,编号从A到T。

A型大致分布在东北非和西南非。B型出现在中非部分和东非部分,可能是黑人的扩张造成的。E型分布的地方就比较多,在西非洲和东南非很多,这是大部分黑人的主要类型,在欧洲和东非也有一部分的分布,甚至分布到亚洲的一些地方,分布到北亚的一些地方。前面几种类型在中国人里面一般是找不到的,D型在中国比较多,在中国的西藏,北方的一些地方,很多类型就出现在了日本,所以D型也是很传奇的一个类型,它是在中国地区最古老的一个类型,在东亚地区也很古老,在人群里面很少出现。C型也是出现在远东地区,在澳洲非常多,在北亚也非常多,它是被另外一种类型挤压以后出现两头多中间少的分布方式,然后一部分出现在北美的纳丁尼人,F型是一个上游型,它包括了F下面的所有类型,它的分布是这样的,整个欧亚大陆和美洲大陆基本上都是F型。其中G型出现在高加索山区和小亚细亚,然后以此为中心向四周扩散。H型出现在印度、巴基斯坦和伊朗地区,它是雅利安人扩张造成的结果,但也可能是荼拉维达人留下的,也可能是更早的人留下的。I型出现在欧洲的大部分地区,但是分布也不多,应该是欧洲、印欧的一种土著型。J型出现在亚非语系、阿拉伯世界和欧洲的很多地方,是白种人的类型,犹太人里面大部分都是J型。K型也是一个大的类型,包括下面很多类型,它是一个上游型,它的分布在亚洲很常见,但是把下面类型去除掉之后的纯K型是非常非常罕见的。T型是一个比较少见的型,也是分布在阿拉伯世界。然后L型分布在以巴基斯坦为中心的一圈地区,S和M就只分布在新几内亚土著人之间,食人群体里。N型很有意思,它的起源是在中国,但是居然分布到了整个北压地区的很多民族中间,并且在乌拉尔民族的群体里面占到了绝大多数,在芬兰、亚沙尼亚这些国家里面,占到了绝大多数,所以这些欧洲人居然都是从中国出去的,这部分欧洲人在欧洲号称自己是黄种人,但是我们怎么看都不像,至少比新疆人白多了,但他们还是号称自己是黄种人,所以这是一种民族心理上的错觉,我们看的时候会更多地关注一些差异,他们在欧洲觉得自己跟周围的白种人差别太大,因为他们关注这些差异,并且在大脑里面把这些差异给放大了。然后O型对于我们来说是最重要的,因为它是东亚人最主要的类型,在东亚人里面,几乎占到了百分之七十到百分之八十,在中国人里面甚至更多,O型是黄种人的关键型,但是刚才说的跑到欧洲去的N型跟O型是兄弟型,非常接近的。O型下面分很多类型,分O1、O2、O3这三大种。O1出现在中国东南的百越民族的后代中间,包括侗傣语系与南岛语系的这些民族,台湾高山族里面有些民族像阿美族占到百分之百。O2型非常有意思,一部分叫做O2a,下面分两部分,一个分支出现在东南亚,从苗族开始往西南地方绝大部分都是O2a,另外一个分支出现在日本和朝鲜,从朝鲜往东北的地方大部分都是这个类型。O3是一个大头,在中国大部分民族里面都有O3,而且O3大部分都是占多数,在汉族人里面更是多数,占到了大概百分之六十,O3下面有很多很多分支,这些分支能够让我们辨认汉族人里面到底有多少差异。然后Q型,Q型是出现在北亚的叶尼塞语系,进入到楚科奇-堪察加语系,然后进入到美洲印第安人,越往南Q型越多,美洲南方很多民族百分百都是Q型,因为他们一路走一路丢类型,到最后只剩下一种类型,所以迁徙得越到后面,类型就越少,因为不可能所有的人都能够成功迁徙,它的源头很可能就是在北亚叶尼塞语系这个地方,古代有两大批,现在被俄国人杀的只剩下一个民族,我们一直怀疑匈奴人就是叶尼塞语系的人,跟现在大部分人群都不一样。最后一个类型是R型,R型跟Q型、P型都是同源的姐妹型,但是它大部分分布在欧洲,所以是一个往东跑,一个往西跑,在欧洲的话也占到很大一部分,但是我们一直怀疑它是从亚洲跑过去的,所以白种人可能是从亚洲起源的。

那么这么多Y染色体类型的话,曹姓有哪一些?曹操到底是属于哪个型的?

4. 曹操的Y染色体类型

我们用Y染色体上的100个单核苷酸位点(SNP)对全国各地曹姓79个家族的280个男性以及其他姓氏的446个男性进行分型。我们所选取的100个SNP位点涵盖了最新Y染色体谱系树上的O、N、C、D、Q、R、J等东亚地区可见的所有单倍群。如果同一家族的个体间Y染色体单倍型不同,该家族则是由一些不同来源的单纯家族组成的复合家族,因此实际上我们总共研究了111个曹姓单纯家族。我们也在家族成员知情同意后将大部分家谱资料影印保存。根据家谱资料,15个曹姓家族宣称是曹操后代,他们中共有6种Y染色体单倍型,其中仅有一种单倍型是曹操的,而其它5种可能是由于收养、从母姓、非亲生等原因而引入的。我们需要通过分析不同单倍型在家族间的分布来确认哪个才最可能是曹操的Y染色体单倍型。

我们把这些曹姓家族分成三类:宣称是曹操后代的、未宣称是曹操后代(或宣称是其他祖源)的、其他姓氏的普通对照人群。首先,我们两两比较了每种单倍型在这三类家族间的频率差异,在未宣称为曹操后代的家系与普通对照人群间并未发现任何单倍型有显著差异,这表明曹姓与其他姓氏一样也是多起源的,所以我们在之后的分析中把未宣称的家族和普通人群合并在一起作为对照组。非常有趣的是,O2-M268是唯一在宣称是曹操后代的家族中显著高频出现的单倍型(Fisher精确检验,P=9.323×10-5),很有可能这就是曹操的Y染色体单倍型。某种单倍型是否是曹操的单倍型不能仅从其在宣称的家族里频率来判断,还要考虑其在宣称的家族与对照人群的频率差异。这里我们用OR值去估算O2-M268是曹操单倍型的可能性,OR值可判断两组变量间关系(带置信区间)。O2-M268在宣称为曹操后代的家族和对照人群间的OR值为12.72,所以其为曹操单倍型的可能性为92.71% (=12.72/(12.72+1)×100%)。还有一点需注意,有8个曹姓家族坚决认为不是曹操后代,这8个家族的Y染色体单倍型也都不是O2-M268,这也增大了O2-M268为曹操单倍型的可能性。

另外,我们也估算了反概率,即假定所有的曹操家谱都是伪造的,那么出现6个家族都是相同的O2-M268单倍型的巧合概率。由于这些家族在确信的历史中都没有联络,所以他们如果来源不同而基因类型相同就只能是由巧合造成的。我们知道,两个事件同时发生的巧合概率是两个事件单独发生的概率的乘积。那么我们可以这样估计曹操家谱相关家族的基因巧合概率:出现两个家族基因相同的事件计为一次巧合事件,概率就是O2-M268在全国汉族人中的频率约5%;出现第三个相同基因的家族则是两次巧合事件,概率为5%乘以5%;那么6个分布在不同地域的曹姓家族同时是O2-M268的概率是(5%)5=3.125×10-7,大约为千万分之三。也就是几乎不可能。

单倍型O3-002611是在其他曹姓家族中出现频率最高,也是唯一在宣称是曹参直系后裔的5个曹姓家族中都唯一出现的单倍型。我们继续使用推断曹操Y染色体单倍型的方法,对不同曹姓家族进行分类去推定曹参最可能的单倍型:5个自称是曹参后裔的O3-002611家族作为宣称组,79个未宣称的O3-002611家族和458个其他单倍型的家族作为对照组。经分析,O3-002611就是曹参最可能的单倍型(Fisher精确检验,P=1.968×10-4),可能性近于100%(OR值很高)。综合考虑我们的分析结果,我们认为魏武帝曹操不太可能是曹参的后裔,遗传学证据并不支持曹操自称的士族出身。

5. 曹操DNA结果对于人类学这个学科的发展有什么意义?

传统上主张将人类学分类为文化人类学和体质(生物)人类学两个大的方面,凡是研究人类社会属性的称为文化人类学或称社会人类学,凡是研究人类自然属性的称为体质人类学或称人类生物学。国内人类生物学的发展形势并不乐观。大部分高校和社科类研究所都设有文化人类学相关学科专业,唯独复旦生命学院在金力老师等的倡议下才设立了人类生物学专业并申请了博士点。在文化人类学的大环境下,复旦的人类生物学专业犹如一颗宝贵的种子努力探寻、争取着自己的发展空间。自02年,复旦成立现代人类学研究中心至今,我们已经在中国人的起源和蒙古人种的形成、肤纹肤色、语言特征的起源和演化等诸多方面取得了突破进展。成绩是辉煌的,忧患却依然存在,拿一个简单的数据来说明:04年复旦开始设立人类生物学硕士和博士点,每年招收1-2名学生,但培养的学生里至今仍从事人类生物学教学和科研的仅李辉老师一人。究其原因,主要是在文化人类学大环境下,大家大多割裂并漠视人类的社会学特征与人类的生物学特征及其对人类社会学特征的影响的关系。

中国的人类学要平衡发展起来,主要在于抓住人类的社会学特征与生物学特征的关系,或者说是文化与基因的关系,用分子人类学的手段去回答社会人类学难以阐述的问题。所以我们着眼于中华民族的姓氏文化,利用姓氏与Y染色体较好的平行传递关系去理清中华姓氏精细的Y染色体遗传结构,较成功的例子是与历史系合作通过调查现代曹姓人群来反推曹操的Y染色体类型为O2—M268,曹操的Y 染色体类型与其自称的先祖曹参的并不一致,此次曹姓家族Y 染色体调查是将遗传学用于古代史研究的一个成功范例,且提供了两个重要的契机,一是促成了历史学和分子生物学的深层次合作研究,建立了国内第一个以分子生物学为主要研究工具的历史人类学新学科;二是加快了人类基因调查从以民族向以家族为对象的转变。利用姓氏谱牒材料来确立深度家系(deep-rooting pedigree),这对于分析Y染色体进化也有重要意义,比如我们可以深家系的Y染色体测序来精确估算Y染色体的突变率,来为人群起源分化提供更准确的分子钟。我们希望此次曹操的Y染色体项目可以让更多的人了解分子人类学,推动这个新兴学科的发展。

Posted in 未分类 | Leave a comment

为什么做人类学?怎样做好人类学?

我是1987年8月出生于山东聊城,在故乡度过了自己的中小学时光,2006年考入中国海洋大学国家生命科学与人才技术培养基地班,开始四年海洋生物学的学习与科研,期间做过重金属对底栖桡足类的毒性试验、栉孔扇贝基因文库构建和青岛近海真核藻类病毒多样性研究等,在实验技术和科学素养上都得到了很好的训练。08年,我开始在论坛上接触关于现代人起源的辩论:出非洲还是多地起源,群体又是如何迁徙,如何多样化的?我也慢慢熟悉了相关研究论文,开始加入大家的讨论中。2009年夏天,我决定改做人类学。当时,周围的亲友、老师和同学是不理解,甚至说是不支持的,为什么要放弃四年来海洋生物学的积累而改做毫不相关的人类学?兴趣是最好的老师,且海洋生物学已是蓬勃发展之势,而相对冷僻的人类生物学或更可实现我的价值,多学科交叉毫不枯燥则更能激发我的灵感。我首先联系的是金力老师,后经李辉老师面试,终于在2010年2月正式进入现代人类学教育部重点实验室,专业是人类生物学,研究方向为分子人类学,自此开始了我的人类学探索发现之旅。

 

人类学是一门以人类自身及其文化为对象,研究人类本身的起源和发展,以及人类所创造的物质文化和精神文化的起源和发展规律的综合性交叉科学。传统上主张将人类学分类为文化人类学和体质(生物)人类学两个大的方面,凡是研究人类社会属性的称为文化人类学或称社会人类学,凡是研究人类自然属性的称为体质人类学或称自然人类学。分子人类学是生物人类学的一门新兴的分支学科,是分子生物学与人类学、考古学、语言学等交叉的新兴研究领域,主要通过研究人类的线粒体DNA、Y染色体等遗传信息来解决人类起源、人群关系、发展历史、群体结构以及迁徙方式等问题。文化人类学体系甚为庞杂,诸多学科间又有交叉、涵盖,现代科技却让体质人类学具备了文化人类学不具备的理性美感,特别是分子人类学,在分子结构上发现了人类的过去、现在和将来。

 

然而,国内人类生物学的发展形势并不乐观。大部分高校和社科类研究所都设有文化人类学相关学科专业,唯独复旦生命学院在金力老师等的倡议下才设立了人类生物学专业并申请了博士点。在文化人类学的大环境下,复旦的人类生物学专业犹如一颗宝贵的种子努力探寻、争取着自己的发展空间。自02年,复旦成立现代人类学研究中心至今,我们已经在中国人的起源和蒙古人种的形成、肤纹肤色、语言特征的起源和演化等诸多方面取得了突破进展。成绩是辉煌的,忧患却依然存在,拿一个简单的数据来说明:04年复旦开始设立人类生物学硕士和博士点,每年招收1-2名学生,但培养的学生里至今仍从事人类生物学教学和科研的仅李辉老师一人。究其原因,主要是在文化人类学大环境下,大家大多割裂并漠视人类的社会学特征与人类的生物学特征及其对人类社会学特征的影响的关系。

 

认清了问题根源,那么我也就明确了攻读博士学位及以后职业生涯的目标:抓住人类的社会学特征与生物学特征的关系,或者说是文化与基因的关系,用分子人类学的手段去回答社会人类学难以阐述的问题。我首先着眼于中华民族的姓氏文化,利用姓氏与Y染色体较好的平行传递关系去理清中华姓氏精细的Y染色体遗传结构,较成功的例子是与历史系合作通过调查现代曹姓人群来反推曹操的Y染色体类型。利用姓氏谱牒材料来确立深度家系(deep-rooting pedigree),这对于分析Y染色体进化也有重要意义,比如我们可以深家系的Y染色体测序来精确估算Y染色体的突变率,来为人群起源分化提供更准确的分子钟。另一方面是考察宗教文化与人类基因的关系,例如原始宗教、萨满教、摩尼教、基督教、佛教、伊斯兰教等宗教在不同历史时期以各种方式渗入到了社会生活的各个领域,这些对人群基因有无影响?伊斯兰教与的中国回族关系可以为回答这个问题提供线索。中国的回族起源源于本土人群宗教文化上的转变,还是伴随着一定强度的西部欧亚穆斯林的基因流动哪?我们对天津及其周边回族的调查发现,其72%的Y染色体属于欧亚东部特征单倍群,暗示了这批回族大多是东亚当地的人群接受了伊斯兰教文化转变而成,当然全国范围的回族调查还在进行中。通过大规模的群体调查,我们还发现了群体遗传结构与语言有较好的一致性,比如汉藏语系的Y染色体主要是O3类型,南岛语系则主要是O2,这可能与父系社会的嫁娶、从父居等生活方式有关。同时,应用生物信息学方法分析语言材料,探究语言特征的起源和演化,例如现代人起源于非洲并经过奠基者效应扩散到其他大陆,那么与遗传结构密切相关的语言是否也有同样的效应哪?这是非常有趣,且值得研究的问题。

 

对于人类类,做好科研是一方面,另一重要方面则是做好科普。拿着纳税人的钱做科研,成果理应通过各种渠道与大众共享。对于以后的职业选择,我是期望可以在高校任教,努力做好教学与科研工作,同时利用高校这个平台做好科普,发表人类生物学科普作品,举办科普展览,建设科普网站等,如若以后有经济实力,还希望筹建人类起源与进化、人类基因与文化博物馆等。人类学,尤其是人类生物学,只有被民众所了解并接受,才能真正发挥其作用,迎来真正的春天。

 

最后,想起体质人类学家韩康信先生获得人类学终身成就奖时的一句话:“朦胧中踏上了一条冷僻的荒凉小道,怀无大志,默默无闻与枯骸相伴一生;无惊世成就,只留得点点尘迹。足矣!” 回想自己这两年来的科研经历,我对老先生深深地理解与敬仰,数不清自己这两年里为收集样本坐过多次火车,到过多少地方,走过多少路,流过多少汗,又吃过多少苦:在川西,高原缺氧,一待就是20多天,且每两天要走过一个县,往往是中午赶在半路上,前不着村后不着店,啃面包喝矿泉水;为省住宿费,出差大多是买晚上的火车票出发,再买晚上的票返回;但苦中有乐,有这么一个通过自己努力去探索发现并回答有趣问题的机会就是一种幸福,也期望通过我们这一代人的努力,将人类生物学这条冷僻的荒凉小道开辟成康庄大道。

 

Posted in 未分类 | Leave a comment

Quaternary International:尼安德特人基因组与现代人起源

Neanderthal DNA and modern human origins
Chuan-Chao Wang, Sara E. Farina, Hui Li*
Ministry of Education Key Laboratory of Contemporary Anthropology, School of Life Sciences, Fudan University, 220 Han Dan Road, Shanghai 200433, China

Neanderthals are an extinct hominid lineage that coexisted with modern humans in Eurasia. The Neanderthal’s role in the evolutionary history of modern humans is a well concerned topic. Mitochondrial DNA sequences from Neanderthal fossils support the “Out of Africa” theory of human evolution, suggesting that modern human ancestors replaced Neanderthal populations in Eurasia. Recent analyses of Neanderthal genome draft sequences indicate minor gene flow between Neanderthals and modern humans in Eurasia but not in Africa. However, these conclusions are quite controversial due to data quality and insufficient sampling, especially about when and where the genetic admixture took place, and the direction of the assumed gene flow.

 

在2010年,Green等对克罗地亚一个洞穴中发现的3个尼安德特人的骨骼提取的基因组DNA进行测序,公布了尼人约60%基因组的序列图,并将尼人基因组于现代人基因组进行比较得出结论尼安德特人与非洲以外现代人的关系,比与非洲人的关系更密切,并认为现代人基因组中有1%-4%的序列来自尼安德特人的贡献,现代人在走出非洲后可能在中东曾和尼人有过小范围的基因交流。尼人和现代人之间存在基因交流的这一结果引起了广泛关注,沉寂多时的多地区起源学说的支持者甚至重燃了希望,但似乎只是一厢情愿。根据群体遗传学的理论,基因交流的有效单位也应该是群体。由于所得研究的尼人的个体数量有限,以及基因的流向是从现代人流向尼人亦或是尼人流向现代人还没有得以确认。因此对于尼人是否与现代人发生基因交流以及基因交流发生后尼人的基因是否在现代人身上得以保留,这些问题的解决还需要更多的尼人样本序列的测定以及更高覆盖率的基因组序列的获得。即便尼人与当地可能存在的现代人进行交流,这种基因交流也是非常有限的,并不能推翻分子人类学的现代人起源于非洲的证据,更加不支持多地区起源说中认为现代人源于各地区的古人类的说法。

Posted in 未分类 | Leave a comment

中华民族形成及其遗传基础

人类群体的起源和演变过程是世界上十大科学问题之一,为此受到了学术界和大众的广泛关注。在经历了人体测量学、古人类学的探索和争论之后,遗传学方法的介入使得这一问题越来越明朗。用遗传学和计算生物学方法研究人群的基因组信息,解决人类起源、多样化和生态适应等领域的问题,遂形成了分子人类学的新兴学科。分子人类学最常用的工具是Y染色体和线粒体。Y染色体是研究群体进化、构建父系谱系最可靠的遗传标记。Y 染色体有近60Mbp 长,除两端2Mbp 多的区段外均不和其它染色体发生重组,是人类基因组中最长的非重组片段,仅存在于男性基因组,严格遵循父子传递。由以上特点,Y 染色体非重组区上发生的单核苷酸多态性突变(single nucleotide polymorphism, SNP)能够单系稳定遗传,成为研究人类家族和族群历史的稳定标记,并可通过这些标记来重构全世界所有男性的谱系演化树[1-3]。1985年,Casanova等发现了Y染色体上的第一个多态性位点[4]。随后,随着变性高效液相色谱技术的兴起,大量Y染色体双等位基因的发现推动了Y染色体在人类进化研究中的运用[5,6]。在线粒体的“非洲夏娃说”[7]提出后不久,通过对Y染色体的研究,在父系遗传谱系上,全世界的人类拥有一个共同的晚近起源于非洲的祖先这一结论也得以证明[8]。近年来, 随着新一代高通量测序方法的应用, Y染色体上越来越多的遗传标记被发现, 尤其是最近一年多以来,复旦大学现代人类学教育部重点实验室在寻找Y 染色体新SNP 的工作中取得了决定性的进展(工作进行中,尚未发表)。我们对百余个中国样本的Y 染色体(包括主要支系)通过基因组DNA 打断、捕获、Solexa 测序,获得了取得了涵盖各单倍群的下游数千个新SNP 位点信息,其中绝大多数在最新公布的Y 染色体树中仍未被报道,如F449、F11、F377等,而这些新位点的大规模检测工作尚未在中国人群中进行。利用Y染色体新增遗传标记再现中国人群的起源、迁徙和混合的各项研究亟待开展。

Y染色体遵循着严格的父系遗传规律,而中华民族尤其是汉族姓氏的传递也大致遵循类似于人类Y染色体的这种遗传方式,因此姓氏与Y染色体有很好的平行对应关系,所以可以用Y染色体的遗传结构研究中国的姓氏宗族的发展历史,特别是中华民族起源早期的各个宗姓的演变。姓氏最早在中国产生,其历史可追溯到5000年前,据说早在伏羲氏时代,姓被定为世袭,由父亲向子女一代代的传递[9]。姓氏的基本作用是明血缘、别婚姻。姓氏最早用于遗传研究是在1875年,George Darwin通过分析堂(表)婚得出了英国同姓通婚率和不同阶层的堂(表)近亲通婚率[10]。George Darwin的工作不断被后人丰富和发展,Crow等通过同姓率来计算近亲结婚率[11]。由于居民出生、结婚和死亡等大量相关数据的易得性,姓氏分布与同姓率被广泛用于研究群体遗传结构、迁徙率、流行病学等[11-12]。多项研究证实各国的姓氏的传承是相对连续和稳定的[13-17],这又证明了姓氏和Y染色体关联实践分析的可行性。虽然姓氏在宏观上被用于分析群体遗传结构,但是姓氏并不完全遵从父系遗传。就中国的社会情况而言,收养、继养、入赘、甚至直接改姓,都会影响姓氏与父系血统的关联程度。另一方面,中国大多数姓氏起源于春秋时期的各个封国,当封国内的百姓都以国为姓的时候,这些同国百姓的血统可能本来就不一致。这就造成了很多比较大的姓氏内部遗传结构不一致。即便这样,当我们不拘泥于群体中同一姓氏的研究,而是针对有着明确的历史记载的宗族进行研究,姓氏无疑还是一个很好的遗传标记。

宗族是由大小不同的具有亲缘关系的同姓群体聚集居住而形成的。中华民族的历史也是其内部各个由同姓的人而组成的宗族的发展史。在一段有较可信历史记录的时期内,整个宗族的姓氏与父系遗传的关联是可以保证的,所以家族的姓氏往往与固定的Y染色体类型共同传递,紧密关联。将宗族研究与Y染色体的研究相结合,可以更好的解读中国五千年父系社会的演变过程。以往的Y染色体进化研究在国外开展得较多[18,19],但是国外的谱系资料一般历史都较短,并不能完全满足Y染色体进化研究的需求。中华民族的不间断的悠久历史和丰富的家谱文字记录正可以弥补这一不足。但是由于国外科学家对中国家谱材料的缺乏和相关历史的不了解,世界上对宗族关系的Y染色体研究大多只涉及中国以外,而我们对中华民族重要宗族的Y染色体研究可以填补这一领域上的空白。

Y染色体与姓氏、宗族谱系也可应用到少数民族群体分析中。例如,对于鲜卑、契丹等来源姓氏的Y染色体的多态性,填补相关民族史的重要缺环。鲜卑是中国古代史上继匈奴之后北方草原上的又一个强大的游牧部落联盟,鲜卑分为三大支部—东部、北部和西部,东部有段部、慕容部、宇文部等,慕容部在经历慕容氏诸燕(前燕、后燕、西燕、南燕)的流变后被东晋所灭,宇文部落中的迭刺部后来是契丹创始时期的“契丹八部”之一;北部是著名的拓跋部,以及与拓跋多次交战的柔然,柔然被突厥系民族击败后,其南支逃到辽河上游,成为契丹人的祖先之一,北支逃到雅布洛诺夫山脉以东、外兴安岭以南的地区,是室韦的祖先,而室韦是蒙古人的祖先之一;西鲜卑是由慕容吐谷浑率部从东北迁到青海东部,称为吐谷浑,吐谷浑在鼎盛时期占据现青海、甘肃、新疆南部、四川西部,后被吐蕃所灭[20,21]。现今,鲜卑早已经融入了汉族、蒙古族等北方诸民族之中,其中锡伯族自认为是鲜卑的后裔。鲜卑给后人留下了很多难解之谜, 包括其是否起源于东胡, 东、北、西三部鲜卑亲缘关系,与匈奴的基因交流、与契丹、吐谷浑、室韦的源流关系以及与现今北方各民族的关系等等。现今对于鲜卑等古代北方少数民族的研究仅局限稀少甚至有些含混的史料文献、考古材料[22,23],而源自鲜卑且流传至今的拓跋、宇文、慕容等姓氏宗族的Y染色体使人们能够重建古代东北亚人群之间以及古代与现代人群之间的遗传关系,成为了回答上述问题的关键,也为解析魏晋南北朝、五胡十六国时期的历史提供了新的思路和方法。

参考文献:

1. Underhill PA, Jin L, Lin A et al: An African origin of human Y chromosomes. American Journal of Human Genetics 1997; 61: 86.

2. Karafet TM, Mendez FL, Meilerman MB, Underhill PA, Zegura SL, Hammer MF: New binary polymorphisms reshape and increase resolution of the human Y chromosomal haplogroup tree. Genome Research 2008; 18:830-838.

3. The Y Chromosome Consortium: A nomenclature system for the tree of human Y-chromosomal binary haplogroups. Genome Research 2002; 12: 339-348.

4. Casanova, M., et al., A human Y-linked DNA polymorphism and its potential for estimating genetic and evolutionary distance. Science, 1985. 230(4732): 1403-6.

5. Underhill, P.A., et al., The phylogeography of Y chromosome binary haplotypes and the origins of modern human populations. Ann Hum Genet, 2001. 65(Pt 1): 43-62.

6. Underhill, P.A., et al., Y chromosome sequence variation and the history of human populations. Nat Genet, 2000. 26(3): 358-61.

7. Cann, R.L., M. Stoneking, and A.C. Wilson, Mitochondrial DNA and  human evolution. Nature, 1987. 325(6099): 31-6.

8. Gibbons, A., Y chromosome shows that Adam was African. Science, 1997. 278(5339): 804-5.

9. 袁义达, 中国姓氏——群体遗传和人口分布. 2002, 上海: 华东师范大学出版社.

10. Darwin, G.H., Marriages between first cousins in England and their effects. J Statist Soc, 1875. 38:153-184.

11. Crow, J.F., Mange, J.F., Measurement of inbreeding from the frequency of marriages between persons of the same surname. Eugenics Q, 1965. 12:199-203.

12. Dipierri, J.E., et al., Surnames in Argentina: A Population Study Through Isonymy. Am J Phys Anthropol, 2005. 128:199-209.

13. Piazza, A., et al., Migration rates of human populations from surname distributions. Nature, 1987. 329:714-716.

14. 袁义达,张诚,马秋云,杨焕明. 中国人姓氏群体遗传I.姓氏频率分布与人群遗传分化. 遗传学报, 2000. 27:471-476.

15. 袁义达,张诚,杨焕明. 中国人姓氏群体遗传Ⅱ.姓氏传递的稳定性与地域人群的亲缘关系. 遗传学报, 2000. 27:565-572.

16. 袁义达,金锋,张诚. 宋朝中国人的姓氏分布与群体结构分化.遗传学报, 1999. 26: 187-197.

17. 袁义达,张诚中国姓氏:群体遗传与人口分布. 2002, 上海:华东师范大学出版社.

18. Legay, J.M., Vernay, M., The distribution and geographical origin of some French surnames. Ann Hum Biol, 2000. 27:587-605.

19. Foster, E.A., et al., Jefferson fathered slave’s last child. Nature, 1998. 396(6706): 27-8.

20. Skorecki, K., et al., Y chromosomes of Jewish priests. Nature, 1997. 385(6611): 32.

21. 马长寿.乌桓与鲜卑. 1962, 上海: 上海人民出版社.

22. 李吉和.鲜卑族在西北地区的迁徙活动.黑龙江民族丛刊,2003.3:77-79.

23. 朱泓.人种学上的匈奴、鲜卑与契丹.北方文物,1994.2:7-13.

24. 张泰湘,范忠泽,王世杰.从最新考古学成就看鲜卑族的渊流与发展.黑龙江民族丛刊,2003.2:63-68.

 

Posted in 未分类 | Leave a comment

寻找语言“通天塔”

语言人类学研究的关键科学问题是人类的语言是否有一个共同的起源,其形态的演化是否有规律,最极端的进化形态会怎样。复旦大学现代人类学教育部重点实验室李辉课题组通过多年的研究,发现人类语言的语音多样性分布是有一定规律可循的,欧亚大陆的语言语音比较复杂,而非洲的略简单,美洲与澳洲更简单,语音最复杂的前几种语言都出现在中国,全世界的语音分布可能指向语言的最近扩散中心在里海南岸。这一成果2012年2月10日发表于《科学》上。

在西方的传说中,人类最早都是用同一种语言,为了到天上去,大家齐心协力要建造一座“通天塔”。这冒犯了“上帝”,于是他让人们的语言变得不同,不能相互沟通,人们就四散而去了。所以,语言人类学中把寻找语言扩散的中心比喻成寻找“通天塔”。在过去的研究中,因为人类起源于非洲,语言学家普遍认为语言也起源于非洲。李辉课题组收集了全世界95个语系的579种语言资料,详细分析了语音多样性的分布规律,发现非洲的语言并不是语音最复杂的,欧亚大陆的语音要比非洲的语音复杂的多。所以,如果全世界的语言有一个扩散中心——“通天塔”的话,不应该在非洲,而是最可能在亚洲,精确地说是在里海南岸。这与传说中“通天塔”的位置不谋而合,也是黑格尔在1863年《自然创造史》中描绘的现代人类种群扩散的起点。
实际上,语音多样性的分布反应的并不是现代人最初的起源过程,而更可能的是发源于亚洲中南部的人类第二次大扩张。从遗传学上分析,这次大扩张可能发生于2-4万年前,辐射到了所有的大陆,并且回流到了非洲,形成了现代种族的主体格局。
随着人类迁徙到不同的地方,我们的语言也会变得越来越不同。体现在语法、语音和词汇三个方面,其中语音最有规律。语音包括元音、辅音和声调三方面。世界各地的语言在这三方面的复杂性上差异很大。辅音,也就相当于汉语中的bpmf等声母,在所有语言中最少的只有7个,而最多的高加索山区的优必语甚至达到过180个,不过优必语在1992年已经灭亡了。声调并非所有语言都有的,主要出现在东亚、西非和北美。汉语普通话只有4个声调,而声调最多的是广西和贵州的南部侗族语,可以达到15个声调,说话好似唱歌,而侗族大歌确实是世界闻名的奇妙音乐。元音,就相当于普通话中的aoeiuü等韵母,其多样性差异比较适中,一般从2个到十几个。但是上海奉贤区金汇镇的“偒傣话”却发展出了20个元音,是世界上元音音位最多的语言。综合而言,语音最复杂的前三位语言分别是偒傣话、南侗语、布央语,都分布在中国南方,这些语言都有着很重要的学术价值,对于它们的保护需要引起各界重视。
为什么有的语言语音会越来越简化,而有的语言则会趋向于语音复杂化,甚至达到了极端值,语音进化的规则将是课题组今后的研究重点。

Chuan-Chao Wang, Qi-Liang Ding, Huan Tao, Hui Li (2012) Comment on Phonemic diversity supports a serial founder effect model of language expansion from Africa. Science. 335: 657c.

Posted in 未分类 | Leave a comment

你的城,我的城

有一天

我们会告别城市的喧嚣

沙棘的嫣红掩映着泥土的芬芳

牧马,放羊

孩子们放学归家的时候

我们牵着牦牛儿,挽住余晖

 

有一天

我们会在山间有自己的小屋

鹊儿的吱喳带来阳光的气息

读书,种菜

家家户户炊烟升起的时候

我们偎依在篱笆上,哼着歌儿

 

没有电,没有网

山泉的叮咚是最美的音乐

那个世界的理论颤抖地蜷缩在角落

心灵的自由才是这个世界永恒的规则

这是你的城,我的城

王传超 10月13日于聂呷

Posted in 未分类 | Leave a comment