欢迎访问史氏春秋网!

史氏春秋网 研究史氏历史和史家族谱的专业网站

当前位置: 主页 > 新闻 > 特稿 >

基因家谱的研究动态

时间:2018-11-21 16:08来源:网络 作者:文少卿 点击:
谱牒又称家谱、 家乘、 宗谱、 族谱和世谱,是家族的历史书。谱牒、 方志和正史是我国史学研究的三大基石,故有“家乘犹国史” 的美誉。谱牒反映了中国宗法血缘文化,在我国有着悠久的历史。 遗传学究其本质是一门历史科学。遗传突变世代相传,并因为随机性
 
谱牒又称家谱、 家乘、 宗谱、 族谱和世谱,是家族的历史书。谱牒、 方志和正史是我国史学研究的三大基石,故有“家乘犹国史” 的美誉。谱牒反映了中国宗法血缘文化,在我国有着悠久的历史。  遗传学究其本质是一门历史科学。遗传突变世代相传,并因为随机性或者选择作用在群体和物种间/内积累下来。人体内有23对染色体,其中22对常染色体中,每一对染色体都有一条来自于父亲,一条来自于母亲,两条染色体在传代过程中会发生部分重组。另一对性染色体,包括X染色体和Y染色体。在女性体内,X染色体成对出现,也会发生重组现象。但是在男性体内,X染色体来自母亲,Y染色体只能来自父亲。因此,Y染色体具有父子相传的特点,严格遵从父系遗传的方式,传递过程中不受社会文化和自然因素的影响。 
 
 
 
基因家谱研究是遗传学在传统谱牒学上的应用,它试图通过DNA检测,特别是 Y染色体标记体系,弄清家族内部个体间的遗传关系。基因家谱研究极大地弥补了传统谱牒学的不足。在我国,家族、宗族都是指父系制度的同姓亲族,是以婚姻和血缘关系结合成的社会单位,因此,相比其他遗传标记体系,Y染色体是研究基因家谱的绝佳材料。Y染色体上有着充足的拓扑学关系明晰的遗传标记,可以满足父系遗传谱系的构建; 另外,Y染色体上有着稳定的“分子钟”,可以估算不同Y染色体间的分化时间。因此,当遗失的或者不忠实记载的谱牒无法作为追寻祖先的可靠依据时,以现代分子生物为基础的基因家谱研究是直接追溯宗族成员之间亲缘关系的最佳方法,是验证祖先与后代的父系关联,补全和重构家族谱牒的唯一手段。 
 
世界范围内基因家谱的研究动态  
 
对于人类根源的探索缘于人类本能的好奇心。20世纪末期,来自数个国家的数百万人开始热衷于寻找自己的祖先来源。这一狂热的爱好催生了应用科学一个新的分支———基因家谱学,在该学科中,DNA分子起到了承载家族历史的作用。  首个基因家谱研究实际上是一次法医学调查。这些90年代早期的案例中,最有名的是罗曼诺夫沙皇家族和纳粹罪犯约瑟夫·门格勒的遗骸鉴定。通过各种亲缘关系的比较,前者确定出土于叶卡捷琳堡的一座墓葬中的9块遗骨来自俄罗斯末代沙皇———尼古拉二世及其家族成员; 后者证明1985年出土于巴西的遗骸属于约瑟夫·门格勒本人。  末代沙皇-尼古拉二世   基因家谱学真正的萌芽是在20世纪90年代末,主要标志为一系列高质量文献的 发表。从文献发表的先后顺序和学术意义来看,排在首位的是1997年Scorecki 等关于犹太祭祀Y染色体的研究。《圣经》中记载犹太人中的祭司是由犹太教的第一祭司长Aaron开始按血缘代代相传,作者们发现德系和西班牙系犹太祭司们与非祭司的犹太人相比,有较近的亲缘关系,也就是说,祭司们可跨越3300年追溯到一个共同的父系祖先。Y染色体的分析与《圣经》故事的完美契合着实让人吃惊。这项研究开创了通过 Y 染色体标记进行基因家谱研究的先河。  
 
1998 年,两篇文章的问世为基因家谱学的建立添砖加瓦。这两篇文章都与历史名人有关,因此引发了极大的关注。第一项研究与美国第三任总统托马斯·杰斐逊和他的黑人女仆莎丽·海明斯有无私生子的鉴定有关。Foster比较了杰斐逊的叔叔、 莎丽的大儿子和最小的儿子的男性后代Y染色体,认为杰斐逊是莎丽的最小儿子的生父。这项研究理清了莎丽·海明斯后代错综复杂的亲缘关系,为随后通过Y染色体标记重塑父系谱系关系提供了范例。  托马斯·杰斐逊与莎丽·海明斯   同年,Decorte发表了一项疑似法国国王路易十六和玛丽·安托瓦内特的儿子的线粒体DNA鉴定。作者们对Karl Wilhelm Naundorf( 声称是这对皇室夫妇的后代) 、玛丽·安托瓦内特和她的两个姐妹,以及现存的母系亲属的线粒体DNA进行了分型。结果表明,虽然Naundorf被冠以路易十七的名号,但他的线粒体DNA遗传类型与其他母系亲属测试者的完全不同,因此他是个伪冒者。这项研究是最早通过线粒体 DNA 进行基因家谱学研究的工作,为通过母系遗传研究基因家谱学提供了参考。  Karl Wilhelm Naundorf   近 20 年,受公众对名人家族历史的浓厚兴趣的驱动,基因家谱学中探索历史名人的父系类型一直是最为活跃的研究方向,例如前面提到的美国总统托马斯·杰斐逊,法国皇帝拿破仑和波旁家族,俄罗斯的罗曼诺夫家族,以及中国的爱新觉罗家族、成吉思汗和曹操。  其中,成吉思汗和爱新觉罗·觉昌安的父系类型最早是通过特殊的 Y 染色体单倍型,即所谓的星簇( Star Cluster) 和满族簇(Manchu cluster) 推测而来的,它们分别高频出现于蒙古语和满通古斯语人群。这种通过分析Y染色体单倍型数据寻找晚近人群扩张信号的方法还运用在其他课题中。例如,2015年Balaresque分析了欧亚大陆上127个人群的5321个Y染色体数据,发现了11个星簇状的扩张信号,其扩张年代为公元前2100年至公元1100年。排除所用位点过少、可能存在的遗传类型错判等问题,这项研究还是有些有趣的结论,比如揭示了晚近扩张人群与生活方式的关系———阿尔泰语游牧人群Y染色体的大范围传播可能与马的使用有关。  基因家谱研究受DNA检测技术发展的推动。现如今,基于现代DNA和古代DNA高通量测序的手段也进入到基因家谱学之中。最好的例子是2014年Olalde I等测试了一个疑似含法国国王路易十六血液的手帕上的全基因组,他们发现,根据所获得的数据来推断的祖先和表型与历史记载不符,否定了葫芦内所含血样属于路易十六,该研究为破解历史悬案提供了有力的证据。  
 
国内基因家谱的研究动态  
 
国内基因家谱的研究要从曹操家族说起。这项研究通过对曹操后代家系的遗传学梳理,确定了曹操的遗传类型和身世,证实曹操的父亲是家族内过继,而不是异姓( 夏侯家) 收养,这解决了历史学遗留了2000年的问题 。  
 
曹操的祖父是东汉时期的大宦官曹腾,曹操的生父曹嵩是其养子,因此,曹操的身世是一大史学谜题。曹操在作《家传》时自称为周朝曹叔振铎之后,后来再度改为出自帝舜。据《曹瞒传》记载,曹操之父曹嵩出自夏侯氏。宋代以后,曹操出自夏侯氏的说法流传甚广。而后世制作的家谱几乎都追溯到西汉开国功臣曹参。传统谱牒学方法仅从文献资料无法确定曹操的真实身世,使用最新的科学技术成为解决这个问题的新思路。  
复旦大学现代人类学教育部重点实验室从2009年开始对曹操的遗传类型归属展开了系统的调查,分别从曹操可能存在的后人家系和曹氏宗族墓群中曹操的叔祖父——曹鼎遗骸两方面入手,论证曹操的父系Y染色体类型极有可能为O2* -M268。根据曹操后人家系的测试结果,反推单倍群O2*-M268为曹操所属类型的可能性是92.71% ; 根据古代样本Y染色体12个STR位点的测试结果,利用基于贝叶斯等位基因频率法的数据库,推测曹鼎属于O2*-M268+,PK4-,M176- 的概率为60.18%,属于单倍群C3*-M217的概率为13.97%,属于其他单倍群的概率均低于11%。2016年,课题组又对该样本进行了Y染色体单核苷酸多态位点( SNP) 分型测试,明确其遗传类型属于O2-M268+,F1462+,PK4-,弥补了之前通过现代人家系推测曹操遗传类型和Y-STR推测Y-SNP的缺陷。至此,曹操及其后人的遗传类型为F1462+,PK4-的结论得以盖棺定论。  
 
曹操   
 
如前文所述,一些研究者根据蒙古语和满通古斯语人群中特有的高频单倍型(星簇和满族簇) ,以及对应的共祖时间,推测其父系祖先分别为成吉思汗和爱新觉罗·觉昌安。但是,由于缺乏明确的家系样本和古代遗骸的支持,这两个推测结果的真实性一直饱受争议。2015年,我们采集了7个爱新觉罗氏的家系(3个家系有完整谱牒)的男性样本,进行了Y染色体短串联重复片段( STR)分型,结果显示,其中3家(2家有完整家谱,其最近共祖为清太祖努尔哈赤) 的父系遗传类型非常接近,且极为罕见,对这3个样本的Y-SNP测试结果表明,此类型属于C3b2b1*-M401单倍群,即爱新觉罗家族的父系遗传类型。2016年,我们又对爱新觉罗家族的男性个体进行了Y染色体测序,发现这些个体属于更为精细的遗传类型C3b1a3a2-F8951,与星簇为兄弟支系,与之前推测的C3b2a-M48满族簇毫无关系。因此,之前推断的成吉思汗与星簇之间的关系可能也不牢靠。  
 
努尔哈赤   
 
2017年,韦兰海等探讨了星簇的起源,以及它与成吉思汗和各个蒙古语人群的关系。通过对34个属于星簇的Y染色体全序及与其较近支系的Y序列的研究,我们发现这些星簇样本属于单倍群C3b1a3a1-F3796,其分布于中国东北到北高加索的广大区域。这些人群的源头被追溯到古代尼伦蒙古部落或者普通的蒙古部落,比如乌兹别克人和诺盖人中的曼格特部(Manghit tribe)、乌兹别克人中的柯讷格斯部(Keneges tribe)、阿富汗的哈扎拉人、中国的达斡尔人,以及哈萨克人群中的拉特部(Dulat tribe)、乌孙部(Uysun tribe)和克烈部(Kerey tribe)。而他们的晚近共祖时间为2576年前,与整个蒙古语人群扩张的时间一致,这显然与成吉思汗或其他男性亲属无关。Zerjal等认为哈扎拉人是成吉思汗的直系子孙,他们认为这是支持成吉思汗与星簇之间关系的有力证据。  但事实上,哈扎拉人来源于成吉思汗派遣的蒙古大军。而这两万战士来自于不同的蒙古部落,并没有直接证据表明哈扎拉人都是成吉思汗的后代。事实上,寻找成吉思汗的父系类型困难重重。一方面,由于蒙古人保持祖先神秘感的葬俗,导致蒙古贵族(特别是皇室)的墓地极少被发现。尽管如此,基于有限墓葬的古DNA研究给出了极为矛盾的结论。根据蒙古国东部塔班陶勒盖的疑似黄金家族墓地遗骸的DNA鉴定结果,Lkhagvasuren等认为成吉思汗和他的家族属于遗传类型R1b-M343,然而另一项来自中国河北的高等级贵族墓的遗传调查表明,成吉思汗的遗传类型为单倍群Q也不能完全排除。另一方面,疑似成吉思汗后代的现代人的 DNA 分型结果表明,不同家族分支的父系类型也不一致。比如说,3个现存的成吉思汗家族分支属于遗传类型C3下的3个早期分化的不同亚型,此外,成吉思汗亲兄弟Khasar的后人属于遗传类型O3,成吉思汗父亲的同父异母兄弟Belgutei的后人属于遗传类型R1a1a。  
 
成吉思汗   
 
近年来,本课题组对西北地区永登县的鲁土司家族进行了父系遗传调查,根据鲁氏家谱的记载,他们的祖先为脱欢( 成吉思汗的第六子阔列坚的后代) 。在元末明初,脱欢和他的部众归降于明廷。后因作战勇猛,自第三代起赐汉姓鲁。从此,鲁土司家族驻守西北永登县长达19代,历时561年。Y染色体分型结果表明, 鲁土司家族的遗传类型为C3b1a1a1a-F1756(又称C3b3a2a-448del),常见于蒙古语和突厥语人群。进一步的遗传网络分析发现,鲁土司家族后人与哈萨克斯坦DNA计划(The Kazakhstan DNA Project)中的Tore支系共享单倍型。Tore 支系为成吉思汗大儿子术赤的后代。至此,成吉思汗的遗传类型又有了一个新的可能———C3b1a1a1a-F1756。  
 
司马光家族延续了上千年,家谱记载较为完整,为突变速率的估计提供了较好的材料。杜盼新等对11个声称为司马光后代的家族进行了Y-STR分型,结果表明,有5个家族的STR单倍型彼此之间十分接近,同属下游单倍群O1a1a1a1a1a-F492,F656-。  
 
司马光   
 
关于东亚的父系人口历史,2014 年,严实等应用二代测序技术发现了Y染色体上约4000个新的遗传标记,并定义了大量新的分支,发现东亚3个父系星状扩张发生在约5000~6000年前的新石器时代,现代约40%的中国人来自当时这3个子嗣繁多的祖先。我们最近的研究进一步观察到这次新石器时代的强烈的瓶颈效应和人口扩张。东亚特有的父系谱系中,有5个呈星状结构———O3a2c1a-F5(Oα) 、 O3a2c1-F46 (Oβ) 、O3a1c1-F11(Oγ)、C3a1-F2613(Cα)和Q1a1-M120(Qα) ,以及一个呈复杂分叉结构———O1a1a1-F78( Oσ) 。值得注意的是,我们发现65%的现代中国人都是这6个超级祖父的后代,他们的扩张时间分别为5400年前(Oα)、6500年前(Oβ)、6800年前(Oγ)、6400年前(Cα)、5200年前(Qα)和5000年前(Oσ)。正如前文所述,我们揭示了汉族主体来自于新石器时代的少数几个父系祖先,但他们是谁? 每个超级祖父与古史传说中的传奇领袖是否有关? 不久的将来,联合古DNA和现代人DNA的研究将有助于解决这些问题,它对于理解中国人群的起源非常关键。  考古发掘往往面临一个问题,汉之前的遗址极少有墓砖、 墓志等表明身份信息的出土物,再加上墓地被盗严重( 墓志等有经济价值),绝大部分遗骨缺少身份信息,但是对于墓地发掘来说,确定墓主人的身份是考古学的一个核心问题。  山东省临沂市洗砚池晋墓位于洗砚池街北侧、 王羲之故居公园东北部。此处共发现两座墓葬,其中,M1为双室墓葬,保存完整,同一墓葬埋葬 3个未成年人,为考古发掘中极为罕见的现象; M2为夫妻合葬墓,墓室结构完整,在一号墓之西,与一号墓相距不远。该遗址一经发现,便引起了社会和学术界的广泛关注,被评为2003年度十大考古发现之一。但是,对于墓主人的身份一直存在两种猜测: 一种认为是琅琊王氏的后代,另一种认为是西晋司马氏的后代。2016 年,杜盼新等人对该遗址进行了基因家谱调查: (1)排除了M1西室6岁女童与M2夫妇间的亲缘关系; (2)鉴定了M2墓葬中男性遗骨的父系遗传类型为C3南支-F948+,F3880+,该遗传类型在北方汉族中最为常见。该研究为后续琅琊王氏和司马家族的父系遗传类型研究奠定了基础。  洗砚池晋墓   还有一个案例是复旦大学和吉林大学古DNA课题组的一次合作。两个课题组对内蒙古阿鲁科尔沁旗辽代耶律羽之墓地的两个男性人骨进行了古DNA鉴定。一个遗骸为M6:3(耶律道清,耶律羽之的三代子孙),一个为M10(无墓志)。实验结果表明,两个个体的遗传类型分属N南支和N北支,这两个支系的分化时间已有上万年。通过父系亲缘关系鉴定,排除了M10是耶律羽之家族男性后代的可能,其具体身份有待进一步比较验证。  
 
耶律羽之墓   
 
基于上述两个案例,我们可以看到,对于大量已经发掘的身份未定的墓地,DNA鉴定并将其结果纳入一个可以相互比对的古DNA数据库的重要性。依据这个数据库,我们可以基于亲缘关系,推测未知遗骸的可能身份。另外,进一步结合碳十四测年技术和文献材料,多重证据锁定未知墓主的身份,真正发挥科技考古的威力。  
 
甘肃白银市连环杀人案的破获是法医学运用基因家谱学原理的一个成功案例 。白银连环杀人案是中华人民共和国成立以来发生的重大恶性案件之一。从1988年到2002年,11位女性(包括一名8岁的女童)遭到强奸和杀害。嫌疑犯逍遥法外长达30年,警方做出了各种努力,如指纹比对、DNA比对、按口述画像、重金悬赏等,但均无功而返。但是前期的积累是有意义的,尤其是Y染色体数据库的建立,成为后续破案的关键。当嫌疑人的远方堂叔犯案,警方发现其Y染色体单倍型与当年疑犯的DNA 类型一致时,整个高氏家族男性都被纳入了排查范围,最终,白银市连环杀人案得以快速破获。该案件的破获是Y染色体基因家谱学的成功运用,这意味着法医数据库不仅只能做同一认定,每个男性数据背后代表着一个大的同姓家族。Y染色体DNA分型和基因家谱学原理正在成为法医遗传学的常规手段。
  近年来,本课题组开发了一个专门用于群体遗传学和法医学应用的Y染色体数据库,通过该数据库,我们推测了入缅远征军、淮海战役士兵,以及一些刑事案件中的疑犯和失踪人口的可能地理来源和父系亲属。  
 
操姓主要有鄱阳郡操姓和重庆长寿操姓两大分支。据传,鄱阳郡操姓源自逃难的曹操后人。2012年,王传超等的Y染色体调查显示,鄱阳郡操姓与曹操家族,乃至其他曹姓均无关系。2014年,王传超等又依据谱牒材料,对赛典赤及郑和的后裔——云南的纳姓和马姓进行父系Y染色体分型,发现他们属于南亚西部常见的单倍群L1a-M76,揭示了赛典赤与郑和的波斯祖源。  
 
父系单倍群L分布图   
 
展望  
 
姓氏最早出现于中国,其历史可追溯到5000年前。在其他国家中,西欧人姓氏最早的记录不足千年(爱尔兰人约900年),日本人的姓氏也才150余年。我国现有姓氏4100个,但大多数姓氏的起源并不单一。周朝的姓氏大多是以封国为氏,后改为姓,封国内的百姓来源本来就是多种多样的。所以中国的姓氏总体上内部父系血缘并不完全一致。根据我们对超过10000例带有姓氏信息的Y-SNP/STR数据的分析,在同一个姓氏中,几乎可以观察到中国人中常见的所有父系类型,同时,在同一个父系类型中,也几乎可以看到中国人群中所有常见的姓氏。这意味着姓氏和Y染色体不是简单地一一对应关系,基于较小样本量的推测,Y染色体类型与姓氏之间的关联没有意义。  
 
但是,修著家谱一直是中国人的传统,一些家谱甚至跨越3000年。这些谱牒材料和深度家系都是我国的人文资源。研究族群/姓氏内部和深度家系的遗传动态,可能是厘清族群/姓氏来源和演化的一个事半功倍的方案。
  
作者简介  本文原刊载于北方民族大学学报2018年第1期(总第139期),原标题为《基因家谱学在中国的发展历程》。经文少卿博士授权转载,转载时有删减。  
 
文少卿 复旦大学现代人类学教育部重点实验室博士后、法国国立东方语言文化学院(INALCO)人类语言学博士。
 
(责任编辑:春秋)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
验证码: 点击我更换图片
栏目列表
推荐内容