一本贴近大众的学术专著——《中国姓氏:群体遗传和人口分布》
最近荣获第十四届中国图书奖。该书是中国第一部有关姓氏与群体遗传学的专著,填补了我国这一研究领域的空白,2002年2月出版以来已销售了5000余册。《中国姓氏:群体遗传和人口分布》由中国科学院遗传与发育生物学研究所副研究员袁义达、张诚所著,华东师范大学出版社出版。作者运用数理统计及国际通用的遗传研究方法,首次对中国人以姓氏为群体加以分析,并在大量查阅古籍的基础上,将中国人姓氏形成和演变的历史研究最新结果展现在读者面前。书中对中国100个大姓各占全国人口的比例、历代杰出人物、起源演变、分布迁移、分布频率、血型分布特征作了系统细致的文字介绍,首次公布了分析人类遗传基因ABO血型在中国汉族中的分布情况。全书以七色图谱清晰地标示出每个姓氏在全国的分布密度、分布频率等情况,直观、全面,将有着广大社会基础和悠久历史的姓氏文化赋以崭新的科学内容。
读袁义达的《中国姓氏:群体遗传和人口分布》
2001年8月24日,《法制日报》刊登了我采写的通讯《袁义达:破解“姓氏基因”之谜》。随着全国各大媒体的先后相继报道,一项新兴的科学研究——姓氏群体遗传学逐渐在神州大地广为传播,人们知道了中国科学院遗传研究所有一位叫作袁义达的副研究员在16年前开始潜心研究中国姓氏和群体遗传学的联系,且硕果累累。这项研究在科学界是独一无二的。
采访使我与袁义达相识,并成了朋友。有了这位研究姓氏的专业人士朋友,又加上采访中对姓氏的了解,使我在工作之余对姓氏产生了兴趣。从他那里我了解到了我国姓氏的起源、研究历史、现状、前景以及与国情民意、群体遗传学的重要联系等一些基本知识。交往中,我一直尊称他为“老师”。一因在他所从事的研究事业面前,我只有做学生的份;二因对他十年磨一剑——历时16年(应该说更长,因为他说过姓氏研究是他的终身事业)默默研究中国姓氏且成绩不菲的精神和贡献由衷地尊敬。得知他16年的研究结晶《中国姓氏:群体遗传和人口分布》一书即将出版,急于先睹为快的我频频电话追问,为的是得到老师的赠书,进一步了解姓氏这门古老而又年轻的属于大众的传统文化。同时,也有自己的小算盘:看看自己姓氏的起源、演变、分布的情况。
这一天终于到来了,我手上有了袁义达老师赠送的这本沉甸甸的刚刚由华东师范大学出版社出版的《中国姓氏:群体遗传和人口分布》。翻开书,我便迫不及待地“钻”了进去。
在令国人为之自豪的五千年历史长河中,漂延了许多古老的文明,起源于远古时代同样有着五千年历史的姓氏便是其中之一。姓氏与每个人都息息相关,但一直以来许多人只是把姓氏当作沿袭后代的一种标志、一个符号,或是寻宗觅祖的一个依据。很少有人知道姓氏以其特殊的血缘文化记录了中华民族从形成、演变到今天的近13亿大家庭的五千年社会进化史和人类遗传的奥秘。袁义达用16年的时间对中国姓氏的研究,证明了姓氏是一种文化、一门科学。近些年来,我国的各项科学研究不断取得成功,但姓氏研究却被人们所忽视。1985年,世界著名的美国斯坦福大学群体遗传学家卡瓦利·斯福扎教授把“姓氏基因”的理论带到中国时,有着五千年文明史和姓氏历史的中国人还未意识到姓氏与基因有多大的关系。但从此以后,在中国的遗传学研究领域中增加了一门新的学科——姓氏群体遗传学。也正是从这时起,袁义达踏上了他的姓氏群体遗传学的研究之路。
《中国姓氏:群体遗传和人口分布》是中国第一部有关姓氏与生物学的专著。介绍了姓氏的起源和群体遗传学的相关内容以及中国100个大姓的历史、分布和图谱,是作者对研究事业的一个阶段性总结,也是悠久的姓氏文化对大众传播、普及的一个重要窗口。该书以通俗易懂的大众语言,展现给读者专业研究的学术知识,并首次分析了人类遗传基因ABO血型在中国汉族的分布情况。书中将每个姓氏在全国的分布密度、分布频率分别标制成图谱,以七种不同的颜色清晰地标示出每个姓氏在地图上的分布情况,让人一目了然。书中还对每个姓氏占全国人口的比例、历代杰出人物、起源演变、分布迁移、分布频率、血型分布特征作了系统细致的文字介绍,使该书图文并茂、条理分明,成为贴近大众的科普书籍。
闲暇之余,随手翻翻,轻松阅读,也许你就会被书中的内容所吸引。因为在放松心情的同时,还可以感受到传统的、民族的姓氏文化的熏陶和因轻易掌握了一门新兴的科普知识而愉悦。这让我想起作者曾说过对待自己事业的一句话:进行姓氏研究,传播姓氏文化,让人们共享这笔宝贵的民族财富。是呵,正是作者抱着这种姓氏研究离不开大众、服务于大众的态度,才有了如今这本紧密联系大众的《中国姓氏:群体遗传和人口分布》的问世。
春天是播种的季节,也是充满希望的季节,《中国姓氏:群体遗传和人口分布》在春天与读者见面,这也许预示着本应广为人知但却鲜为人知的姓氏文化将带着希望,在“百姓”中广为播洒汉族南北血缘其实不同
早在1929年,我国学者就发现了汉族ABO血型南北人群的差异。近日,中国科学院遗传与发育生物学研究所副研究员袁义达的《中国姓氏:群体遗传和人口分布》一书更是指出,汉族南北之间存在着遗传结构上的差异。以我国南方的武夷山和南岭为界,南北两地的汉族血缘相差甚远,南北两地的汉族血缘比南北两地的汉族与当地少数民族的差距还要大。从生物遗传学的角度讲,我国的汉族只是文化上而非血缘上的完整群体。
中国人最早的ABO血型的正式数据出现在1918年,到目前为止,中科院遗传所的研究人员一共收集了655份有关中国人的ABO血型的国内外文献,共计1818180人。除去少数民族的数据,有关汉族的文献325份,统计学上有效文献305份,计909900人的血型数据。研究人员用这305份的中国汉族ABO血型数据得到了汉族的地域亲缘图。
中国人最早的ABO血型的正式数据出现在1918年,到目前为止,中科院遗传所的研究人员一共收集了655份有关中国人的ABO血型的国内外文献,共计1818180人。除去少数民族的数据,有关汉族的文献325份,统计学上有效文献305份,计909900人的血型数据。研究人员用这305份的中国汉族ABO血型数据得到了汉族的地域亲缘图。
该图表明,南方人群(包括福建、台湾、广东、澳门、香港、广西和海南七省区)同北方人群(除去南方七省区)生物遗传距离比人们想象的要远得多。
由于“姓氏基因”存在,通过对同姓人群迁徙的研究,就可以掌握群体的遗传情况。
汉族南北两地的血缘的差异是如何形成的?袁义达说,要解决这个问题,只有从我们先祖长期的迁移、混居和融合中寻找答案。由于ABO血型是1900年才被奥地利人发现,现在所说的遗传基因更是近几十年的事。那么,要研究1900年之前的汉族群体遗传的情况,一个便捷的渠道就是研究“姓氏基因”。
袁义达说,他们收集了几十年来上百万份血型数据,经过计算机聚类统计分析后发现,不同人群的血样中的血型、酶、蛋白质的区域分布和人们姓氏的区域分布高度一致。这种高度一致当然不是一种偶然性的巧合,它恰恰反映了中国人的姓氏分布与遗传血型的分布存在必然的内在关系。中国人一般都是子女承父姓,这种姓氏的传递方式与代表人类男性的Y染色体的遗传方式相同,而且从研究来看,中国人姓氏的传递是连续和稳定的。这就是说,各个历史时期的同姓人群的分布不但记录了当时社会进化的痕迹,也反映了人类遗传物质在人群中的分化过程。在汉族的社会中,宗族观念根深蒂固,直到1949年前,同姓同宗仍是一种很强的联系纽带。在中国的历史长河中,汉族人习惯于同姓聚集,几姓联宗,这种生活方式的结果就是形成了大大小小的同姓人群。中国同姓人群的历史、数目和规模是中国人特有的社会现象,ABO血型的分布正是受到了同姓人群分布的选择。
汉族南北两地的血缘的差异在宋代已经形成,其分布规律与现代的分布规律基本一致。
袁义达说,他们对不同时期的各省姓氏分布的数据进行生物遗传距离的分析,获得了宋朝、明朝和当代的汉族人群的三张聚类图,从“宋朝姓氏分布的地域亲缘关系聚类图”可以看出,汉族从宋朝开始已经形成了南北二大区域:南部的广东和福建与北部的其余14个省。“明朝姓氏分布的地域亲缘关系聚类图”也非常清楚地把明朝中国人分为南北两大人群,形成福建、广东和广西三省为南方人群,其他14省为北方人群的局面。而且明朝的人群地理分布特征已与当代的分布基本一致,其南北两大异源汉族的地域分界线也应在武夷山和南岭一带,而不是在长江。与宋朝的地域人群分布相比较,广西已与湖南分离而与广东、福建聚类。
“当代姓氏分布的地域亲缘关系聚类图”反映了当代中国汉族的南北两大人群的异源性,以及明显的分界地域在南部的武夷山和南岭一带。29个省区市分为南北两大块,而且其遗传距离很大。南方汉族包括福建、台湾、广东、广西、海南省、香港和澳门。
总之,宋、明、今三个时期的姓氏遗传距离分析结果表明,在中国1000年前的宋朝已经形成了南北两大区域的人群,从姓氏遗传信息上明显地显示出南北两大区域人群结构的区别,表明南北两大区域人群的不同源性,其明显的地域分界线在南方的武夷山和南岭。
中国人姓氏的历史至少已有4000年以上,主要起源于中国西北和中原地区的民族,融合并同化了各个时期周边各民族的姓氏,形成了中国几千年来一直在使用的汉字姓氏。
根据1000年来的中国人姓氏分布和对人群迁移、混居和融合情况的分析,基本上反映了当时的民族联合和进化的历史,也说明了中原地区的人群是组成中华民族的主体,它融合了南北各个时期的民族成分,尤其是北方地区的民族成分,形成了互相依存不可分割的当代的中华民族的整体。当代人群分布的情况基本上与明朝、宋朝人群分布具有很高相似性和渐渐变化的过程,它们之间的区别点正是反映了这1000年期间人群进一步迁移与分化的结果。
汉族南北两个不同的群体形成,是由社会历史的发展、地理上的隔离以及语言的不通等原因造成的。
汉族南北两个区域人群在历史上是怎么形成的呢?袁义达认为,华夏民族在长期的迁移和进化过程中,北方地区主要交往和融合的是北方地区的少数民族,如匈奴、鲜卑、突厥、羌、蒙古等属北蒙古人种的民族。而两广闽台地区主要交往和融合的是南方地区的少数民族,如南越、交趾等属南蒙古人种的民族。
北方地区地形平坦,人群迁移容易,所以,北方人群间的同化和语言统一要比南方地区快。南方地区,特别武夷山和南岭以南,由于丘陵起伏,地形复杂,人群迁移困难,人群间的同化时间长,互相交往困难。长期以来造成地理上的隔离状态,语言变化很大,形成无数的“族群岛”。
袁义达指出,几千年的汉族进化历史也证明南北地区的汉族存在差异,而且是一种群体遗传基因进化上的差异。因为文化上的差异,包括语言上的差异,通过政府的政策和法令,在不长的时间内可以改变或缩小这类差别,这类差别不是根本性的。几千年的不同程度的隔离和遗传基因进化中所造成的不同地区汉族亚群体之间的差异才是本质上的区别。
袁义达,中国科学院遗传与发育生物学研究所副研究员。1985年-1986年,1988年和1992年年在美国斯坦福大学医学院工作,创建了中国姓氏群体遗传学。在国内外共发表了30多篇论文和两部专著。研究方向:1. 中国姓氏群体遗传学的研究。2. 中国人遗传基因多样性和姓氏分布相比较的研究。3. 姓氏群体遗传与疾病在地理分布上相关性的研究。(人民网 张星海)
由于“姓氏基因”存在,通过对同姓人群迁徙的研究,就可以掌握群体的遗传情况。
汉族南北两地的血缘的差异是如何形成的?袁义达说,要解决这个问题,只有从我们先祖长期的迁移、混居和融合中寻找答案。由于ABO血型是1900年才被奥地利人发现,现在所说的遗传基因更是近几十年的事。那么,要研究1900年之前的汉族群体遗传的情况,一个便捷的渠道就是研究“姓氏基因”。
袁义达说,他们收集了几十年来上百万份血型数据,经过计算机聚类统计分析后发现,不同人群的血样中的血型、酶、蛋白质的区域分布和人们姓氏的区域分布高度一致。这种高度一致当然不是一种偶然性的巧合,它恰恰反映了中国人的姓氏分布与遗传血型的分布存在必然的内在关系。中国人一般都是子女承父姓,这种姓氏的传递方式与代表人类男性的Y染色体的遗传方式相同,而且从研究来看,中国人姓氏的传递是连续和稳定的。这就是说,各个历史时期的同姓人群的分布不但记录了当时社会进化的痕迹,也反映了人类遗传物质在人群中的分化过程。在汉族的社会中,宗族观念根深蒂固,直到1949年前,同姓同宗仍是一种很强的联系纽带。在中国的历史长河中,汉族人习惯于同姓聚集,几姓联宗,这种生活方式的结果就是形成了大大小小的同姓人群。中国同姓人群的历史、数目和规模是中国人特有的社会现象,ABO血型的分布正是受到了同姓人群分布的选择。
汉族南北两地的血缘的差异在宋代已经形成,其分布规律与现代的分布规律基本一致。
袁义达说,他们对不同时期的各省姓氏分布的数据进行生物遗传距离的分析,获得了宋朝、明朝和当代的汉族人群的三张聚类图,从“宋朝姓氏分布的地域亲缘关系聚类图”可以看出,汉族从宋朝开始已经形成了南北二大区域:南部的广东和福建与北部的其余14个省。“明朝姓氏分布的地域亲缘关系聚类图”也非常清楚地把明朝中国人分为南北两大人群,形成福建、广东和广西三省为南方人群,其他14省为北方人群的局面。而且明朝的人群地理分布特征已与当代的分布基本一致,其南北两大异源汉族的地域分界线也应在武夷山和南岭一带,而不是在长江。与宋朝的地域人群分布相比较,广西已与湖南分离而与广东、福建聚类。
“当代姓氏分布的地域亲缘关系聚类图”反映了当代中国汉族的南北两大人群的异源性,以及明显的分界地域在南部的武夷山和南岭一带。29个省区市分为南北两大块,而且其遗传距离很大。南方汉族包括福建、台湾、广东、广西、海南省、香港和澳门。
总之,宋、明、今三个时期的姓氏遗传距离分析结果表明,在中国1000年前的宋朝已经形成了南北两大区域的人群,从姓氏遗传信息上明显地显示出南北两大区域人群结构的区别,表明南北两大区域人群的不同源性,其明显的地域分界线在南方的武夷山和南岭。
中国人姓氏的历史至少已有4000年以上,主要起源于中国西北和中原地区的民族,融合并同化了各个时期周边各民族的姓氏,形成了中国几千年来一直在使用的汉字姓氏。
根据1000年来的中国人姓氏分布和对人群迁移、混居和融合情况的分析,基本上反映了当时的民族联合和进化的历史,也说明了中原地区的人群是组成中华民族的主体,它融合了南北各个时期的民族成分,尤其是北方地区的民族成分,形成了互相依存不可分割的当代的中华民族的整体。当代人群分布的情况基本上与明朝、宋朝人群分布具有很高相似性和渐渐变化的过程,它们之间的区别点正是反映了这1000年期间人群进一步迁移与分化的结果。
汉族南北两个不同的群体形成,是由社会历史的发展、地理上的隔离以及语言的不通等原因造成的。
汉族南北两个区域人群在历史上是怎么形成的呢?袁义达认为,华夏民族在长期的迁移和进化过程中,北方地区主要交往和融合的是北方地区的少数民族,如匈奴、鲜卑、突厥、羌、蒙古等属北蒙古人种的民族。而两广闽台地区主要交往和融合的是南方地区的少数民族,如南越、交趾等属南蒙古人种的民族。
北方地区地形平坦,人群迁移容易,所以,北方人群间的同化和语言统一要比南方地区快。南方地区,特别武夷山和南岭以南,由于丘陵起伏,地形复杂,人群迁移困难,人群间的同化时间长,互相交往困难。长期以来造成地理上的隔离状态,语言变化很大,形成无数的“族群岛”。
袁义达指出,几千年的汉族进化历史也证明南北地区的汉族存在差异,而且是一种群体遗传基因进化上的差异。因为文化上的差异,包括语言上的差异,通过政府的政策和法令,在不长的时间内可以改变或缩小这类差别,这类差别不是根本性的。几千年的不同程度的隔离和遗传基因进化中所造成的不同地区汉族亚群体之间的差异才是本质上的区别。
袁义达,中国科学院遗传与发育生物学研究所副研究员。1985年-1986年,1988年和1992年年在美国斯坦福大学医学院工作,创建了中国姓氏群体遗传学。在国内外共发表了30多篇论文和两部专著。研究方向:1. 中国姓氏群体遗传学的研究。2. 中国人遗传基因多样性和姓氏分布相比较的研究。3. 姓氏群体遗传与疾病在地理分布上相关性的研究。(人民网 张星海)
我国的人类群体遗传学研究
杜若甫
1 什么是人类群体遗传学?
广东、广西、海南一带的人,眼窝较深、鼻翼较宽、嘴唇较厚;而东北人则眼裂较小、眼距也较小、面部较平、鼻子较窄而长、嘴唇较薄。人们一看,就可以猜出,这人可能是广东人,那人像是东北人。更不用说黑种人、白种人和黄种人,往往一眼就可以看出来了。
一个村子、一个学校,或一县、市的人,一个民族,一个人种,都可以看作是大小不同的人群。每一个人群都有其特征,有的特征是外表上的(如身高、肤色、脸型等),有的特征则是内在的(如血型、酶与蛋白质的结构等),但所有特征,都是每一个人的基因组在一定外界条件下表达的结果。有许多性状在人的一生中是不会受外界条件的影响而变化的(如血型),有的性状则易受外界条件的影响(如肤色、身高等)。
每一人群中所有人的基因组的总和,就是该人群的遗传结构。人类群体遗传学就是研究人群的遗传结构及其变化的科学,或者说,是研究人类群体中基因组总和的异同及其进化的科学。
2 体质群体遗传学与理论群体遗传学
群体遗传学主要分体质群体遗传学与理论群体遗传学。人类体质群体遗传学着重于实际调查,即对各个人群的各种性状与遗传标记进行调查。调查一般都是以取样方式进行的,即不是调查群体中所有个体,而是只抽取其中一部分人作为样本进行调查、分析。当然,在取样时应使所取样本具有最大的代表性。
体质人类群体遗传学研究是从人体测量学指标、肤色等外部的多基因遗传性状开始的,后来才主要转到单基因遗传的标记。过去,主要是用免疫化学和电泳等方法分析基因的产物(蛋白质、酶等),根据表型的频率计算该基因座的等位基因频率(通常称等位基因频率为“基因频率”)。现在,对一部分结构基因和非编码序列,已可用DNA测序,先用内切酶切,然后进行电泳等方法,直接研究每一个体中某一DNA片段中核苷酸的变异。
理论群体遗传学则主要用数理统计学及计算机模拟等方法进行研究,各种生物的群体遗传学现象与规律有许多是共同的,不过人类群体遗传学现象与规律仍有某些特点。
3 我国人类群体遗传学的发展简史与现状
世界著名群体遗传学家李景均教授在北京大学农学院和北京农业大学任教期间,完成了其名著Population Genetics(群体遗传学)的写作。自1951年后,他一直在英国、美国执教。此后,我国的人类群体遗传学研究,主要是在体质群体遗传学方面,而在理论群体遗传学方面的工作则较少。
以现代科学手段对中国人进行体质群体遗传学研究,应该从1917年第一篇关于中国人群的人体测量学论文发表算起。1918年发表的关于中国人群ABO血型基因频率的调查结果,则是第一份中国人群基因频率的数据。
中国学者对中国人群的遗传学调查第一份报告是1938年吴定良及许文生对华北人群的人体测量学调查报告。1940年刘威等又报道了对海南黎族和广西壮族的人体测量结果。以后又陆续有我国学者关于中国人群ABO血型及Rh血型的调查结果报道。在60、70年代,我国学者曾对十几个民族的ABO、MN、Rh和P等4个血型系统进行大规模的调查。李璞等在1965年首次报道了对我国东北人的苯硫脲味盲率的调查结果。对中国人群红绿色盲率最早的报道则发表于1937年。
对中国人群的遗传学研究自1980年以后蓬勃开展起来,在短短的16年中,取得了极其丰富的成果。至今,在人体测量学方面,已有30多个民族的数据。
在红细胞血型方面,基因频率数据最多的是ABO血型,在我国56个民族中,已有52个民族的数据,其中汉族各省、市、地区除西藏外,都已有调查数据,只有门巴、珞巴、布朗、拉祜等民族还没有关于ABO血型的基因频率的报道。MN血型已有46个民族的基因频率数据,其他血型系统已有基因频率数据的人群数是:Rh-D有37个少数民族和25个汉族人群的数据;P血型有39个少数民族和27个汉族人群的数据,Duffy、Kidd、Diego、Lewis、Lutheran、Xg及ABO分泌型等则均有10多个少数民族和10多个汉族人群的数据。
杜若甫
1 什么是人类群体遗传学?
广东、广西、海南一带的人,眼窝较深、鼻翼较宽、嘴唇较厚;而东北人则眼裂较小、眼距也较小、面部较平、鼻子较窄而长、嘴唇较薄。人们一看,就可以猜出,这人可能是广东人,那人像是东北人。更不用说黑种人、白种人和黄种人,往往一眼就可以看出来了。
一个村子、一个学校,或一县、市的人,一个民族,一个人种,都可以看作是大小不同的人群。每一个人群都有其特征,有的特征是外表上的(如身高、肤色、脸型等),有的特征则是内在的(如血型、酶与蛋白质的结构等),但所有特征,都是每一个人的基因组在一定外界条件下表达的结果。有许多性状在人的一生中是不会受外界条件的影响而变化的(如血型),有的性状则易受外界条件的影响(如肤色、身高等)。
每一人群中所有人的基因组的总和,就是该人群的遗传结构。人类群体遗传学就是研究人群的遗传结构及其变化的科学,或者说,是研究人类群体中基因组总和的异同及其进化的科学。
2 体质群体遗传学与理论群体遗传学
群体遗传学主要分体质群体遗传学与理论群体遗传学。人类体质群体遗传学着重于实际调查,即对各个人群的各种性状与遗传标记进行调查。调查一般都是以取样方式进行的,即不是调查群体中所有个体,而是只抽取其中一部分人作为样本进行调查、分析。当然,在取样时应使所取样本具有最大的代表性。
体质人类群体遗传学研究是从人体测量学指标、肤色等外部的多基因遗传性状开始的,后来才主要转到单基因遗传的标记。过去,主要是用免疫化学和电泳等方法分析基因的产物(蛋白质、酶等),根据表型的频率计算该基因座的等位基因频率(通常称等位基因频率为“基因频率”)。现在,对一部分结构基因和非编码序列,已可用DNA测序,先用内切酶切,然后进行电泳等方法,直接研究每一个体中某一DNA片段中核苷酸的变异。
理论群体遗传学则主要用数理统计学及计算机模拟等方法进行研究,各种生物的群体遗传学现象与规律有许多是共同的,不过人类群体遗传学现象与规律仍有某些特点。
3 我国人类群体遗传学的发展简史与现状
世界著名群体遗传学家李景均教授在北京大学农学院和北京农业大学任教期间,完成了其名著Population Genetics(群体遗传学)的写作。自1951年后,他一直在英国、美国执教。此后,我国的人类群体遗传学研究,主要是在体质群体遗传学方面,而在理论群体遗传学方面的工作则较少。
以现代科学手段对中国人进行体质群体遗传学研究,应该从1917年第一篇关于中国人群的人体测量学论文发表算起。1918年发表的关于中国人群ABO血型基因频率的调查结果,则是第一份中国人群基因频率的数据。
中国学者对中国人群的遗传学调查第一份报告是1938年吴定良及许文生对华北人群的人体测量学调查报告。1940年刘威等又报道了对海南黎族和广西壮族的人体测量结果。以后又陆续有我国学者关于中国人群ABO血型及Rh血型的调查结果报道。在60、70年代,我国学者曾对十几个民族的ABO、MN、Rh和P等4个血型系统进行大规模的调查。李璞等在1965年首次报道了对我国东北人的苯硫脲味盲率的调查结果。对中国人群红绿色盲率最早的报道则发表于1937年。
对中国人群的遗传学研究自1980年以后蓬勃开展起来,在短短的16年中,取得了极其丰富的成果。至今,在人体测量学方面,已有30多个民族的数据。
在红细胞血型方面,基因频率数据最多的是ABO血型,在我国56个民族中,已有52个民族的数据,其中汉族各省、市、地区除西藏外,都已有调查数据,只有门巴、珞巴、布朗、拉祜等民族还没有关于ABO血型的基因频率的报道。MN血型已有46个民族的基因频率数据,其他血型系统已有基因频率数据的人群数是:Rh-D有37个少数民族和25个汉族人群的数据;P血型有39个少数民族和27个汉族人群的数据,Duffy、Kidd、Diego、Lewis、Lutheran、Xg及ABO分泌型等则均有10多个少数民族和10多个汉族人群的数据。
我国至今已对24个少数民族和27个汉族人群的白细胞抗原系统进行过基因频率的调查。近年来,由于分子遗传学对DNA序列分析技术的应用,使对HLA各基因座的等位基因的鉴定更为精确可靠了。
对我国人群进行过基因频率调查的酶和蛋白质有:补体成分C2、C3、C4、C6、C7等,备解因子B,组特异成分,转铁蛋白,结合珠蛋白,血清α球蛋白,α1-抗胰蛋白酶、免疫球蛋白Km与Gm,血清类粘蛋白和糖蛋白等蛋白质,乙醛脱氢酶、乙二醛酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡萄糖脱氢酶、磷酸葡萄糖变位酶Ⅰ、谷丙转氨酶、酯酶D、腺苷酸激酶、腺苷脱氨酶、酸性磷酸酶、拟胆碱酯酶、乳糖酶、淀粉酶等。用这些指标已研究了30多个民族,另外还有20多个民族尚未对其酶与蛋白质的遗传多态性进行过研究。
中山医科大学杜传书教授实验室对葡萄糖-6-磷酸脱氢酶在我国人群中各种缺陷型及其频率进行了长期的深入研究。对我国人群研究相当广泛的还有血红蛋白,尤其对疟疾高发地区(如广西、广东、海南、云南等省)及西北地区的新疆、甘肃、内蒙、宁夏等地,进行了大规模的研究。
此外,对苯硫脲味盲、色盲、盯聍等单基因遗传的性状,也进行了大量调查,已有基因频率的人群数,苯硫脲味盲为39个,红绿色盲为20个少数民族与16个汉族人群,盯聍类型为22个民族的43个人群。
自80年代中期,我国又开展了DNA多态性的研究、主要是线粒体及Y染色体的DNA的研究。我国学者自1981年后,用各种基因频率,计算了我国人群与民族间的遗传距离,并根据遗传距离进行聚类分析,绘出了我国不同民族和汉族不同地区人群的系统树。同时,还用基因频率对中国人群进行主成分分析及遗传拓朴学分析,以了解中华各民族的源与流及彼此间血缘远近。所用的基因频率有红细胞血型、白细胞抗原系统、免疫球蛋白、各种酶与蛋白质、人体测量学指标、皮纹学指标、甚至姓氏频率。下图是用38个基因座的基因频率绘制的我国24个人群(14个少数民族及10个省、市、区的汉族人群)的系统树(引自肖春杰的博士论文《中国人群的聚类分析与基因地理学》)。
4 对我国人群遗传结构分析得出的一些初步结论
4.1 中国人可分为南、北两大群,即南方蒙古人种和北方蒙古人种,大致以长江为界。过去,人类学研究中除蒙古人种的南亚类型和北亚类型外,还提到有东亚类型,其实,东亚类型并不存在,过去认为属东亚类型的人群,基本上属南方蒙古人种。中国人群分南、北两大类型,实质上在新石器时代即已存在。南、北蒙古人种是什么时候分开的?这一问题无论现代人非洲起源说和本地起源说,都是必须回答的。
4.2 汉族这一世界上最大的民族,是历史上融合了许多古代的非汉族人群而形成的。各地汉族与当地的少数民族在遗传结构上十分相近,而南、北方汉族的遗传结构却相差甚远,接近于南、北方少数民族间的平均差异。
4.3 在各地汉族中,广东、广西、福建、台湾、海南的汉族属典型的南方蒙古人种,长江以南其余各地人群也基本上属南方蒙古人种,即南方蒙古人种血缘占主要成分。
4.4 朝鲜、蒙古、满、鄂温克、鄂伦春、赫哲、锡伯、达斡尔、撒拉、保安、东乡、土、裕固等民族及北方回族均属北方蒙古人种。
4.5 藏族虽居住在西南边陲,却与北方各人群在遗传结构上十分相近,也属典型的北方蒙古人种。西藏已发现新石器时代的人类遗迹。今天的藏族主体是什么时候从北方迁徙过去的,还有待今后的深入研究。
4.6 回族都有古代中亚细亚、波斯、阿拉伯人的血缘成分,是以上这些地区来的人与我国当地的汉族及其他民族通婚繁衍的后代。各地回族的遗传结构有相当大的差异,尤其像海南岛三亚市的回族与宁夏的回族差别就很大。
4.7 新疆的塔吉尔、塔塔尔、乌兹别克、柯尔克兹、维吾尔、哈萨克等民族,融合有不同程度的高加索人种血缘。目前对塔吉克、塔塔尔、乌兹别克、柯尔克兹等民族的遗传结构研究得尚少,而研究已较多的维吾尔、哈萨克两族由于绝大部分血缘来自蒙古人种,所以应属蒙古人种。例如维吾尔族,高加索人种血缘大约只占30%左右。在我国各地居住的俄罗斯族,也已程度不同地融入了蒙古人种血缘。
4.8 壮、黎、傣、布依、侗、京等都属南方蒙古人种,而佤、布朗、德昂三个民族,在我国南方蒙古人种各民族中,是最接近东南亚各民族的。瑶族过去有人认为属东亚类型,但现在看来,应归入南亚蒙古人种。
4.9 彝、僳僳、哈尼、普米、纳西、白、景颇、阿昌、畲、苗等民族,虽然有的可能确实起源于北方,但今天,由于他们已融入了南方蒙古人种的大量血缘,基本上已属南方蒙古人种。羌族在公元前3~4世纪从黄河上游、湟河流域迁至四川北部,今天仍属北方蒙古人种。
4.10 土家族虽然基本上也属南方蒙古人种,但往往相当接近北方各民族,其所含北方蒙古人种血缘成分似乎比苗族还要多。
4.11 高山族实际上是9个族,即泰雅、赛夏、布农、邹、鲁凯、排湾、卑南、阿美和雅美,他们都属南方蒙古人种。
4.12 干型盯聍基因是在南方蒙古人种与北方蒙古人种分开之后产生的,它起源于东北亚。
4.13 在汉族人群间,遗传结构的差异反映的主要是南、北蒙古人种的差异(约占全部差异的33%左右),其次是高加索人种与蒙古人种间的差异(约占全部差异的24%左右)。
4.14 在少数民族间,遗传结构的差异反映的主要是蒙古人种与高加索人种间的差异(约占全部差异的30%左右),其次才是南、北蒙古人种间的差异(约占19%左右)。
我国是世界上人口最多的国家,充分、准确、深入地了解我国各民族、各人群的遗传结构是我国人类遗传学义不容辞的责任,这对于疾病的防治、人民体质的提高、深入了解中华民族的源与流、以及现代人的起源等各个方面,都有十分重要的意义。
在我国各民族中,研究得比较少的是新疆和云南的一些民族。此外,许多少数民族有不少分支,分支间也十分隔离,因此还很有必要对这些民族的分支进行深入的研究。我国还有一些“未识别民族”,如西藏的夏尔巴人、僜人、云南的克姆人、苦聪人,四川的巴马藏族(可能是氐族)。甚至汉族中也有许多特殊的人群,如广东、福建等地的疍民,贵州一带的“穿青”、海南的临高人、浙江绍兴一带的“堕民”等等。
中国人类群体遗传学还有许多工作要做,可谓“任重而道远”。
自《生物学通报》1997年第7��
对我国人群进行过基因频率调查的酶和蛋白质有:补体成分C2、C3、C4、C6、C7等,备解因子B,组特异成分,转铁蛋白,结合珠蛋白,血清α球蛋白,α1-抗胰蛋白酶、免疫球蛋白Km与Gm,血清类粘蛋白和糖蛋白等蛋白质,乙醛脱氢酶、乙二醛酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡萄糖脱氢酶、磷酸葡萄糖变位酶Ⅰ、谷丙转氨酶、酯酶D、腺苷酸激酶、腺苷脱氨酶、酸性磷酸酶、拟胆碱酯酶、乳糖酶、淀粉酶等。用这些指标已研究了30多个民族,另外还有20多个民族尚未对其酶与蛋白质的遗传多态性进行过研究。
中山医科大学杜传书教授实验室对葡萄糖-6-磷酸脱氢酶在我国人群中各种缺陷型及其频率进行了长期的深入研究。对我国人群研究相当广泛的还有血红蛋白,尤其对疟疾高发地区(如广西、广东、海南、云南等省)及西北地区的新疆、甘肃、内蒙、宁夏等地,进行了大规模的研究。
此外,对苯硫脲味盲、色盲、盯聍等单基因遗传的性状,也进行了大量调查,已有基因频率的人群数,苯硫脲味盲为39个,红绿色盲为20个少数民族与16个汉族人群,盯聍类型为22个民族的43个人群。
自80年代中期,我国又开展了DNA多态性的研究、主要是线粒体及Y染色体的DNA的研究。我国学者自1981年后,用各种基因频率,计算了我国人群与民族间的遗传距离,并根据遗传距离进行聚类分析,绘出了我国不同民族和汉族不同地区人群的系统树。同时,还用基因频率对中国人群进行主成分分析及遗传拓朴学分析,以了解中华各民族的源与流及彼此间血缘远近。所用的基因频率有红细胞血型、白细胞抗原系统、免疫球蛋白、各种酶与蛋白质、人体测量学指标、皮纹学指标、甚至姓氏频率。下图是用38个基因座的基因频率绘制的我国24个人群(14个少数民族及10个省、市、区的汉族人群)的系统树(引自肖春杰的博士论文《中国人群的聚类分析与基因地理学》)。
4 对我国人群遗传结构分析得出的一些初步结论
4.1 中国人可分为南、北两大群,即南方蒙古人种和北方蒙古人种,大致以长江为界。过去,人类学研究中除蒙古人种的南亚类型和北亚类型外,还提到有东亚类型,其实,东亚类型并不存在,过去认为属东亚类型的人群,基本上属南方蒙古人种。中国人群分南、北两大类型,实质上在新石器时代即已存在。南、北蒙古人种是什么时候分开的?这一问题无论现代人非洲起源说和本地起源说,都是必须回答的。
4.2 汉族这一世界上最大的民族,是历史上融合了许多古代的非汉族人群而形成的。各地汉族与当地的少数民族在遗传结构上十分相近,而南、北方汉族的遗传结构却相差甚远,接近于南、北方少数民族间的平均差异。
4.3 在各地汉族中,广东、广西、福建、台湾、海南的汉族属典型的南方蒙古人种,长江以南其余各地人群也基本上属南方蒙古人种,即南方蒙古人种血缘占主要成分。
4.4 朝鲜、蒙古、满、鄂温克、鄂伦春、赫哲、锡伯、达斡尔、撒拉、保安、东乡、土、裕固等民族及北方回族均属北方蒙古人种。
4.5 藏族虽居住在西南边陲,却与北方各人群在遗传结构上十分相近,也属典型的北方蒙古人种。西藏已发现新石器时代的人类遗迹。今天的藏族主体是什么时候从北方迁徙过去的,还有待今后的深入研究。
4.6 回族都有古代中亚细亚、波斯、阿拉伯人的血缘成分,是以上这些地区来的人与我国当地的汉族及其他民族通婚繁衍的后代。各地回族的遗传结构有相当大的差异,尤其像海南岛三亚市的回族与宁夏的回族差别就很大。
4.7 新疆的塔吉尔、塔塔尔、乌兹别克、柯尔克兹、维吾尔、哈萨克等民族,融合有不同程度的高加索人种血缘。目前对塔吉克、塔塔尔、乌兹别克、柯尔克兹等民族的遗传结构研究得尚少,而研究已较多的维吾尔、哈萨克两族由于绝大部分血缘来自蒙古人种,所以应属蒙古人种。例如维吾尔族,高加索人种血缘大约只占30%左右。在我国各地居住的俄罗斯族,也已程度不同地融入了蒙古人种血缘。
4.8 壮、黎、傣、布依、侗、京等都属南方蒙古人种,而佤、布朗、德昂三个民族,在我国南方蒙古人种各民族中,是最接近东南亚各民族的。瑶族过去有人认为属东亚类型,但现在看来,应归入南亚蒙古人种。
4.9 彝、僳僳、哈尼、普米、纳西、白、景颇、阿昌、畲、苗等民族,虽然有的可能确实起源于北方,但今天,由于他们已融入了南方蒙古人种的大量血缘,基本上已属南方蒙古人种。羌族在公元前3~4世纪从黄河上游、湟河流域迁至四川北部,今天仍属北方蒙古人种。
4.10 土家族虽然基本上也属南方蒙古人种,但往往相当接近北方各民族,其所含北方蒙古人种血缘成分似乎比苗族还要多。
4.11 高山族实际上是9个族,即泰雅、赛夏、布农、邹、鲁凯、排湾、卑南、阿美和雅美,他们都属南方蒙古人种。
4.12 干型盯聍基因是在南方蒙古人种与北方蒙古人种分开之后产生的,它起源于东北亚。
4.13 在汉族人群间,遗传结构的差异反映的主要是南、北蒙古人种的差异(约占全部差异的33%左右),其次是高加索人种与蒙古人种间的差异(约占全部差异的24%左右)。
4.14 在少数民族间,遗传结构的差异反映的主要是蒙古人种与高加索人种间的差异(约占全部差异的30%左右),其次才是南、北蒙古人种间的差异(约占19%左右)。
我国是世界上人口最多的国家,充分、准确、深入地了解我国各民族、各人群的遗传结构是我国人类遗传学义不容辞的责任,这对于疾病的防治、人民体质的提高、深入了解中华民族的源与流、以及现代人的起源等各个方面,都有十分重要的意义。
在我国各民族中,研究得比较少的是新疆和云南的一些民族。此外,许多少数民族有不少分支,分支间也十分隔离,因此还很有必要对这些民族的分支进行深入的研究。我国还有一些“未识别民族”,如西藏的夏尔巴人、僜人、云南的克姆人、苦聪人,四川的巴马藏族(可能是氐族)。甚至汉族中也有许多特殊的人群,如广东、福建等地的疍民,贵州一带的“穿青”、海南的临高人、浙江绍兴一带的“堕民”等等。
中国人类群体遗传学还有许多工作要做,可谓“任重而道远”。
自《生物学通报》1997年第7��
研究发现,南北汉族在父系上基因十分相似,在母系上基因差异显著。
人体共有23对染色体。其中,Y染色体是由父系遗传的一种性染色体,由于在人类遗传过程中不会出现重组,因此能稳定而丰富地记录人类遗传信息,通过对Y染色体的研究,能较为直接地揭示人类起源和演化的过程。
复旦大学的研究人员测定和分析了来自南北28个地区具有一定代表性的汉族人群的Y染色体非重组区和线粒体DNA,这些样本覆盖了中国绝大部分的省份。
研究者将汉族线粒体DNA序列归入不同的世系类群并统计出其分布频率,结果发现,南方汉族与北方汉族的Y染色体类型及频率分布非常相近,说明南方汉族在父系上与北方汉族非常相似,受到南方原住居民的影响很小。母系方面,北方汉族与南方汉族的线粒体类型的分布非常不同,南北汉族之间有极其显著的差异,南方汉族受到南方原住民族的影响较大。总体上,北方汉族对南方汉族的遗传贡献父系比母系高得多,南方汉族中北方汉族的贡献比例由北向南递减。
北方汉族人群带到南方的先进文化将南方人群同化,但无法改变当地人身上的遗传基因。
汉族人口的迁移带动了汉文化的扩散,而当代的南方人正是这些勇于进取的开拓者的后代。
通过对南北差异基因的比较研究可知,源于黄河流域到后期始于长江流域的向周边和边远地区的扩张,在遗传上并没有取代这些地区以前存在的人群,相反,只是从文化的角度将当地人的Y染色体同化为汉族的一部分,但并未把X染色体也同化。从有史记载以来,中原地区汉族人群向南方和西南方向的扩张也只是一个政治和军事上的征服过程,而这种征服的一个直接结果是汉文化和汉基因的渗透。
正是在这个意义上说,我国的汉族即是文化上也是血缘上的完整群体。
当然,由于现代的男女平等思想,只在Y染色体上高度同源而X染色体显著不同的汉族,也可以被说成是血缘上不是完整的群体。
汉族本身是即同源又多源的基因库(因为男女平等,所以X和Y染色体也平等,所以这种看似自相矛盾的说法也是有道理的)被同一个文化(汉文化)同化、融合和统帅的产物。虽然人群的迁移性很大,由此导致较高的基因流,这虽然或多或少地模糊了人群扩张分化的历史,但历史的痕迹显然在遗传上还是有所保留。
复旦大学生命科学学院院长和国家人类基因组南方中心金力教授表示,上述对比研究证明,汉文化的扩散中确实发生了大规模的人群迁徙,汉文化向东向南扩散的机制符合人口扩张模式。
首先,几乎所有的汉族群体的Y染色体单倍群分布极为相似;其次,北方汉族对南方汉族的遗传贡献无论从父系还是母系方面都十分可观。在汉族的扩张过程中,南方汉族与南方原住民族发生了基因融合,但这一融合具有性别偏向性:融入到南方汉族中的南方原住民族女性远远多于男性,而北方汉族的男性对南方汉族做出了更大的贡献。
复旦大学的这一遗传学研究结果与我国文献的历史记载不谋而合。
在中国漫长的历史过程中,发生了许许多多像楚汉战争、黄巾之乱、靖康之难等一系列导致社会动荡的历史事件。在这些历史事件中,大批北方汉人由于受北方战乱和饥荒的影响,开始向南迁移。这些迁移中,最具代表性的当属南北朝时,当时北方流民(以汉人为主)为躲避北方各少数民族政权的混战而大量南迁,这次南迁对中国人口版图的划分具有重大意义。当时南迁人口的数目,据说占南方人口的六分之一,当时东晋的人口为540万,那么以此计算,当时南迁人数至少有90万。
其实,实际数目则应该大于此,因为当时部分士族为逃避赋税还隐瞒了部分人口。史载,当时成功向南实施迁移的人群以身强力壮、勇于拓荒的男性农民为主,很多女性在迁移的途中由于体弱多病而死于遥远的路途之中。
此外,历史上的南方多为边远蛮夷之地,各朝代多于此驻军屯田,这对所在地的性别和基因构成也产生了一定影响。元、明两代及清初接连不断向云南、贵州地区派去大量军队,实行屯田制度。四百年内,移入云贵地区的人口达百万之多��
人体共有23对染色体。其中,Y染色体是由父系遗传的一种性染色体,由于在人类遗传过程中不会出现重组,因此能稳定而丰富地记录人类遗传信息,通过对Y染色体的研究,能较为直接地揭示人类起源和演化的过程。
复旦大学的研究人员测定和分析了来自南北28个地区具有一定代表性的汉族人群的Y染色体非重组区和线粒体DNA,这些样本覆盖了中国绝大部分的省份。
研究者将汉族线粒体DNA序列归入不同的世系类群并统计出其分布频率,结果发现,南方汉族与北方汉族的Y染色体类型及频率分布非常相近,说明南方汉族在父系上与北方汉族非常相似,受到南方原住居民的影响很小。母系方面,北方汉族与南方汉族的线粒体类型的分布非常不同,南北汉族之间有极其显著的差异,南方汉族受到南方原住民族的影响较大。总体上,北方汉族对南方汉族的遗传贡献父系比母系高得多,南方汉族中北方汉族的贡献比例由北向南递减。
北方汉族人群带到南方的先进文化将南方人群同化,但无法改变当地人身上的遗传基因。
汉族人口的迁移带动了汉文化的扩散,而当代的南方人正是这些勇于进取的开拓者的后代。
通过对南北差异基因的比较研究可知,源于黄河流域到后期始于长江流域的向周边和边远地区的扩张,在遗传上并没有取代这些地区以前存在的人群,相反,只是从文化的角度将当地人的Y染色体同化为汉族的一部分,但并未把X染色体也同化。从有史记载以来,中原地区汉族人群向南方和西南方向的扩张也只是一个政治和军事上的征服过程,而这种征服的一个直接结果是汉文化和汉基因的渗透。
正是在这个意义上说,我国的汉族即是文化上也是血缘上的完整群体。
当然,由于现代的男女平等思想,只在Y染色体上高度同源而X染色体显著不同的汉族,也可以被说成是血缘上不是完整的群体。
汉族本身是即同源又多源的基因库(因为男女平等,所以X和Y染色体也平等,所以这种看似自相矛盾的说法也是有道理的)被同一个文化(汉文化)同化、融合和统帅的产物。虽然人群的迁移性很大,由此导致较高的基因流,这虽然或多或少地模糊了人群扩张分化的历史,但历史的痕迹显然在遗传上还是有所保留。
复旦大学生命科学学院院长和国家人类基因组南方中心金力教授表示,上述对比研究证明,汉文化的扩散中确实发生了大规模的人群迁徙,汉文化向东向南扩散的机制符合人口扩张模式。
首先,几乎所有的汉族群体的Y染色体单倍群分布极为相似;其次,北方汉族对南方汉族的遗传贡献无论从父系还是母系方面都十分可观。在汉族的扩张过程中,南方汉族与南方原住民族发生了基因融合,但这一融合具有性别偏向性:融入到南方汉族中的南方原住民族女性远远多于男性,而北方汉族的男性对南方汉族做出了更大的贡献。
复旦大学的这一遗传学研究结果与我国文献的历史记载不谋而合。
在中国漫长的历史过程中,发生了许许多多像楚汉战争、黄巾之乱、靖康之难等一系列导致社会动荡的历史事件。在这些历史事件中,大批北方汉人由于受北方战乱和饥荒的影响,开始向南迁移。这些迁移中,最具代表性的当属南北朝时,当时北方流民(以汉人为主)为躲避北方各少数民族政权的混战而大量南迁,这次南迁对中国人口版图的划分具有重大意义。当时南迁人口的数目,据说占南方人口的六分之一,当时东晋的人口为540万,那么以此计算,当时南迁人数至少有90万。
其实,实际数目则应该大于此,因为当时部分士族为逃避赋税还隐瞒了部分人口。史载,当时成功向南实施迁移的人群以身强力壮、勇于拓荒的男性农民为主,很多女性在迁移的途中由于体弱多病而死于遥远的路途之中。
此外,历史上的南方多为边远蛮夷之地,各朝代多于此驻军屯田,这对所在地的性别和基因构成也产生了一定影响。元、明两代及清初接连不断向云南、贵州地区派去大量军队,实行屯田制度。四百年内,移入云贵地区的人口达百万之多��
僚人是母系社会有怎么样?
僚人妇女没有“三从四德”的优良传统��
僚人妇女没有“三从四德”的优良传统��
李辉:《分子人类学所见历史上闽越族群的消失》, 广西民族大学学报(哲学社会科学版), 第29 卷第2 期,2007年3月。
[摘 要] 分子人类学用DNA 材料和计算生物学方法解答了很多人类学的问题。对于中国南方和
东南亚地区最大的族群,侗傣族群和马来族群,分子人类学研究发现他们有共同的起源——百越族群,所以可以定义为“澳泰族群”。闽越是这个族群历史上重要的一支,曾经是福建的主体民族。通过对现代福建和其他闽语人群的分子人类学研究,结果并没有看到闽越的结构。闽语人群基本都是来源于北方的汉族移民。所以可以确定历史上的闽越族在福建地区基本上已经消失。
[关键词] 分子人类学;闽越; Y染色体;福建; 移民
[摘 要] 分子人类学用DNA 材料和计算生物学方法解答了很多人类学的问题。对于中国南方和
东南亚地区最大的族群,侗傣族群和马来族群,分子人类学研究发现他们有共同的起源——百越族群,所以可以定义为“澳泰族群”。闽越是这个族群历史上重要的一支,曾经是福建的主体民族。通过对现代福建和其他闽语人群的分子人类学研究,结果并没有看到闽越的结构。闽语人群基本都是来源于北方的汉族移民。所以可以确定历史上的闽越族在福建地区基本上已经消失。
[关键词] 分子人类学;闽越; Y染色体;福建; 移民
在我们近年的研究中,百越族群的调查工作已经开展得非常深入。现代百越族群的遗传结构已经基本厘清。从Y染色体看来,侗傣族群和马来族群基本都是百越的后裔。所以遗传结构上,我们把古代的百越族群和现在的后裔都称为“澳泰族群”。Y 染色体DNA 显然是研究较小区域内的族群关系的最佳材料,对于东亚各个族群之间的关系,其他的DNA 区段很难做出清晰的结构。而Y染色体的各个类型(单倍群) 却分布于不同的族群,相互之间又有明确的渊源关系。东亚的主要Y 染色体类型是O 型,其下又有三个亚型(O1 ,O2 ,O3) ,其中O1 是澳泰族群的特征类型。各亚型之下又有次亚型,以及更多的突变类型可以追寻群体之间的遗传轨迹。对于“澳泰族群”的起源地,从Y染色体结构分布看来,应该在两广一带,并以此向四周扩散。福建古代的闽越也是百越的一个分支,在澳泰族群中处于何种地位? 现代的福建人在汉族中也是比较独特的民系,与闽越族到底有什么关系? 本文拟就通过Y染色体的研究结果,来解答福建的群体来源问题。
汉武帝强制的闽越迁居一、闽越的历史和汉代的强制移民澳泰群体在福建大部分地区的定居,应该是在广东和台湾之后,浙江之前。除了福建最南部的部分地区之外,福建的澳泰群体在历史上主要被称为闽越。[1 ] (P129~139) 在秦汉之前,闽越据山川之险,很少受到外来的干扰。直到秦朝统一中国的时候,中央的统治才涉及这一区域。到了汉武帝的时候,闽越国被彻底消灭了,闽越从此从中国的历史舞台上失踪了。闽越的老百姓到哪里去了? 他们留在当地,被同化了呢,还是离开了福建,流散到他处。这是一个值得探讨的问题。闽越族人自然不是在闽越国成立后才出现的,他们很早就居于闽江流域。其历史按前文的推算可能有上万年。《周礼》、《山海经》等先秦典籍已明载商周时期福建先民“七闽”部族已在福建活动。而且通过多年的考古发掘,全省九地市基本上都发现有新石器时代的考古文物,这充分说明先秦的“七闽”部落遍布在福建各地。所谓“七闽”不见得就是七个部落,可能仅仅虚指部落种类的繁多。当时并没有方国的建立,所以福建的社会可能还处于部落联盟的状态。闽越国的建立是福建历史上的一件大事。公元前334(周显王三十五年) ,楚国打败越国后,越国的势力从吴国退回到浙江。“越以此散,诸族子争立,或为王,或为君,滨于江南海上,服朝于楚”(《史记·越王勾践世家》) 。这些纷纷自立的越国王子王孙中,就有迁入福建为王的,是福建的一次人口大迁入。《史记·东越列传》称秦汉的闽越王无诸为“越王勾践之后”。越王的二儿子无诸据福建而自立闽越王。前223 年秦国灭楚后,无诸被废为君长,在福建设闽中郡(今福州) ��
汉武帝强制的闽越迁居一、闽越的历史和汉代的强制移民澳泰群体在福建大部分地区的定居,应该是在广东和台湾之后,浙江之前。除了福建最南部的部分地区之外,福建的澳泰群体在历史上主要被称为闽越。[1 ] (P129~139) 在秦汉之前,闽越据山川之险,很少受到外来的干扰。直到秦朝统一中国的时候,中央的统治才涉及这一区域。到了汉武帝的时候,闽越国被彻底消灭了,闽越从此从中国的历史舞台上失踪了。闽越的老百姓到哪里去了? 他们留在当地,被同化了呢,还是离开了福建,流散到他处。这是一个值得探讨的问题。闽越族人自然不是在闽越国成立后才出现的,他们很早就居于闽江流域。其历史按前文的推算可能有上万年。《周礼》、《山海经》等先秦典籍已明载商周时期福建先民“七闽”部族已在福建活动。而且通过多年的考古发掘,全省九地市基本上都发现有新石器时代的考古文物,这充分说明先秦的“七闽”部落遍布在福建各地。所谓“七闽”不见得就是七个部落,可能仅仅虚指部落种类的繁多。当时并没有方国的建立,所以福建的社会可能还处于部落联盟的状态。闽越国的建立是福建历史上的一件大事。公元前334(周显王三十五年) ,楚国打败越国后,越国的势力从吴国退回到浙江。“越以此散,诸族子争立,或为王,或为君,滨于江南海上,服朝于楚”(《史记·越王勾践世家》) 。这些纷纷自立的越国王子王孙中,就有迁入福建为王的,是福建的一次人口大迁入。《史记·东越列传》称秦汉的闽越王无诸为“越王勾践之后”。越王的二儿子无诸据福建而自立闽越王。前223 年秦国灭楚后,无诸被废为君长,在福建设闽中郡(今福州) ��
前202 年,秦灭汉立后,恢复闽越国,无诸依旧统辖原闽中郡地区。后,汉朝相继命闽越国的两位君长为南海王和东海王(都东瓯) 。至此,原来的闽越被一分为三后,三者互相竞争和猜忌。汉文帝时,南海国最早被灭,越民被迁往上淦(今江西清江县) 。前138 年闽越发兵攻打东瓯国未遂,东瓯国在汉武帝的帮助下举国内迁,归为汉民,其原国土即为闽越所占。如此纷争,在前135 年闽越攻打南越时,由于闽越王邹郢被其弟余善所杀而暂告一段落,降于汉的余善被封为东越王,无诸之孙丑被封为越繇王。自此,闽越被分为繇和东越两部。前111 年,余善谋反兵败,东越王侯与将军又被各自封侯,势力更为单薄分散,闽越国的历史就此结束了。汉武帝遂以“闽越地险阻,多反复,易为患,故徙其民于江淮之间,福建之地遂虚”。经过三次政治上的强制迁徙后,福建的闽越人锐减,而闽越国亦不复存在,此后数十年从东瓯到闽越的十多万平方公里没有行政区。前85 年,汉昭帝置冶县(福州) 统治。从历史的记载中,我们发现闽越的失踪是从汉武帝时的强制移民开始的。这一时期的强制移民到底规模多大,对闽越族人的分布产生了多么深远的影响? 闽越的后代还在福建吗? 为此我们对闽越故地的现代人群作了详细的调查,检验其中有没有澳泰群体的特征,这些特征可能是什么来历。二、现代闽语支人群的
Y染色体结构现代福建的人群主要是汉藏语系汉语族齐语支的汉族群体,因为齐语支现在主要分布在福建,所以也叫闽语支。齐语支是汉语三大语支之一,形成于河南东部到山东一带,可能是汉语在东夷语的影响下形成的。福建的齐语支起源较早。因为发现闽语中有许多特征保留着汉代的汉语音韵样式,所以可能是汉代来到福建的。如果是这样的话,就和闽越族被强制移民的时间相吻合了。在图1 中列出了闽语支的7 个分支方言,这7 个分支之间的系属关系还不是很明确。从语言学上,关于闽语支的起源说法也很多。有的认为闽语主要是北方汉人带来的中原语言,由于地处偏僻,保留了较多的古汉语样式,所以与其他汉语有所不同。也有认为闽语是汉语在闽越语的影响下发生变化,是带有闽越口音的汉语方言。如果是前者,现代闽语人群中就不会有太多闽越的血缘成分,或者甚至没有。如果是后者,在闽语人群中就应该有相当数量的闽越成分。关于闽语支人群的遗传结构,已有部分相关的报道。在1999 年宿兵的“东亚群体北迁”论文中发表了一组福建群体的数据,[2 ] (P1718~1724) 调查的是福州人群,属于闽东话人群。这一群体的结构与其他南方群体有很大差异。这一群体没有O1 单倍群,在南方群体中显得格外特别。2003 年我们发表了一组福建长汀客家人的Y染色体数据,[3 ] (P7~14)
Y染色体结构现代福建的人群主要是汉藏语系汉语族齐语支的汉族群体,因为齐语支现在主要分布在福建,所以也叫闽语支。齐语支是汉语三大语支之一,形成于河南东部到山东一带,可能是汉语在东夷语的影响下形成的。福建的齐语支起源较早。因为发现闽语中有许多特征保留着汉代的汉语音韵样式,所以可能是汉代来到福建的。如果是这样的话,就和闽越族被强制移民的时间相吻合了。在图1 中列出了闽语支的7 个分支方言,这7 个分支之间的系属关系还不是很明确。从语言学上,关于闽语支的起源说法也很多。有的认为闽语主要是北方汉人带来的中原语言,由于地处偏僻,保留了较多的古汉语样式,所以与其他汉语有所不同。也有认为闽语是汉语在闽越语的影响下发生变化,是带有闽越口音的汉语方言。如果是前者,现代闽语人群中就不会有太多闽越的血缘成分,或者甚至没有。如果是后者,在闽语人群中就应该有相当数量的闽越成分。关于闽语支人群的遗传结构,已有部分相关的报道。在1999 年宿兵的“东亚群体北迁”论文中发表了一组福建群体的数据,[2 ] (P1718~1724) 调查的是福州人群,属于闽东话人群。这一群体的结构与其他南方群体有很大差异。这一群体没有O1 单倍群,在南方群体中显得格外特别。2003 年我们发表了一组福建长汀客家人的Y染色体数据,[3 ] (P7~14)
其中O1 的频率也非常低。这些数据都揭示福建的客家和闽东人群中可能已经基本没有闽越的遗传结构。其他几个方言区的情况是不是相同,还需要更广泛的调查。特别是闽南和兴化方言区,对闽语支人群最有代表性。闽北、闽中和邵将方言区的人口相对较少。琼文区位于海南,受到海南各民族的影响很深,在闽语人群中不具有代表性。我们调查了福建莆田、泉州(闽南) 、广东潮州、汕头和南澳岛的闽语群体。南澳岛位于广东和福建之间,靠近福建的东山岛。南澳岛和东山岛是冰川期台湾陆桥的西端起点,该地的人群如果是原住民,则会对研究史前向台湾的移民事件很有意义。在这几个群体中,泉州、潮州、汕头和南澳都是闽南话的群体,莆田是兴化话的群体。广东的汕头和南澳处于海滨,人群与内陆的潮州又有所不同。闽语支其他几个分支的人群还没有详细的调查。但是到目前为止的调查,闽语支的主体人群的结构基本都已经获得了。我们所采集的样本按地理位置分为7 类,
(1)
南澳:广东和福建之间的海岛;
(2) 汕头:广东省沿海地区,包括汕头,潮安,澄海,潮阳,惠来,饶平;
(3) 潮州:广东省内陆地区,包括潮州,普宁,揭阳,揭东,揭西,丰顺;
(4) 闽南:福建省南部地区,包括泉州,晋江,惠安,南安,诏安;
(5) 闽北:福建省北部地区,包括南平,浦城;
(6) 莆田:福建省沿海地区,包括莆田和仙游;
(7) 安阳:内陆河南省,汉族样本。
地理分布上,这7 种方言有5 种分布于福建的中北部。闽南话的分布最广,以闽南地区为中心,散布到整个东南沿海地区和台湾岛。海南的琼文话也是闽南话的一个变种。福建的西北部,闽语的种类最丰富,所以闽语非常有可能是从西北方向进入的。闽语人群被认为是从中原南下的,起源地在河南东南部,所以我们也增加了河南安阳的人群作为对比。安阳是商代的中心,是古代齐语的分布区。我们统计了各个群体的Y 染色体SNP 单倍群的频率。所有群体的O3 单倍群频率都非常高。除了广东沿海的两个群体以外,其他闽语人群的O1 单倍群都很低, 远远低于东南方汉族人群的平均水平,而与河南安阳的群体处于同一水平。汕头的O1 单倍群达到广东粤语人群的平均水平,南澳人群略高于广东粤语人群。这进一步提示闽越族人已不存在于现代闽语人群中。我们进一步观察全国各地汉族[4 ] (P302~305) 的O1 单倍群频率分布,以了解福建汉族在全国汉族中的特性。图3 中是汉族人群O1 单倍群的频率分布地图。图中我们看到浙江和上海的汉族群体中O1 的频率最高。现在侗傣族群分布集中的西南地区的汉族群体中O1 单倍群频率反而不高。这说明浙江、上海的汉族群体中包含大量被同化的百越成分,而西南地区的百越成分被同化的很少,所以至今还是属于其他民族��
浙江、上海的古代於越和扬越族都已经被不同程度的汉化,而被归属于汉族。而西南地区的汉族群体中很少有百越群体被同化的成分,其中的百越成分是通过与现代百越族群通婚交流获得的。同化所能获得的成分当然要远远多于交流获得的成分。在全国的分布图上,福建的O1 频率显得格外低。特别是在南方群体中,与浙江形成鲜明的对比。如果不是闽越族离开福建,这种现象是不会发生的。因为自北向南,扬越、於越、瓯越、闽越、南越、雒越各个民族历史记载上唯有闽越有过大规模的移民过程。而在这一个弧形地带中,也恰恰在福建出现了O1 单倍群的分布断层。这使我们不得不相信,汉武帝对闽越的强制移民政策是得到坚决地贯彻落实的。部分闽越族人被强制内迁到“江淮间”,最多的就是到浙江一带,这更加增加了浙江的O1 比率。而被强制迁徙的人群就非常容易被同化了。当然,大多数老百姓是不那么容易被强制迁移的,因为在强制移民过程中必然会受到压迫。图3 各地汉族群体中Y染色体O1单倍群频率的地理分布图
O3e 是汉藏语系人群的高频单倍群, 在其他类群中相对较少。从各地汉族的这一单倍群频率的分布看来,福建汉族和华北汉族的频率最高,浙江汉族最低。这一单倍群在浙江和福建之间又体现出强烈的对比反差,分布方式与O1 正好相反。所以这可能揭示了福建汉族中来自北方汉族的成分要远高于浙江。在之前的研究报道中已经有反映。图4 各地汉族群体中Y染色体O3e 单倍群频率的地理分布图
O3* 单倍群是南方来源族群的普遍类型,在南方各族中,特别是“濮- 蛮- 羌”系统的高频类型。图5 中显示福建汉族的这一频率是各地汉族中最高的,而甘青内蒙一带则大幅降低。这提示北方阿尔泰系统族群的融入可能是造成北方汉族O3 3 频率降低的原因,而江西、福建一带则是汉族成分比较纯正的地区,特别是福建,很少受到外界影响。所以,在汉族之前,闽越族是福建的隔离群体,闽越之后汉族成为福建特殊地形造成的隔离群体。这可能也是汉语各方言中闽语支发展速度最慢的原因之一。
闽南人的主体是北方汉人+一部份苗瑶
O2a 单倍群是中国西南部的特征单倍群,原初的汉族群体可能并没有O2a 单倍群。从图6 中看来,福建南部和广东东部的闽语和客家人群中这一单倍群尤其高频,这一趋势看似从湖广一带蔓延而来,很有可能来自苗瑶系统的畲族。畲族发源自湖广的苗瑶系统,从广东西北迁到广东东南部,在广东东南和汉族群体发生一定的混合。所以这一地区的汉族群体中有高频的O2a 正可能体现了这一结构。闽越基本上在福建失踪了,现代闽语支人群并不是闽越人的后代,而主要是北方汉人后代。齐语支可能是更合适的称呼。为了了解齐语支人群的确切来源,即在北方的更为确切的发源地,我们对福建群体的Y - SNP 数据作了主成分分析。对得到的各个主成分作了相关分析,以了解各个主成分之间的关系,找出成对的矛盾主成分。
主成分2 以后的各个主成分都是完全独立的,没有任何相关性。第一主成分和第二主成分则有较高的相关性,而且是显著负相关。所以第1 主成分和第2 主成分是一对相反的矛盾主成分。我们进一步观察这两个主成分上各个群体的相对距离关系。第1 主成分基本上与汉藏群体有正向关系,第2 主成分有反向关系。闽语的各个群体基本上都处于第1 主成分的高端,除了闽东的新数据因为样本太小而偏低以外。这说明这些群体是汉族中较为纯正的群体。特别是闽南的泉州群体,处于最顶端的位置上,几乎与安阳群体重合。所以闽南人从河南东部起源的观点是有较大可信度的。表3 中进一步分析了各个单倍群与主成分的相关关系。可见各个单倍群之间也基本上是相互独立的。与主成分1 和主成分2 的矛盾对立关系相吻合的正是O3e 单倍群,也就是汉族的主要单倍群。所以也进一步证实了主成分1 是与汉族分布正相关的,同样主成分2 与之负相关。福建闽语群体的确是汉族来源为主。主成分分析中我们也注意到,南澳岛的群体是各个群体中保留的汉族成分最少的一个群体。他因为处于偏远的海岛上,可能留有更多的闽越成分。《史记·东越列传》记载,余善杀兄降汉之前,曾与宗族密谋;“今杀王以谢天子,子听罢兵,固一国完。不听乃力战,不胜即亡入海。”出海逃亡是闽越族的普遍观念,所以南澳岛很可能是闽越的一个避难所。也有可能在岛上保留有更早的澳泰群体东迁过程中留下的成分,因为南澳岛处于台湾陆桥的起点。这一地点的O1 成分到底何种来源,可以进一步分析其STR 结构获知。群体之间共享STR 单倍型的情况对判断群体之间的关系很重要。表4 列出了各个单倍群在各群体中发现的个数。南澳岛的多样性并不高,只有两种类型,应该并不是久远的群体扩散年代留下的成分。但是南澳岛的人群由于自然灾害频繁,死亡率高,所以也不能排除古老来源的可能性。南澳的1 个个体与潮阳的一致,其余的4 个个体属于一个东南地区普遍的单倍群。在北部的扬越、瓯越、客家和畲族中都有,台湾西南部的西拉雅族和台湾东南部的排湾族中也有分布。澄海的另一个单倍型也是东越族群的普遍类型,这些成分更有可能是汉族群体在通过北部越人地区时携带下来的。其中几个没有共享关系的单倍型在网络结构中观察其与其他单倍型的关系。这些单倍型与海南的群体有比较明显的关系。看来可能是从广东辗转过来的,但是时间还不能确定。总体看来,闽语人群中少量的O1 单倍群的STR 多样性都非常低,应该不是闽越族留下的成分,而更可能是从广东和浙江重新流入的成分。那么闽越族到底到哪里去了,是不是真的被迁到了江浙地区,有没有其他流散的闽越后代。这将在我们以后的工作中进一步研究分析��
O3e 是汉藏语系人群的高频单倍群, 在其他类群中相对较少。从各地汉族的这一单倍群频率的分布看来,福建汉族和华北汉族的频率最高,浙江汉族最低。这一单倍群在浙江和福建之间又体现出强烈的对比反差,分布方式与O1 正好相反。所以这可能揭示了福建汉族中来自北方汉族的成分要远高于浙江。在之前的研究报道中已经有反映。图4 各地汉族群体中Y染色体O3e 单倍群频率的地理分布图
O3* 单倍群是南方来源族群的普遍类型,在南方各族中,特别是“濮- 蛮- 羌”系统的高频类型。图5 中显示福建汉族的这一频率是各地汉族中最高的,而甘青内蒙一带则大幅降低。这提示北方阿尔泰系统族群的融入可能是造成北方汉族O3 3 频率降低的原因,而江西、福建一带则是汉族成分比较纯正的地区,特别是福建,很少受到外界影响。所以,在汉族之前,闽越族是福建的隔离群体,闽越之后汉族成为福建特殊地形造成的隔离群体。这可能也是汉语各方言中闽语支发展速度最慢的原因之一。
闽南人的主体是北方汉人+一部份苗瑶
O2a 单倍群是中国西南部的特征单倍群,原初的汉族群体可能并没有O2a 单倍群。从图6 中看来,福建南部和广东东部的闽语和客家人群中这一单倍群尤其高频,这一趋势看似从湖广一带蔓延而来,很有可能来自苗瑶系统的畲族。畲族发源自湖广的苗瑶系统,从广东西北迁到广东东南部,在广东东南和汉族群体发生一定的混合。所以这一地区的汉族群体中有高频的O2a 正可能体现了这一结构。闽越基本上在福建失踪了,现代闽语支人群并不是闽越人的后代,而主要是北方汉人后代。齐语支可能是更合适的称呼。为了了解齐语支人群的确切来源,即在北方的更为确切的发源地,我们对福建群体的Y - SNP 数据作了主成分分析。对得到的各个主成分作了相关分析,以了解各个主成分之间的关系,找出成对的矛盾主成分。
主成分2 以后的各个主成分都是完全独立的,没有任何相关性。第一主成分和第二主成分则有较高的相关性,而且是显著负相关。所以第1 主成分和第2 主成分是一对相反的矛盾主成分。我们进一步观察这两个主成分上各个群体的相对距离关系。第1 主成分基本上与汉藏群体有正向关系,第2 主成分有反向关系。闽语的各个群体基本上都处于第1 主成分的高端,除了闽东的新数据因为样本太小而偏低以外。这说明这些群体是汉族中较为纯正的群体。特别是闽南的泉州群体,处于最顶端的位置上,几乎与安阳群体重合。所以闽南人从河南东部起源的观点是有较大可信度的。表3 中进一步分析了各个单倍群与主成分的相关关系。可见各个单倍群之间也基本上是相互独立的。与主成分1 和主成分2 的矛盾对立关系相吻合的正是O3e 单倍群,也就是汉族的主要单倍群。所以也进一步证实了主成分1 是与汉族分布正相关的,同样主成分2 与之负相关。福建闽语群体的确是汉族来源为主。主成分分析中我们也注意到,南澳岛的群体是各个群体中保留的汉族成分最少的一个群体。他因为处于偏远的海岛上,可能留有更多的闽越成分。《史记·东越列传》记载,余善杀兄降汉之前,曾与宗族密谋;“今杀王以谢天子,子听罢兵,固一国完。不听乃力战,不胜即亡入海。”出海逃亡是闽越族的普遍观念,所以南澳岛很可能是闽越的一个避难所。也有可能在岛上保留有更早的澳泰群体东迁过程中留下的成分,因为南澳岛处于台湾陆桥的起点。这一地点的O1 成分到底何种来源,可以进一步分析其STR 结构获知。群体之间共享STR 单倍型的情况对判断群体之间的关系很重要。表4 列出了各个单倍群在各群体中发现的个数。南澳岛的多样性并不高,只有两种类型,应该并不是久远的群体扩散年代留下的成分。但是南澳岛的人群由于自然灾害频繁,死亡率高,所以也不能排除古老来源的可能性。南澳的1 个个体与潮阳的一致,其余的4 个个体属于一个东南地区普遍的单倍群。在北部的扬越、瓯越、客家和畲族中都有,台湾西南部的西拉雅族和台湾东南部的排湾族中也有分布。澄海的另一个单倍型也是东越族群的普遍类型,这些成分更有可能是汉族群体在通过北部越人地区时携带下来的。其中几个没有共享关系的单倍型在网络结构中观察其与其他单倍型的关系。这些单倍型与海南的群体有比较明显的关系。看来可能是从广东辗转过来的,但是时间还不能确定。总体看来,闽语人群中少量的O1 单倍群的STR 多样性都非常低,应该不是闽越族留下的成分,而更可能是从广东和浙江重新流入的成分。那么闽越族到底到哪里去了,是不是真的被迁到了江浙地区,有没有其他流散的闽越后代。这将在我们以后的工作中进一步研究分析��
《中国姓氏 群体遗传和人口分布》
本书共分上下两编共11章,上编4章介绍姓氏的起源和群体遗传学的相关内容,下编7章分别叙述中国100个大姓的历史、分布和图谱。 全书大量有关姓氏的论文,对此进行了系统、深入的研究,内容丰富,条理清晰,结构合理,具有一定的知识性与可读性。
氏,是古代贵族标志宗族系统的称号,从夏朝中期开始,氏成为姓的支系,是私有制社会的特种产物,表示功勋和地位。先秦时女子称姓,男子称氏(郑樵《通志・氏族略》)。
上编 中国姓氏群体遗传<BR>
第一章 绪论<br>
第二章 姓氏分布<br>
第三章 遗传地形图<br>
第四章 姓氏与血型<br>
下编 当代大姓及其分布规律<br>
第五章 华北地区<br>
第六章 东北地区<br>
第七章 华东地区<br>
第八章 西北地区<br>
第九章 西南地区<br>
第十章 华中地区<br>
第十一章 华南地区<br>
主要参考文献<br>
后记<br>
专用名词索引
第一章 绪论<br>
第二章 姓氏分布<br>
第三章 遗传地形图<br>
第四章 姓氏与血型<br>
下编 当代大姓及其分布规律<br>
第五章 华北地区<br>
第六章 东北地区<br>
第七章 华东地区<br>
第八章 西北地区<br>
第九章 西南地区<br>
第十章 华中地区<br>
第十一章 华南地区<br>
主要参考文献<br>
后记<br>
专用名词索引
汉族“南”“北”
血缘大不同
导读:作者:张星海 注释:北京科技报 2004年08月31日 摘要/内容: 早在1929年,我国学者就发现了汉族ABO血型南北人群的差异。近日,中国科学院遗传与发育生物学研究所副研究员袁义达的《中国姓氏:群体遗传和人口分布》一书更是指出,汉族南北之间存在着遗传结构上的差异。以我国南方的武夷山和南岭为界,南北两地的汉族血缘相差甚远,南北两地的汉族血缘比南北两地的汉族与当地少数民族的差距还要大。从生物遗传学的角度讲,我国的汉族只是文化上而非血缘上的完整群体。
中国人最早的ABO血型的正式数
摘要/内容:
早在1929年,我国学者就发现了汉族ABO血型南北人群的差异。近日,中国科学院遗传与发育生物学研究所副研究员袁义达的《中国姓氏:群体遗传和人口分布》一书更是指出,汉族南北之间存在着遗传结构上的差异。以我国南方的武夷山和南岭为界,南北两地的汉族血缘相差甚远,南北两地的汉族血缘比南北两地的汉族与当地少数民族的差距还要大。从生物遗传学的角度讲,我国的汉族只是文化上而非血缘上的完整群体。
中国人最早的ABO血型的正式数据出现在1918年,到目前为止,中科院遗传所的研究人员一共收集了655份有关中国人的ABO血型的国内外文献,共计1818180人。除去少数民族的数据,有关汉族的文献325份,统计学上有效文献305份,计909900人的血型数据。研究人员用这305份的中国汉族ABO血型数据得到了汉族的地域亲缘图。该图表明,南方人群(包括福建、台湾、广东、澳门、香港、广西和海南七省区)同北方人群(除去南方七省区)生物遗传距离比人们想象的要远得多。
由于“姓氏基因”存在,通过对同姓人群迁徙的研究,就可以掌握群体的遗传情况。
汉族南北两地的血缘的差异是如何形成的?袁义达说,要解决这个问题,只有从我们先祖长期的迁移、混居和融合中寻找答案。由于ABO血型是1900年才被奥地利人发现,现在所说的遗传基因更是近几十年的事。那么,要研究1900年之前的汉族群体遗传的情况,一个便捷的渠道就是研究“姓氏基因”。
袁义达说,他们收集了几十年来上百万份血型数据,经过计算机聚类统计分析后发现,不同人群的血样中的血型、酶、蛋白质的区域分布和人们姓氏的区域分布高度一致。这种高度一致当然不是一种偶然性的巧合,它恰恰反映了中国人的姓氏分布与遗传血型的分布存在必然的内在关系。中国人一般都是子女承父姓,这种姓氏的传递方式与代表人类男性的Y染色体的遗传方式相同,而且从研究来看,中国人姓氏的传递是连续和稳定的。这就是说,各个历史时期的同姓人群的分布不但记录了当时社会进化的痕迹,也反映了人类遗传物质在人群中的分化过程。在汉族的社会中,宗族观念根深蒂固,直到1949年前,同姓同宗仍是一种很强的联系纽带。在中国的历史长河中,汉族人习惯于同姓聚集,几姓联宗,这种生活方式的结果就是形成了大大小小的同姓人群。中国同姓人群的历史、数目和规模是中国人特有的社会现象,ABO血型的分布正是受到了同姓人群分布的选择。
汉族南北两地的血缘的差异在宋代已经形成,其分布规律与现代的分布规律基本一致。
袁义达说,他们对不同时期的各省姓氏分布的数据进行生物遗传距离的分析,获得了宋朝、明朝和当代的汉族人群的三张聚类图,从“宋朝姓氏分布的地域亲缘关系聚类图”可以看出,汉族从宋朝开始已经形成了南北二大区域:南部的广东和福建与北部的其余14个省。“明朝姓氏分布的地域亲缘关系聚类图”也非常清楚地把明朝中国人分为南北两大人群,形成福建、广东和广西三省为南方人群,其他14省为北方人群的局面。而且明朝的人群地理分布特征已与当代的分布基本一致,其南北两大异源汉族的地域分界线也应在武夷山和南岭一带,而不是在长江。与宋朝的地域人群分布相比较,广西已与湖南分离而与广东、福建聚类。
“当代姓氏分布的地域亲缘关系聚类图”反映了当代中国汉族的南北两大人群的异源性,以及明显的分界地域在南部的武夷山和南岭一带。29个省区市分为南北两大块,而且其遗传距离很大。南方汉族包括福建、台湾、广东、广西、海南省、香港和澳门。
总之,宋、明、今三个时期的姓氏遗传距离分析结果表明,在中国1000年前的宋朝已经形成了南北两大区域的人群,从姓氏遗传信息上明显地显示出南北两大区域人群结构的区别,表明南北两大区域人群的不同源性,其明显的地域分界线在南方的武夷山和南岭。
中国人姓氏的历史至少已有4000年以上,主要起源于中国西北和中原地区的民族,融合并同化了各个时期周边各民族的姓氏,形成了中国几千年来一直在使用的汉字姓氏。
根据1000年来的中国人姓氏分布和对人群迁移、混居和融合情况的分析,基本上反映了当时的民族联合和进化的历史,也说明了中原地区的人群是组成中华民族的主体,它融合了南北各个时期的民族成分,尤其是北方地区的民族成分,形成了互相依存不可分割的当代的中华民族的整体。当代人群分布的情况基本上与明朝、宋朝人群分布具有很高相似性和渐渐变化的过程,它们之间的区别点正是反映了这1000年期间人群进一步迁移与分化的结果。
汉族南北两个不同的群体形成,是由社会历史的发展、地理上的隔离以及语言的不通等原因造成的。
汉族南北两个区域人群在历史上是怎么形成的呢?袁义达认为,华夏民族在长期的迁移和进化过程中,北方地区主要交往和融合的是北方地区的少数民族,如匈奴、鲜卑、突厥、羌、蒙古等属北蒙古人种的民族。而两广闽台地区主要交往和融合的是南方地区的少数民族,如南越、交趾等属南蒙古人种的民族。
北方地区地形平坦,人群迁移容易,所以,北方人群间的同化和语言统一要比南方地区快。南方地区,特别武夷山和南岭以南,由于丘陵起伏,地形复杂,人群迁移困难,人群间的同化时间长,互相交往困难。长期以来造成地理上的隔离状态,语言变化很大,形成无数的“族群岛”。
袁义达指出,几千年的汉族进化历史也证明南北地区的汉族存在差异,而且是一种群体遗传基因进化上的差异。因为文化上的差异,包括语言上的差异,通过政府的政策和法令,在不长的时间内可以改变或缩小这类差别,这类差别不是根本性的。几千年的不同程度的隔离和遗传基因进化中所造成的不同地区汉族亚群体之间的差异才是本质上的区别。
袁义达,中国科学院遗传与发育生物学研究所副研究员。1985年-1986年,1988年和1992年年在美国斯坦福大学医学院工作,创建了中国姓氏群体遗传学。在国内外共发表了30多篇论文和两部专著。研究方向:1. 中国姓氏群体遗传学的研究。2. 中国人遗传基因多样性和姓氏分布相比较的研究。3. 姓氏群体遗传与疾病在地理分布上相关性的研究。