Vol.138 如何用 DNA 追捕真凶
这是甘肃省白银市。1988 年到 2002 年间,9 名女性曾被残忍地杀害,一名 8 岁的女童甚至被勒死。这些凶案散落在白银的各个角落,为这座处于下岗潮中的西部小城带来了更大的恐慌。
警察在现场搜集到了许多证据,指纹、鞋印、手印一应俱全。然而在比对了 23 万枚当地男子的指纹后,警察依然无法确定凶手的身份。阴影始终盘旋在他的四周,未能散开。
A、T、C、G,这四个简单的英文字母,代表了碱基。它们连接成碱基对,无间隔排列组成了 DNA 序列——一条双螺旋长链。
每个人细胞中携带的 31.6 亿个碱基对,99.9% 都是一样的。剩下 0.1% 的差异,就是让 DNA 成为身份证明的关键。
那么,有没有一种办法让我们可以以小窥大,从局部差异推出整体呢? 有。在人体的 DNA 序列中,不少地方都会发生碱基对的重复排列。2\~6 个碱基对组成核心序列,比如 TCAT,然后重复若干次形成串联重复序列。这种现象被称为 STR,短串联重复。
DNA 序列上出现短串联重复的位置被称为 STR 基因座,又叫位点。在人类的 DNA 序列中,每隔 6000\~10000 个碱基对就会出现一个 STR 位点。
这是部分 STR 位点在常染色体上的分布。以 2 号染色体上 TPOX 位点为例:所有人在这里都会重复地出现碱基 AATG,但重复次数可能存在不同。
在随机抽取的 1000 个人中,只有 323 个人会在这里重复 8 次和 11 次。而当我们再引入四个位点和相应的重复次数时,1000 个人里同时满足这五个条件的只剩下 1 个。
当比对达到 15 个位点时,满足这些条件的概率就只有 0. 000 000 000 000 000 002,足以让它成为法庭科学上的可靠证据来源。
也就是说,如果我们在不同凶案现场收集到的 DNA 信息 STR 位点重复情况一致,说明它们只可能属于一个人。
基于这些检验结果,这起发生在包头的命案和其他 10 起案件一起,在 2004 年被公安部串并列入「甘蒙 8•05 系列强奸杀人残害女性案」。
笼罩在凶手四周的阴影正在被逐渐揭开。但他到底是谁?他现在又在哪里?
这是男性的生殖细胞,精子。它的细胞核里有 23 条这样的染色体。其中 22 条是常染色体,1 条为性染色体。
作为男性特有的性染色体,Y 染色体严格遵循着同一父系遗传规律。是这个家族男性后代共享的身份识别标记。这种通过比对 Y 染色体 STR 特征进行个体识别的做法,被称为 Y-STR。
这一原理给白银案带来了新的突破。
2015 年下半年,一位名叫高某明的男子因行贿犯罪被采集血样。当技术人员检验他的血样时,发现其 Y 染色体 27 个位点上的 STR 情况和白银案凶手完全一致。也就是说,凶手很可能就是这位高某明的族亲。
为此,警察开始从高某明的 DNA 信息出发,找到了甘肃省兰州市青城镇高氏家族,利用家谱、人员信息调查等手段,取得了高某芝后人的名单。通过调查该辈各个男性后代的行动轨迹,警察最终确定重大嫌疑人,52 岁的高承勇。
最后,警察提取了高承勇的 DNA 信息。经 STR 比对,发现与当年遗留在案发现场的 DNA 信息完全一致。
而这份 DNA 信息,会连带凶手的户籍信息,进入公安部数据库。中国从 1998 年起就已开始探索建立区域性的 DNA 数据库,并在 2003 年正式启动建设全国 DNA 数据库,库容量突破 8000 万并不断增加中。
警察只需要将凶案现场遗留下的 DNA 信息放入数据库,就有很大概率得知凶手的具体情况。
但是,如果这位名叫高某明的男子没有出现呢?或者,如果这名凶手是一位没有 Y 染色体的女性呢?
面对这样的难题,警察同样有自己的办法:法医系谱刻画。
我们知道,人类常染色体上的基因,在遗传过程中都会进行分离和重组。父亲染色体中的一段基因,到了儿子身上可能只剩下三分之一,而孙子可能就只继承了十分之一。这些由血亲所共享的基因片段,被称为同源片段(identity-by-descent, IBD)。
两个人共享的同源片段长度越长,说明两者之间的亲缘关系越近。和你共享 IBD 长度最长的人,就是你的父母和孩子。第二长的人就是你的亲生兄弟姐妹。以此类推,IBD 越短,和你的血缘关系也就越远。
现在,我们就可以将你的 DNA 信息导入数据库,然后找到和你共享 IBD 最长的 10 个人,然后根据长度信息构建家谱。
当然,这只是理想情况。由于目前的数据库包含的数据量还很小,因此只能返回凶手的个别亲属信息。
以美国金州杀人案为例,警方先是将犯罪现场提取到的 DNA 放入到数据库中,结果根据 IBD 长度信息,找到了凶手三代表亲。
在找到了这名表亲后,警察就能逆向寻找到和凶手共享的高祖父母,并根据出生、婚姻、死亡记录,建立 25 个可能的家庭谱系,确定 9 名嫌疑人,而 Joseph James DeAngelo 就在其中。
2020 年 8 月 21 日,他被判处终身监禁。而高承勇早在 2019 年 1 月就已被执行死刑。
从白银杀手到金州杀手,DNA 刑侦技术帮我们破解了无数跨越数十年的悬案。在茫茫人海当中,案件的真凶不论深藏在哪些隐秘的角落,犯罪现场的 DNA 都会找到你、抓住你。
-
张振华. (2019). 白银案实录. ↩
-
刘雁军. (2020). 法庭科学DNA数据库的运用与规制. ↩
-
侯一平. (2001). 法医常染色体STR分型. ↩
-
刘京, 季安全, & 王桂强, 等. (2019). 法医系谱分析研究进展. ↩
-
Ellen, M G. Cece, M. Steven, L A. (2019). Genetic genealogy for cold case and active investigations. ↩
-
Erlich, Y. Shor, T. & Carmi, S. (2018). Identity inference of genomic data using long-range familial searches. ↩