智能
一个免费的家谱网站是怎么变成革命性的破案工具的?
“我一点也不会担心谁的隐私会受到侵犯,因为有太多人的 DNA 信息促成了案件侦破。”
*本文只能在《好奇心日报》发布,即使我们允许了也不许转载*
佛罗里达州莱克沃思电 — 1996 年万圣节之夜,一个戴骷髅面具的男子敲开了加利福尼亚州马丁内斯(Martinez)一栋房屋的门,给前来迎接的女子戴上手铐并强奸了她。两周后,男子打电话到她工作的牙科诊所。调查人员试图通过电话记录找到他,但什么也没找到。他们获取了男子精液留下的痕迹,但在任何犯罪数据库中都找不到匹配他 DNA 的信息。
上个月,在罪案发生 20 年后,萨克拉门托地方检察官办公室尝试了新方法,最终破获了这起连环强奸案(在这起案件中,至少 10 名妇女在家中遭到了袭击)。调查人员将施暴者的 DNA 变成类似家庭史网站(如 23andMe)的个人档案,并上传到GEDmatch.com。它是一个向所有人开放的免费网站,可以用来寻求生物学上的亲属或者制作详细的家族谱系,很受家谱研究者们青睐。
调查人员只花了不到五分钟浏览结果,就在网站数据库中大约一百万份资料中找到了一个近亲。两个小时之内,他们就有了嫌疑犯,并很快逮捕了他:加州大学伯克利分校的安全专家罗伊·查尔斯·沃勒(Roy Charles Waller)。
这次逮捕标志着 GEDmatch 第 15 次为寻找谋杀或性侵案件嫌疑人提供重要线索,第一件是帮助警方在 4 月逮捕了臭名昭著的“金州杀手”(Golden State Killer)、前警员约瑟夫·詹姆斯·迪安杰洛(Joseph James DeAngelo)。在 1970 年代和 1980 年代,他在加利福尼亚州全境犯下多起强奸案和谋杀案。
对此,没人比 GEDmatch 的两位创始人——80 岁的柯蒂斯·罗杰斯(Curtis Rogers)和 67 岁的约翰·奥尔森(John Olson)——更感到惊讶了。退休商人柯蒂斯穿着白色魔术贴运动鞋,很容易被误认为是个低调的佛罗里达老爷爷,而约翰则是得克萨斯州的一位运输工程师。他们这个从兼职项目开始的小网站,无意中颠覆了全国调查人员破解最棘手悬案的方式。
根据上周四发表在《科学》杂志上的一项研究,在三年内,几乎每个北欧血统美国人的 DNA 都可以通过 GEDmatch 数据库中的表兄弟姐妹和堂兄弟姐妹来识别,这些人是该网站的主要用户。
“事情的发展让我们大家都非常震惊”,罗杰斯表示,他因寻找自己的家族史而被家谱研究所吸引,“突然间声名狼藉。”
奥尔森表示赞同:“我觉得就像上了一辆高速行驶的车,但却无法控制它。”
自迪安杰洛被捕以来,从华盛顿州到佛罗里达州的执法机构都向该网站寻求帮助,以破解数十年未解的悬案。它也越来越多地被用在最近的案件中。
最初,对执法部门使用他的网站一事,罗杰斯怒火中烧,但现在却颇为自豪。
“我认为,在一年之内大家就能接受这种做法了,”他说。然而,一些系谱学家认为这种想法问题严重,因为调查人员依靠私人家族史网站破案,已经引发了许多道德及隐私问题。
总部之旅
GEDmatch 的总部在佛罗里达州莱克沃思一幢黄色小房子里,装着松石绿色百叶窗,围着白色栅栏,院子里有一棵棕榈树。这是罗杰斯第一次带记者参观公司总部。简短的参观之旅始自他的办公桌,也是房里唯一的办公桌。他每天从家里开半小时车过来。
他的合伙人奥尔森在得克萨斯州家中工作。三个退休计算机科学家有时会提供远程协助。公司没有其他员工,但有一只毛茸茸的白猫。
走过浴室,有一间屋子,装满了罗杰斯妻子的画作和贴着标签的盒子,是他同时还是职业监护人的证据。
根据遗传学研究人员最近的两项分析,GEDmatch 数据库当前可以通过其表兄弟姐妹和堂兄弟姐妹识别至少 60% 的欧洲血统美国人。但与 23andMe 及其他大型家谱网站不同,GEDmatch 没有实验室。这个网站不如说是一个让已经在其他地方分析过 DNA 的人找到更多亲人并深入了解自己祖先的地方。
一些 GEDmatch 用户是家谱完美主义者,他们就像有些人收集棒球卡一样收集表兄弟姐妹和堂兄弟姐妹。还有一些用户是挖掘古老家庭奥秘的退休老人。其他用户中有许多是被收养者和帮助他们使用该网站工具来找到亲生父母的家谱学家。根据两位教人们如何进行此类搜索的家谱学家的说法,在过去八年中,这种在网站上寻亲的用户可能有超过一万人。
从设计美学上来说,GEDmatch.com 就像个需要更新的公司内部维基百科。但它为研究人员和刑事调查人员提供了极大的灵活性。目前,家谱数据库中有超过 1700 万个 DNA 档案,但大多数较大的网站就上传内容做出了限制,不仅禁止上传犯罪现场的证据,还禁止上传由外部实验室处理的任何内容。
GEDmatch 则什么都接受:不起眼的实验室处理的血液, 23andMe 分析过的口水,全都免费,只要格式正确就行。
该网站对于制作全面家族史的人们也很有用。普通人可以在现有系谱网站上找到任意数量的表兄弟姐妹和堂兄弟姐妹。但对于基因检测员而言,关键在于弄清楚这些亲人是如何确切地与某个人相关联、以及如何彼此相关的。奥尔森创建了大量的工具,主要是因为他觉得数学很有意思,这些工具能让用户看到亲人与自己重合的精确遗传片段。从该网站的 100 万左右的个人资料档案中,熟练的基因检测员通常可以从一个匹配的第三代表亲弄清楚一个人的身份。
“你找不到和它类似的网站,”使用该网站帮助破解金州杀手案的遗传家谱学家芭芭拉·雷-文特尔(Barbara Rae-Venter)说。
这样使用 GEDmatch 并不简单。大多数将犯罪现场证据上传到网站的调查人员仍然需要雷-文特尔博士等非常熟练的遗传家谱专家的帮助。DNA 只是第一个线索,从这里开始,必须使用其他类型的数据来填写家谱,包括社交媒体资料和出生记录。不过,对于那些知道自己在做什么的人来说,有的时候,在不到两天内找出谋杀案嫌疑人或找到被收养人的亲生父母也是可能的。
当我看着罗杰斯在破旧的东芝笔记本电脑上“秒回”客户服务邮件时,这一切都难以捉摸。
“我只要放一天假,就会永远赶不上进度,”他说着,把穿着运动鞋的双脚放在人造革转椅的底座上。
他向无法上传文件的用户发送了一份 15 步指南,这是他每天回复的众多基本技术支持邮件之一。其他常见问题包括:这是否意味着我父亲其实不是我亲生父亲?
他办公桌上有一堆 10 美元的支票,这是罗杰斯每月为网站收取的“一级会员费”(从技术上来说,网站是可以免费使用的)。到目前为止,GEDmatch 拥有大约 6500 名成员,足以支付基本开支并给创始人们一点点回报。
罗杰斯早年从事商业,为好乐门蛋黄酱和桂格等品牌培养国际消费者群。他知道自己可以向用户收更高的费用。但他表示,这么做感觉就不对了,因为家族史研究的目标是帮助大家,这种情感在热忱的家谱学家中很常见。

“超现实”是帮助建立 GEDmatch 的交通工程师约翰·奥尔森(John Olson)经常用来形容过去几个月的词。
追溯到拓荒者时期
在成长的过程中,罗杰斯总听说自己与 1620 年乘五月花号来此的那个托马斯·罗杰斯(Thomas Rogers)有关系。为了查清此事,他就此开始钻研家谱学。
结果,两人之间没有任何关系。但从那起,罗杰斯掉进了家族史的兔子洞。不久,他着手运营一个与他同姓人群的在线家谱项目,并开始寻找程序员,好让绘制远亲关系变得更容易一些。
家谱项目中的另一个罗杰斯将他介绍给了奥尔森,他很乐意帮助热情的罗杰斯。而且,对于这个习惯于解决复杂交通信号难题的工程师而言,罗杰斯的编程请求很容易。
两人合作得很好,2010 年他们决定开始罗杰斯姓氏之外的项目,推出了 GEDmatch.com,为家谱学家使用的家谱文件 GEDcom 提供参考,GEDcom 还是家谱数据通信(genealogical data communication)的缩写。
大约在这个时期,许多家谱公司已经开始提供常染色体 DNA 检测,这是一种有助于寻找亲属的遗传分析。
罗杰斯问奥尔森,是否可以用所有这些数据做点什么。
罗杰斯说:“我认为这对他来说是个挑战,然后他好像着了迷。”
他们表示,不久,在没做任何广告的情况下,数据库的规模已经逐年翻番。
令罗杰斯继续投资该网站的,是那些“给 GEDmatch 的情书”,跟他见过的所有客户服务留言不同,“大家真的很喜欢好乐门蛋黄酱”。
罗杰斯的道德困境
4 月 25 日,萨克拉门托县地方检察官办公室宣布,金州杀手案件取得了突破性进展。
罗杰斯坐在床上看电视时看到了这个消息。
“在他们抓住这个家伙之前,我从来没有听说过金州杀手,”他说。
但当一位主播提到“新的 DNA 技术形式”时,他转向妻子问道:“你认为会涉及我么?”
似乎有可能。大约六个月前,两家参与案件调查的公司向他申请了网站使用许可。
执法机构拥有自己的犯罪调查数据库:Codis(DNA联合索引系统)拥有超过 1600 万份 DNA 数据档案。然而,法医档案仅包含家谱网站所依赖的数十万种遗传标记中的一小部分。如果调查人员无法在那里找到完全匹配的信息,GEDmatch 这类网站更合适用来通过血亲追踪嫌疑人。
该网站的隐私协议一直含糊不清,主要表明了网站所有者无法控制任何个人的遗传或家谱数据会如何被使用。但明确允许执法机构的存在,网站给人的感觉就变得不太一样了。
“我可能无法阻止你们(使用网站),”他说,他告诉法医咨询公司 Parabon 和专门做尸体识别的组织 DNA Doe Project,“但我们不能给你们许可。我必须保护这个网站。”
罗杰斯为什么改变了想法

罗杰斯(左)和奥尔森 10 月在得克萨斯的一次罕见会面。罗杰斯称自己负责运营网站的“商业部分”,奥尔森则表示,自己负责的是“科学部分”。
当罗杰斯确认第三组调查人员在没有事先告知的情况下把 GEDmatch 用在了金州杀人案侦破中时,他感到十分愤怒。这个消息似乎难免会使成千上万人离开这个网站。
在他带我参观屋子时,罗杰斯递给我那之后第一个星期收到的一叠邮件。最上面那篇留言满篇咒骂,指责他侵犯了用户隐私。但那下面,是一封又一封的贺信。一封贺信中,一位女士请求确保调查人员能轻易看到她的个人档案,因为她的父亲曾在杀死她爷爷之后多次进出精神病院,而她怀疑父亲还背着别的命案。
罗杰斯和奥尔森没想到会得到如此多的支持。奥尔森说,他们也完全没料到,在迪安杰洛被捕后不久,网站接到了 5000 次新的上传,创造了每日最高纪录。
两周后,Parabon 宣布与遗传家谱学家赛赛·摩尔(CeCe Moore)联合使用 GEDmatch 侦破刑事犯罪。
“如果约翰和柯蒂斯没有勇气允许执法部门使用这个数据库,这根本不可能实现,”摩尔说,过去五个月,她用该网站确定了十几名谋杀和性侵案件嫌疑人。
赞扬之声源源不断,两人都开始放松下来。到五月份,他们调整了隐私协议,明确提到用户的个人资料可能会用于谋杀或性侵案件调查。到了九月,任何挥之不去的疑虑都消失了。
罗杰斯说:“我一点也不会担心谁的隐私会受到侵犯,因为有太多人的 DNA 信息促成了案件侦破。”
但许多观察家不同意。旧金山州立大学的罗里·罗尔夫(Rori Rohlfs)教授从事过与家族相关的研究,她表示,当任何一个人的 DNA 可以展示给调查员一个嫌疑人的数百名亲属时,个人同意的标准模式就不成立了。她觉得讽刺的是,加利福尼亚州的警察必须得到法官批准,才能搜索犯罪数据库中的谋杀嫌疑人的兄弟,但将 DNA 信息上传到 GEDmatch 来寻找表亲却没有任何限制。
一些研究人员警告说,对尚未审判的案件抱有的激动情绪也有可能强化 DNA 匹配即可证明嫌疑犯有罪的观点。
一些家谱学家表示,最近的事态发展导致许多非洲裔美国人因为担心刑事调查人员可能滥用这些数据而退出该网站。
“由于许多非洲裔美国人曾被诬告,再加上基因检测并不是完美的科学,我们不应该允许执法部门使用 GEDmatch,”芝加哥非裔美国人系谱和历史学会(Afro-American Genealogical and Historical Society of Chicago)前主席托尼·巴勒斯(Tony Burroughs)说。
家庭史学家特雷莎·韦加(Teresa Vega)表示,这些用户的退出特别可惜,因为该网站是帮助因奴隶制而分离的家庭重聚的最佳工具之一。
奥尔森说,在越来越多的执法机构开始尝试遗传谱系的同时,GEDmatch 数据库每天增加约 1800 个档案。
“我不喜欢它,我一点也不喜欢它,”罗杰斯的妻子、艺术家珍妮特·西格尔·罗杰斯(Janet Siegel Rogers)说。当时,我的参观之旅已经转移到了她的工作室,我们三个坐在一起喝着酒。
“你不喜欢什么?”罗杰斯问。
结果,她不喜欢丈夫回邮件的习惯。
“他每周 7 天 24 小时都在回邮件,”她感叹道。
她这么说着的时候,一旁的罗杰斯喝了一口酒。
从他留在玻璃上的唾液痕迹,熟练的遗传家谱学家可以用他的网站来揭示他的姓名和十几个近亲,也有可能确定,他虽然与任何美国拓荒者无关,实际上是维京人的后裔。
翻译:熊猫译社 王满地
题图及文内图片版权:Scott McIntyre for The New York Times
© 2018 THE NEW YORK TIMES
原文链接 (已下线): https://www.qdaily.com/articles/57490.html
Wayback 快照: http://web.archive.org/web/20181024235925/http://www.qdaily.com:80/articles/57490.html
原始截图: http://ww3.sinaimg.cn/large/007d5XDply1g3y5jdp3kej30u07rse83