利用某人的基因数据,人们能够获得其生理特征,比如眼睛、皮肤和头发的颜色。或许,科学家们很快就能用DNA信息重塑人的整个面部形象。(ShutterStock)

当今是一个“DNA表型”的时代,也就是说,利用某人的基因数据,人们能够获得其生理特征,比如眼睛、皮肤和头发的颜色。随着机器学习技术的应用,有关DNA表型的研究在去年获得了迅速发展,或许,科学家们很快就能用DNA信息重塑人的整个面部形象。

去年,一家名为“人类寿命”(Human Longevity)公司的研究人员详细测定了约1,000人的生理特征。他们将所有的基因组进行排序,并结合数据做出了一些模型,从而能预测3D面部结构、声音、生理年龄、身高、体重、身体质量指数以及眼睛和皮肤颜色。

这项研究受到了很多知名科学家的强烈抵制,包括被称作“基因组黑客”的埃利奇(Yaniv Erlich)。因为该研究只是预测基于性别和血统的“平均脸”,而不是个体的独特脸部特征。而且这种基于少数的种族混合人群的判断方法也备受指责。

在埃利奇看来,即便对面部特征有了准确预测,如果想要用它在现实世界中识别某人,还必须建立一个庞大的数据库,其中应包含想要识别的每一个人的身高、面部形态、数字语音辨识及人口统计资料,否则将无法做到识别个体。

澳大利亚政府目前正在建立这样一个名为“能力”(The Capability)的数据库,也就是生物特征和面部识别系统,它能将闭路电视的录像与护照和驾照的信息相匹配。该数据库开发的初衷只是用于应对恐怖份子,但已有报导说,可能有些公司已经得到了其收费服务。

同时,澳大利亚税务局也刚刚发起一种语音识别服务,如果将其与“能力”项目相结合,澳大利亚就会成为一个利用生物特征与面部识别进行监控的国家。印度目前也在部署名为Aadhar的系统,而中国在面部识别方面更是走在世界前列。

目前的多数法医DNA图谱技术都依赖于“匿名的”、将特征与数据库进行匹配的标记,却几乎无法揭示嫌疑人的其它特征。随着基因组技术的发展,法医们希望在该方面会有所突破。

现在有若干公司在提供DNA表型收费服务,比如Parabon NanoLabs。该公司声称能够利用DNA准确预测某人的生理特征,而且已经服务于警方。但Parabon的能力却受到质疑,因其计算机代码不是开放的,采用的手段也并未公之于众。

对该技术而言,有些特征相对比较容易预测,比如利用较少的几个基因变异就能预测眼睛的颜色。而有些特征则要涉及到许多基因变异,预测起来就非常复杂,如头发的颜色。但随着复杂的机器学习技术在大数据库上的应用,科学家们利用DNA进行面部重塑的能力也会得到显著提升。

其实,使用任何DNA证据都存在造成司法误判的风险。Parabon声称,他们提供的资料需要和其它调查信息结合使用,以缩小嫌疑人范围。该公司还声明说,他们的面部重塑技术不应与面部识别系统一起使用。这些技术在未来相结合并非不可能,但其范围的扩大却会带来基因数据的隐私问题。

如何在未来保护我们DNA数据的隐私性,也就意味着我们需要采取一些方法对其进行伪装,比如基因组的伪装或加密平台等。而人类对遗传密码了解得越多,对基因数据隐私的保护就越为困难。◇

更多文章