Steven Brenner是加州大学伯克利分校的遗传学教授。他的实验室主要涉及计算与实验基因组学的四个主要研究方向:可变剪切的基因调控与无义介导的mRNA讲解;利用贝叶斯系统生物学预测蛋白质功能;医学及环境宏基因组学;结构基因组学与蛋白质复合物。Brenner在Nature网站撰写专栏文章,认为随着基因组学的发展,在未来基因组信息的泄露是无可避免的,同时他还描述了信息泄露的危害以及如何尽量降低泄露带来的危害。全文分享如下。
对于那些将自己的基因组存放在某个研究数据库中的人,大多数美国人要不了多久就会认识他们了。人们对于如何有效控制对这类信息访问的担忧正在日益增长,而科学家们认为限制访问遗传数据会阻碍研究的担忧也同样在增长。距离某个理想主义型的研究者以公开科学的名义而故意向公众公开基因组信息的日子会很远吗?
开放获取文献和开源软件运动都是由理想主义者发起的。在不久的将来,重大的基因组信息泄露事件似乎变得无法避免了。科学家、研究机构以及科研资助方现在就应该考虑,当这一天到临时该如何应对。
在一些研究中,一个单一的分析就已经可以收集到超过50000人的遗传信息。尽管这些信息本该得到严密保护的,但是可以获取这些信息的不同研究机构采用了并不统一的安全与隐私标准。在实际操作中,数据保护工作实际上会落到具体的科学家身上。一旦泄露,这些数据几乎是不可能在受控了。
那么个人数据与遗传数据的泄露会带来什么样的危害?个人基因组项目(Personal Genome Project,PGP)的知情同意书提供给了一个指南。在上面列出了一系列的不良后果,包括泄露个人并非当前父母亲生等个人隐私,以及个人遗传信息被合成后被放在犯罪现场用于栽赃等。
大多数的研究性数据库中的信息都是匿名的,但是随着将这些数据重新与个人信息对应起来,以及商业遗传数据库的发展,事情还会这样吗?被破解匿名状态的遗传信息最有可能泄露与研究相关的个人健康状况。泄露带来的影响可能令人不快,不过泄露信息的量可能并不会比你的上网历史记录所能泄露的多。到目前为止,还没有PGP的参与者向伦理委员会报告因为公开基因组及其他信息而遭受不良后果。但是从长期来看,随着我们对遗传变异理解的深入,风险将会上升。
如此一来可能会引发有关侵犯基因组的舆论哗然。公众常常会夸大对基因与个人信息之间关系的认识。由于不懂相关的知识,研究的参与者会怀疑自己的基因组是否已经被泄露,并开始担心那些自己都想象不到的恐怖后果。
这样,基因组泄露可能导致巨大的反弹。志愿者会退出研究,再也不会参加新的研究。研究工作可能会遭遇暂停和禁止性限制。这对遗传学研究的伤害是巨大的。
那怎么办呢?有两个极端的方案因为简单而颇具吸引力。一个方案就是研究项目对那些一开始就不受限制的数据进行整合。这个方案由于其确定性以及所带来的研究优势,而会被广泛采用。但问题是会有那么多人愿意公开共享自己的信息吗?第二个方案则是对基因组进行严密的封闭,使其几乎无法泄露,所有需要利用这些数据的人都只能通过中央计算机的受限界面进行分析利用。这个方案看起来也不错,但是它所提供的对数据访问的方式具有排外性,因而可能会阻碍研究,同时它还容易诱发对遗传数据的不当利用。
由于这两个方案的都不是完全可行,也就意味着所要解决的问题不是如何防止信息泄露,而是如何降低泄露后的影响。这需要些具体的步骤,以及在观念改变上的进步。
研究资助机构应该建立快速反应机制,一旦信息泄露后可快速通知研究参与者、政府以及媒体,并向受影响者提供有关影响范围及后果的可靠知道。这可能需要重新联系那些研究参与者并警示他们哪些人的数据已经泄露了,同时抚慰那些数据未被泄露的人。此外,还需开展有关此类泄露可能带来的危害的研究,以便更好地在泄漏发生前后通知并保护研究参与者。
同时我们还应该采取措施将未来基因组泄露的频率及程度降到最小。研究所可以建立统一的协议和评审机制以全包受保护的遗传信息的安全。所有需要使用受限遗传信息的研究者都应该接受有关人类数据保护相关的伦理及技术培训。积极部署技术及法律策略,用于限制已泄露数据向那些试图窃取这些信息的人。
增强法律保护有助于降低对此类数据滥用而带来的危害。同时,我们还需要解决一个窘况:利用泄露的数据毫无疑问也会加快科学的进程,但是科学家可以利用这些泄露的数据吗?
最重要的是,我们必须确保在讨论基因组信息泄露风险的时候不能忘了遗传信息收集所带给我们的巨大利益。尽管基因组学的加速发展及其前景使得泄露是无可避免的,但是它也是医学发展的保障。