Ai矿山现有的Biobanks为想象中的人类产生现实基因组

染色体从随机数字噪音中出现。

机器,由于电脑技术的新算法和进步,现在可以学习复杂的模型,甚至产生高质量的合成数据,如照片 - 现实图像,甚至是想象中的人类。最近在国际期刊PLOS GEATECS期刊上发表的一项研究使用机器学习来挖掘现有的BIOBANK,并产生不属于真实人类但具有真实基因组特征的人类基因组的大块。

“现有的基因组数据库是生物医学研究的宝贵资源,但由于有效的道德问题,它们不公开可访问或屏蔽冗余的申请程序后面。这为研究人员创造了一个主要的科学障碍。当达图大学现代人口遗传学研究和初级研究研究员的第一个作者,可以帮助我们在安全的道德框架内克服这个问题,从而帮助我们克服了安全的道德框架。“

发电机机器在鉴别器机器测试所生成的数据的情况下,将生成的数据塑造在可用实际数据的数据库中。一旦进程完成,算法将生成看起来像真实的人工数据,但实际上是完全新的。

PluidIsCISINARINARINARES与真实的团队进行多次分析以评估所生成的基因组的质量。“令人惊讶的是,这些基因因子从随机噪声中出现,模仿我们可以在真实人群中观察的复杂性,并且对于大多数属性,它们与我们用于训练我们的算法的BioBank的其他基因组不区分,除了一个细节,除了一个细节:他们这样做不属于任何基因捐助者,“Luca Pagani博士说,该研究的高级作者之一和Mobilitas Plus Plower。

该研究另外涉及评估人工基因组对实际基因组的邻近,以测试原始样品的隐私是否保存。“虽然在大海捞针中寻找成千上万的基因组中的检测隐私泄漏可能会像在干草堆中寻找针一样,但结合了多种统计措施使我们能够仔细检查所有模型。令人兴奋的是,复杂泄漏模式的详细探索可以导致生成式模型评估和设计的改善,并将燃料恢复机器学习领域,“跨学科计算机科学实验室的研究和CNRS研究人员博士博士( LRI / LISN,UniversitéParis-Saclay,法国国家科学研究中心)。

总而言之,机器学习方法已经为少数想象的人类提供了面孔,传记和多个其他特征:现在我们更多地了解他们的生物学。这些具有现实基因组的虚构人类可以作为所有实际基因组的代理,这些实际基因组不公开或需要长期应用程序或合作,因此去除基因组研究中的重要可访问性屏障,特别是对于强名的群体。

参考:“使用生成神经网络创造人造人类基因组”由朱氏yelmen,aléliendecelle,琳达ongaro,戴维德·马奈塔托,科伦特·莫妮塔,科伦西文·蒙内诺,塞内乐·蒙内罗,卢卡·格萨尼和植物群杰拉·杰伊,2月4日,卢克斯遗传学.DOI:
10.1371 / journal.pgen1009303

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。