用心打造
VPS知识分享网站

谷歌人工智能工具可精准识别癌症的遗传驱动因素

谷歌宣布推出DeepSomatic,这是一种人工智能工具,可以更准确地识别肿瘤基因序列中与癌症相关的突变。

癌症源于控制细胞分裂的机制失调。找到驱动肿瘤生长的特定基因突变对于制定有效的治疗方案至关重要。现在,医生会定期对活检样本中的肿瘤细胞基因组进行测序,以指导针对特定癌症生长和扩散机制的治疗方案。

这项研究发表在《自然生物技术》杂志上,展示了一种利用卷积神经网络识别肿瘤细胞遗传变异的工具,其准确率高于现有方法。谷歌已将 DeepSomatic 及其创建的高质量训练数据集公开。

谷歌人工智能工具可精准识别癌症的遗传驱动因素

体细胞变异的挑战

癌症遗传学非常复杂。虽然基因组测序可以发现癌症基因变异,但区分真正的变异和测序错误却非常困难,而人工智能工具可以提供帮助。大多数癌症是由出生后获得的“体细胞”变异驱动的,而不是从父母遗传的“生殖细胞”变异。

当紫外线等环境因素损伤DNA,或DNA复制过程中出现随机错误时,就会发生体细胞突变。当这些变异改变正常的细胞行为时,它们会导致细胞复制失控,从而促进癌症的发生发展。

识别体细胞变异比寻找遗传变异更难,因为它们在肿瘤细胞中存在的频率很低,有时甚至低于测序错误率本身。

DeepSomatic 的工作原理

在临床环境中,科学家会对活检样本中的肿瘤细胞和患者的正常细胞进行测序。DeepSomatic 能够发现其中的差异,识别出肿瘤细胞中非遗传性的变异。这些变异揭示了肿瘤生长的动力。

该模型将来自肿瘤和正常样本的原始基因测序数据转换为代表各种数据点的图像,包括测序数据及其沿染色体的比对。卷积神经网络分析这些图像,以区分标准参考基因组、个体正常的遗传变异和致癌体细胞变异,同时过滤掉测序错误。输出是与癌症相关的突变列表。

当无法获得正常细胞样本时,DeepSomatic 也可以在“仅肿瘤”模式下工作,这种情况在白血病等血癌中很常见。这使得该工具适用于多种研究和临床场景。

训练更精确的AI癌症研究工具

训练精准的人工智能模型需要高质量的数据。谷歌与其合作伙伴——加州大学圣克鲁斯分校基因组学研究所和美国国家癌症研究所——共同为其人工智能工具创建了一个名为“CASTLE”的基准数据集。他们对四个乳腺癌样本和两个肺癌样本中的肿瘤细胞和正常细胞进行了测序。

这些样本使用三个领先的测序平台进行分析,通过整合结果并消除平台特有的误差,创建了一个单一、准确的参考数据集。数据显示,即使是同一种癌症类型,也可能存在截然不同的突变特征,这些信息有助于预测患者对特定治疗的反应。

DeepSomatic 模型在所有三大测序平台上的表现均优于其他成熟方法。该工具擅长识别复杂的插入和缺失突变(Indel)。对于这些突变,DeepSomatic 在 Illumina 测序数据上的 F1 得分高达 90%,而排名第二的方法仅为 80%。在 Pacific Biosciences 数据上,DeepSomatic 的得分提升更为显著,超过 80%,而排名第二的工具得分不到 50%。

在分析高难度样本时,AI 表现优异。测试样本包括用福尔马林固定石蜡包埋 (FFPE) 保存的乳腺癌样本,这是一种常见的保存方法,但可能会引入 DNA 损伤并使分析变得复杂。此外,还对全外显子组测序 (WES) 数据进行了测试,WES 是一种更经济的方法,仅对编码蛋白质的 1% 基因组进行测序。在这两种情况下,DeepSomatic 的表现均优于其他工具,表明其在分析低质量或历史样本方面具有实用价值。

适用于所有癌症的人工智能工具

这款人工智能工具已证明,它可以将学习成果应用于它从未训练过的新型癌症类型。在分析胶质母细胞瘤(一种侵袭性脑癌)样本时,它成功找出了已知的少数致病变异。在与堪萨斯城儿童仁慈医院合作分析了8个儿童白血病样本后,尽管只分析了肿瘤样本,它仍然发现了先前已知的变异,并鉴定出10个新的变异。

谷歌希望研究实验室和临床医生能够采用这一工具来更好地了解个体肿瘤。通过检测已知的癌症变异,它可以帮助指导现有疗法的选择。通过识别新的变异,它有望催生新的疗法。目标是推进精准医疗,为患者提供更有效的治疗方案。

赞(0)
未经允许不得转载;国外VPS测评网 » 谷歌人工智能工具可精准识别癌症的遗传驱动因素
分享到