Nature子刊:基于AI的预测模型,可快速发现基因组中的致癌突变(2)
2023-07-14 来源:飞速影视
自从20多年前人类基因组被测序以来,研究人员一直在搜索基因组以试图找到导致细胞不受控增殖或逃避免疫系统的致癌突变,并已成功产生了诸如表皮生长因子受体(EGFR)和 BRAF 等靶点。EGFR 通常在肺部肿瘤中发生突变;BRAF 是黑色素瘤的常见驱动突变。这两种突变现在都可以被特定药物靶向。然而,蛋白质编码基因只占基因组的 2% 左右,另外的 98% 也含有可能在细胞中发生的突变。因此,很难弄清楚非蛋白质编码区域的突变是否与癌症发展有关。
在这项新研究中,研究人员发现,在5-10%的癌症患者中,整个基因组的突变似乎都有助于肿瘤的生长。研究团队表示,这些发现可以帮助医生确定更有可能成功治疗患者的药物。目前,至少30%的癌症患者没有可检测到以用于指导治疗的驱动突变。
该研究通讯作者、Bonnie Berger 教授说:“我们确实缺乏能在蛋白质编码区域之外搜索驱动突变的计算工具。这就是我们现在做的事情:设计一种计算方法,不仅可以查看基因组中 2% 的蛋白质编码,而且还要查看 100% 的蛋白质。”
为此,研究人员根据来自37种不同类型癌症的基因组数据对 Dig 进行训练,以寻找发生频率比预期更高的突变,从而确定每种癌症的背景突变率。用于训练 Dig 的数据集来自“表观基因组学路线图项目”( Roadmap Epigenomics Project )和“泛癌症全基因组分析”( Pan-Cancer Analysis of Whole genome, PCAWG )。Dig 对这些数据的分析为研究人员提供了一幅整个基因组中预期乘客突变率的景观,这样,任何一组区域的预期突变率都可以与整个基因组中任何位点观察到的突变进行比较。
使用 Dig 预测,研究人员还可以增加已知导致癌症的潜在突变情况。目前,当对癌症患者的肿瘤进行致癌突变筛查时,大约三分之二的情况下会出现已知的驱动突变。这项新研究结果为另外5-10%的患者提供了潜在驱动突变。
此外,研究团队关注的一种非编码突变是“隐性剪接突变”,该突变被发现存在于内含子中。内含子(Intron)是真核生物编码基因转录的 mRNA 中被剪切掉的非编码片段。真核生物的编码基因通常由编码蛋白质的外显子和不编码的内含子组成。隐性剪接突变可以扰乱剪接它们的细胞机制,从而导致mRNA成熟过程中的剪接错误。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号