摘要
通过机器学习HSE大学的研究人员发现了两种最普遍的DNA结构——茎环和四丛结构——会导致基因组突变,从而导致癌症……
通过机器学习HSE大学的研究人员发现了两种最普遍的DNA结构——茎环和四丛结构——会导致基因组突变,从而导致癌症。研究结果发表在BMC癌症杂志上。

21世纪初,研究人员发明了一种获取DNA和RNA核苷酸序列的新方法——下一代测序(NGS)。这项技术允许同时读取数百万个基因组区域,这在早期的测序方法中是不可能的。现在,人类基因组(遗传信息)可以记录在一个大约3.2 Gb的文本文件中。
本研究的作者之一、HSE生物信息学实验室的负责人Maria Poptsova解释说:“癌症是一种基因组疾病,当我们对肿瘤组织中的基因组进行测序时,我们会看到一系列不同的突变。可能存在点突变或大规模突变。例如,在点突变中,一个核苷酸消失,被另一个取代。我们观察了大规模的突变,基因组的某些部分(从数个到数百万个核苷酸)被删除、逆转、复制并插入到不同的位置。由于这些重新排列,基因组断点出现。
HSE大学的研究人员利用机器学习研究了两种类型的DNA二级结构-茎环和四丛-对基因组断点的影响。作者分析了10种癌症的2000多个基因组中的50万个断点。研究人员寻找基因组热点,认为断点热点是频繁和反复重新排列的区域——换句话说,风险区域。结果表明,基于茎环的模型能较好地解释血、脑、肝和前列腺癌的断点热点剖面,而基于四神经丛的模型对骨、乳腺癌、卵巢癌、胰腺癌和皮肤癌具有较高的性能。
断点的出现不能完全由DNA二级结构的影响来解释,但它们的贡献至少在20-30%。分析表明,茎环和四丛对突变点进化的影响取决于组织类型,这是由表观遗传因素决定的。
Maria Poptsova说:“这是一种标记,可以区分基因组中不同种类的组织。”“我们正在积极研究次生DNA结构和表观遗传标记之间的关系。英国研究人员已经研究了DNA二级结构和表观遗传标记对点突变的影响。我们专注于断点热点,并首次确定了两种最广泛的基因组结构——茎环和四丛的贡献。”
根据这项研究的作者,在未来,四神经丛可能被用作治疗目标。如果药物治疗使它们更稳定,端粒酶就不能在癌细胞中发挥作用,它们就会变得脆弱。
来源:Medindia
此文系悬壶济世网原创整理,没有授权,请勿转载!