已经开发出一种新的强大工具来推进疾病研究

UVA Well being 研究人员开发了一种重要的新工具,可帮助科学家在研究癌症和其他疾病的遗传原因时从噪音中区分信号。 除了推进研究和可能加快新疗法之外,新工具还可以通过使医生更容易检测癌细胞来帮助改善癌症诊断。

由 UVA 的 Chongzhi Zang 及其团队和合作者开发的新工具是一个数学模型,将有助于确保关于我们染色体构建块的“大数据”的完整性,遗传物质称为染色质。 染色质 – DNA 和蛋白质的组合 – 在指导我们基因的活动中起着重要作用。 当染色质出现问题时,它可以将健康细胞变成癌症或导致其他疾病。

科学家们现在可以使用一种称为“单细胞 ATAC-seq”的复杂技术研究单个细胞内的染色质,但这会产生大量数据,包括大量噪音和偏差。 Zang 的新工具不止于此,它可以将科学家从错误的线索和浪费的努力中拯救出来。

张说,在最好的时候,大规模的单细胞基因组研究就像大海捞针。 但是他的新工具可以去除很多坏干草,从而使工作变得容易得多。

“使用传统的数据分析方法,你可能会看到一些看起来像特定染色质状态真实信号的模式,但由于实验技术本身的偏差,实际上是假的。这些假信号会让科学家感到困惑。”我们开发了一种模型更好地捕捉和过滤这些假信号,这样我们正在寻找的真正针头就可以更容易地从吸管中伸出来。”

关于基因组工具

Zang 的新工具采用了一种来自数论和密码学的范式,称为“简单密码学”。 他和他的同事用它来将 DNA 序列编码成数学形式,并最终将复杂的基因组序列转换成更简单的数学形式。 然后,他们可以比较不同的形状,以检测序列数据中使用传统方法无法轻易发现的偏差和噪声。

“随着 DNA 序列变长,其复杂性呈指数级增长。这些集合很难建模,因为一个典型的数据集包含来自数千个细胞的数百万个序列,”张教授实验室的研究科学家 Xingyin Shun Hu 博士说。这项工作的主要作者。“但是由于其优美的数学特性,编码模型 Simplex 可以准确估计序列偏差。”

该工具的测试表明,它在分析复杂的单细胞数据以表征不同细胞类型方面要好得多。 这对于基础生物学研究和疾病诊断都很重要,因为临床医生必须在更大的样本(从数万到数百万个细胞)中检测少量疾病细胞。

这些偏差并不容易发现,因为它们与真实信号交织在一起并隐藏在大数据中。 张说,如果人们只从大量细胞中选择最强的信号,这可能不是什么大问题,他最近共同领导了其他几项研究冠状动脉疾病和肠道发育的单细胞基因组研究。 “但是当你查看单细胞数据时,不再有唾手可得的果实。信号在单个细胞水平上总是微弱的,噪声和偏差的影响可能是灾难性的。偏差校正经常被忽视,但可以对分析单细胞数据至关重要。””。

为了广泛使用他们的新工具,研究人员创建了免费的开源软件并将其发布到网上。 该程序可以在 https://github.com/zang-lab/SELMA 等等 https://doi.org/10.5281/zenodo.7048767.

“我们希望这个工具能够造福于染色质生物学和基因组学研究的生物医学研究界,并最终帮助疾病研究,”张说。 “看到我们的同行使用我们开发的工具在他们的研究中取得重要的科学发现,总是令人兴奋。”

参考: 胡 SS、刘 L、李 Q 等。 使用 SELMA 估计单细胞染色质可及性和簇概况优化分析的内在偏差。 国家共同. 2022; 13 (1): 5533.doi: 10.1038 / s41467-022-33194-z

本文转载自以下 材料. 注意:文章可能已针对长度和内容进行了编辑。 如需更多信息,请联系上述资源。

#已经开发出一种新的强大工具来推进疾病研究

Leave a Comment

Your email address will not be published. Required fields are marked *