生命科学与技术学院张勇团队开发机器学习方法解析生物大分子凝聚体的全基因组图谱,研究成果发表于《自然·通讯》
来源:生命科学与技术学院
时间:2024-08-16 浏览:
生物大分子凝聚体在细胞功能中扮演着至关重要的角色,它们通过聚集蛋白质或核酸分子,形成较为稳定的独立区域。与染色质相关的生物大分子凝聚体,是近年细胞生物学研究的一个热点。众多研究已经揭示,这些凝聚体与染色质的活动—如基因转录和表观遗传修饰—有着密切的联系。尽管如此,对于生物大分子凝聚体在全基因组尺度的定位图谱,包括基因组上各种凝聚体的种类和具体位点,目前尚缺乏系统性的研究和解析。
8月13日,同济大学生命科学与技术学院张勇课题组与临港实验室朱光亚课题组合作在《自然·通讯》(Nature Communications)上发表了题为“Decoding the genomic landscape of chromatin-associated biomolecular condensates”的文章,开发了预测染色质关联生物大分子凝聚体全基因组图谱的机器学习方法CondSigDetector。
张勇课题组开发了一种名为CondSigDetector的新方法,旨在探测生物大分子凝聚体的全基因组定位图谱。这一方法利用了生物大分子凝聚体的核心特性—通常由多种蛋白质通过协同作用形成。CondSigDetector分两个步骤执行:首先,通过整合特定细胞类型中的染色质相关蛋白的ChIP-seq数据,构建主题模型来识别这些蛋白在基因组上的特异性共定位模式。随后,利用公共数据库中的数据,结合这些蛋白的凝聚物理化学性质,评估这些共定位模式组成凝聚体的潜能。具有高凝聚潜力的共定位模式被识别为CondSigs(Condensate-like chromatin-associated protein co-occupancy Signatures)。这些CondSigs不仅提供了组成凝聚体的蛋白信息,还指明了这些凝聚体在基因组中的具体位点。在对小鼠胚胎干细胞和人类K562细胞进行了大规模预测后,张勇课题组与朱光亚课题组合作,对两个新发现的CondSig进行了详细鉴定。这些研究验证了这些凝聚体在细胞内的具体组成和定位,进一步证实了CondSigDetector方法的有效性和实用性。
同济大学张勇教授和临港实验室的朱光亚青年研究员为论文的共同通讯作者,同济大学博士后余招伟、助理教授王琪和长海医院主治医师张启晨为共同第一作者。该研究工作得到了国家自然科学基金委、科技部、上海市科委的支持。
论文链接:https://doi.org/10.1038/s41467-024-51426-2