科研进展

人工智能赋能空间转录组数据的计算与解析研究获进展

日期: 2023-10-24

|  来源: 【字号:

细胞在组织和器官内的空间位置,对其发挥特定功能颇为重要。近年来,快速发展的空间转录组(Spatial Transcriptomics)技术能够同时测量生物组织切片空间位点的基因表达和空间位置信息,为研究人员破译组织的空间结构,探讨周围环境对细胞基因表达的影响提供了条件。中国科学院数学与系统科学研究院张世华团队借助人工智能赋能空间转录组数据的计算与解析,开发了STA-系列工具。2022年,张世华团队在《自然-通讯》(Nature Communications)上发布了适应于不同空间转录组技术、不同生物组织的生物组织空间亚结构识别的人工智能工具——STAGATE(该工作入选2022年度“中国生物信息学十大进展”)。    

随着空间转录组测序数据的持续积累,整合分析不同条件下产生的数据可以提供单个数据无法获取的生物学见解。然而,这些不同来源的数据之间会存在不可避免的批次效应。消除批次效应且保留不同批次之间真实存在的生物学差异,是实现数据整合的主要挑战。尽管目前的单细胞转录组数据整合方法可以用于多切片整合,但由于没有考虑空间信息,聚类结果易受技术噪声影响,缺乏清晰的空间边界,且易过度离散。     

10月12日,张世华课题组在《自然-计算科学》(Nature Computational Science)上,发表了题为Integrating spatial transcriptomics data across different conditions, technologies, and developmental stages的研究论文。该工作针对来自不同技术、不同发育时间点、不同疾病条件的生物组织多切片空间转录组数据建立了整合分析新工具——STAligner。《自然-计算科学》主编Fernando Chirigati评论道,“张世华及其同事提出的工具是整合多样本的一种很有前途的资源,我希望它能帮助研究人员在进行空间转录组学分析时发现新的重要生物学见解。” 美国俄亥俄州立大学教授Qin Ma评论道,“这项研究为整合(空间转录组)多个样本提供了一个很有前途的工具,案例研究的数据也很新颖。”   

空间转录组图谱显示出显著的空间表达模式和空间可变基因(Spatially Variable Genes,SVGs)。10月9日,张世华课题组与合作者,在《核酸研究》(Nucleic Acid Research)上,在线发表了题为STAMarker: determining spatial domain-specific variable genes with saliency maps in deep learning的研究文章。该工作开发了基于深度学习显著图的空间域特异可变基因识别方法——STAMarker。STAmarker同时实现了空间域识别和对应的空间可变基因识别,有望为细粒度分析空间转录组数据提供有效方法。     

该团队与中国科学院北京基因组研究所(国家生物信息中心)杨运桂、蔡军团队合作,在《自然-通讯》上,发表了题为Spatiotemporal transcriptomic atlas reveals the dynamic characteristics and key regulators of planarian regeneration的研究论文。该工作绘制了地中海涡虫再生过程中的三维空间转录组图谱STAPR,系统鉴定了多个再生关键调控因子。     

简要而言,上述研究将人工智能与空间转录组数据巧妙结合,为解析生物组织结构和细胞调控提供了颇有前景的系列工具STAGATE、STAligner、STAMarker。随着空间转录组技术的快速发展和数据的不断积累,这些工具将为大规模空间转录组数据的计算解析与生物挖掘提供支持。

STAligner算法工作流程图

附件: