应用数学与交叉科学研究中心生物信息学团队于2023年11月28日举行第三十期研究生论坛,小组全体成员和各位导师共同参加。在这次组会上,由两名研一员工和两名研二员工分别汇报自己的研究进展,然后老师与同学们对汇报内容进行学术探讨,并对存在的问题给出相应的指导和建议。
陈龙:本次报了一篇名为《Algebraic graph-assisted bidirectional transformers for molecular property prediction》的文献。分子性质预测的能力对于药物发现、人类健康和环境保护具有重要意义。尽管一些机器学习模型(例如 Transformer 的双向编码器)可以通过自监督学习策略将大量未标记的分子数据合并到分子表示中,但它忽略了三维 (3D) 立体化学信息。代数图,具体来说,元素特定的多尺度加权彩色代数图,将互补的 3D 分子信息嵌入到图不变量中。我们通过融合代数图和双向变压器生成的表示以及各种机器学习算法(包括决策树、多任务学习和深度神经网络),提出了代数图辅助双向变压器(AGBT)框架。大量的数值实验表明,AGBT 是分子特性预测的最先进的框架。
孙睿:本次汇报了一篇名为《基于图神经网络的空间转录组学数据的细胞聚类》的文献,文章利用空间转录组学和图神经网络的优势,利用图神经网络引入空间转录组学数据的细胞聚类,这是一种基于图卷积网络的无监督细胞聚类方法,以改进从头算细胞聚类和基于策划细胞类别注释的细胞亚型发现。基于对5个体外和体内空间数据集的应用,发现空间转录组学的细胞聚类方法优于其他空间转录组学数据集的空间聚类方法,并且可以从培养细胞的多路错误鲁棒荧光原位杂交数据中清楚地识别出所有四个细胞周期阶段。从增强的序列荧光原位杂交数据中,细胞空间转录组学聚类发现了不同微环境下的功能细胞亚型,这些都得到了实验验证,激发了关于细胞状态、细胞类型和微环境之间潜在相互作用的生物学假设。
黎红艳:本次汇报了一篇名为《Semi-Supervised Neural Architecture Search for Hyperspectral Imagery Classification Method With Dynamic Feature Clustering》的文献。为了解决只提供少量的标记样本情况下,构造更适合给定HSI的网络结构,而不是利用手动设计的网络结构进行HSI分类的问题。本文提出了第一个通过神经结构搜索(NAS)构建的半监督HSI分类网络。具体而言,提出了一个在这次组会上,由一名研一员工、两名研二员工和一名研三员工分别汇报自己的研究进展,然后老师与同学们对汇报内容进行学术探讨,并对存在的问题给出相应的指导和建议。
袁洁:本次汇报的是研究进展——单链DNA结构预测的稳定性,在原有的模型基础上参考tis提供的实验相关数据,找到原实验文章的数据。并参考查找到单链DNA的稳定性归因于有力的堆积相互作用和不利的静电相互作用的相互作用,得知poly(dA)与poly(dT)的结构有一定的区别,dA30中堆积占主导作用,dT30中堆积作用与静电作用会相抵消。
孙睿:本次汇报了研究进展——汇报了现有的空间转录组数据聚类分析的部分方法,并对几种方法进行了比较,着重分享了spicemix方法,一种基于概率、潜在变量建模的可解释方法,用于空间转录组数据的空间信息和基因表达的联合分析。仿真和实际数据评估表明,SpiceMix在细胞类型及其空间格局的推断方面比现有方法有显著提高。通过应用seqFISH+、STARmap和Visium获取的人类和小鼠大脑区域的空间转录组数据,SpiceMix可以增强对复杂细胞身份的推断,揭示可解释的空间宏基因,揭示分化轨迹。SpiceMix是一个用于研究复杂组织中细胞类型组成和细胞空间组织的空间转录组数据的通用分析框架。
柯璐:本次汇报的是一篇文献《Stochastic model for protein flexibility analysis》, 蛋白质柔性是一种内在属性,在蛋白质功能中起着重要作用。蛋白质柔性的计算分析对于蛋白质功能预测、大分子柔性对接和合理药物设计至关重要。目前大多数蛋白质柔性分析方法都基于哈密顿力学。本文引入了一个随机模型来研究蛋白质柔性。基本思想是分析满足主方程的扰动蛋白结构概率的自由诱导衰减。由包括单调递减径向基函数的概率密度估计器构建转移概率矩阵。该方法不需要构造任何哈密顿函数,也不需要矩阵对角化。所提出的随机模型为三组蛋白质数据集提供了B因子的最佳预测。
王嘉琦:本次汇报了一篇文献《Geometric diffusions as a tool for harmonic analysis and structure definition of data: diffusion maps》,高维空间中图形和数据集的几何组织是统计数据分析中的一个中心问题,在连续欧几里得条件下,谐波分析的工具,如傅立叶分解、微波或小波和伪微分算子的谱分析,在压缩、去噪和密度估计等许多领域都被证明是非常成功的。本文将多尺度谐波分析扩展到离散图和子集,使用扩散半群来定义和生成复杂结构的多尺度几何,这个框架概括了牛顿范式的某些方面,其中系统的局部无穷小转移通过积分导致全局宏观描述,全局函数由微分方程表征。
— 员工汇报照片展示 —