严钢教授团队在《自然·计算科学》上发表复杂系统自主推理新成果
成果应用于推理全球性传染病的传播动力学,能验证SARS和COVID-19的早期传播行为
来源:物理科学与工程学院
时间:2022-03-25 浏览:
北京时间3月25日凌晨,《自然·计算科学》(Nature Computational Science)在线发表了题为“Autonomous inference of complex network dynamics from incomplete and noisy data”的研究论文,该研究由同济大学物理科学与工程学院、上海自主智能无人系统科学中心严钢教授团队完成。在该研究中,作者提出了数据驱动的复杂系统自主推理新框架,实现了结构信息不完整和强噪声场景下的鲁棒推理,为自动化、智能化地发现真实复杂系统的底层原理提供了重要基础和算法支撑。特别值得一提的是,这一算法能有效验证SARS和COVID-19的早期传播行为。
复杂系统是由大量节点相互作用所形成的非平凡系统,例如无人集群系统、物联网、神经元网络、社会信息网络等。随着数字化和微观实验技术的不断发展,很多学科领域都积累了关于实际复杂系统的大量观测数据,主要包括网络结构和节点活动序列。从这些观测数据中发现底层原理,是科学研究常常需要经历的过程。在智能化蓬勃兴起的当今,能否利用人工智能辅助的方式加速这种科学发现的过程,比如从数据中自动化地推理出决定复杂系统行为的动态方程,是学界和业界都普遍关心的问题。
以往的研究着重于单节点或少量节点动态方程的推理,对于包含大量节点的复杂网络系统而言,这个问题面临更多挑战。例如,不仅节点活动数据含有噪声,而且网络结构数据可能不准确,节点的自身动力学可能具有异质性,系统宏观行为可能会掩盖节点之间动态耦合的微观机制。为了克服这些挑战,研究团队融合全局和局部两个视角,提出了新的复杂系统自主推理框架(图1)。该算法能够高效、准确地从观测数据中推理出隐藏的网络动力学方程,为自动化地发现复杂系统的底层原理提供了有效的新途径。
图1. 复杂网络系统自主推理算法概述。将观测的网络结构和节点活动数据(a)映射为时变基本函数矩阵(b),通过全局视角的回归识别最相关的基本函数并组成模型子空间(c),然后通过局部视角的拓扑采样和信息论判据推断最优函数组合及系数(e),最终得到形式简洁且具有生成能力的系统动态方程(f)。
该算法框架具有很强的鲁棒性,能够对抗观测数据中的缺失边、伪连边、观测噪声、关联噪声、内禀随机性等不确定性,在宏观行为同步较强时仍然能够实现推理。与以往针对单个体或少量个体的智能推理方法相比,该研究提出的方法能够在更复杂、非正交项空间中进行搜索,而且在针对数据不确定性的5个模型系统测试中均表现更优。该框架也被应用于推理全球性传染病的传播动力学(图2),算法基于H1N1传播数据,发现了用于描述早期传播过程的简洁的常微分方程,该方程同时能够刻画SARS和COVID-19的早期传播行为,验证了方法的有效性和普适性。
图 2. 全球性传染病的传播动力学推理。基于全球航空网络(a)和各地区H1N1感染数据,推断出早期扩散方程,该方程演化结果与实际观测数据相吻合(b-e),同时能够迁移用于刻画SARS和COVID-19的早期扩散行为(f-i)。
物理科学与工程学院严钢教授为论文的通讯作者,博士研究生高婷婷为论文的第一作者。该研究得到了国家自然科学基金、国家科技创新2030、上海市市级科技重大专项等项目资助。
论文链接:https://www.nature.com/articles/s43588-022-00217-0