2019年10月30日下午,应统计与数学学院邀请,西安电子科技大学计算机科学与技术学院马小科教授,在学院南路校区主教101教室,为学院师生作了题为《图数据挖掘及其在精准医学中的应用》的学术报告。
马小科教授的报告分两部分:背景介绍与研究进展。在背景介绍中,马教授从大数据的背景入手,简要介绍了其发展过程并指出它面临着容量大、结构复杂、信息密度低、计算难度大等挑战。随后以癌症治疗为例,由于非精准医疗不了解发病机理且表观不能有效刻画癌症,因此它存在着高误诊率、药物滥用的缺陷,而精准医疗则能在一定程度上解决该问题,但是在将大数据挖掘与精准医疗两者结合的过程中,仍然面临着数据资源丰富但不完整、数据复杂且现有理论和方法难以胜任以及结果评价极度困难等诸多挑战。
在研究进展介绍中,如何系统地识别在癌症恶化过程中基因调控程序之间的动态关系是当前生物信息学领域最前沿的课题,其根本难点在于如何定义、识别时间序列网络下代谢路径的动态模式,马教授针对该难题做出了四点创新,分别为:证明了谱特征空间可用特征向量与特征值线性表出、证明了特征空间与网络通信性的泛化形式、提出了基于特征空间的谱聚类算法以及对非传统谱聚类算法进行了全面的对比。而对于生物网络分析来说,主要存在着三个问题:第一,当前的研究并不能有效结合刻画蛋白质复合体的拓扑结构;第二,存在多个最优解,如何选择最优生物意义的解的问题;第三,不能充分利用生物网络与社会网络的相关性。马教授针对这些问题做出了如下创新:基于网络通信性将蛋白质复合体转化为经典全团问题、充分利用蛋白质复合体的二级生物结构来识别复合体以及证明了生物网络同样存在社会化行为,充分利用社会化行为可以快速提高复合体预测的准确性,上述创新促进了生物医学网络的蓬勃发展。
马小科,现为西安电子科技大学计算机科学与技术学院教授、博士生导师,于2012年获西安电子科技大学计算机应用技术博士学位,2012-2015在美国爱荷华大学医学院从事医学数据挖掘博士后研究,2015年入职西安电子科技大学从事教学与科研工作, 2016年破格副教授,2019年破格教授。主要从事数据挖掘与机器学习、医学影像处理、生物信息学等领域的研究工作。在国际期刊IEEE TKDE、PR、Cell Stem Cell、Bioinformatics、PLoS Computational Biology等发表SCI检索的论文50余篇,其中第一作者/通信作者论文30余篇。Google Scholar统计引用1000余次,其中SCI引用500多次,被Physics Reports长篇引用(影响因子:23.79)。马小科教授担任IEEE PAMI、TKDE 等10多个国际期刊的审稿人、CCF生物信息学专委会委员、CCF医学数据挖掘专委会委员等职务。主持国家重点研发项目子课题一项、国家自然科学基金面上项目一项、青年基金一项、陕西省自然科学基金三项、市自然科学基金两项。获中国电子学会科学技术奖一项、陕西省优秀博士学位论文等。
本次活动受中央财经大学2019专题学术讲座项目资助。