榜样引领“南开十杰”王文恺热爱可抵岁月漫长_预测_比赛_研究生(南开系列学校创始人)

原标题:榜样引领 | “南开十杰”王文恺:热爱可抵岁月漫长

在南开,有这样一群人

他们是不同学科领域“千里挑一”的人才

是“研”途中师生们高度认可的榜样典范

他们,似乎有“三头六臂”

以优异的才能和“研值”攀登学术高峰

他们,习惯了默默耕耘

用矢志不渝的初心实现探索和突破

他们,就是

“南开十杰”

“南开十杰”是南开大学授予科研能力最显著、发展潜力最突出的研究生的荣誉称号。党委学生工作部融媒体中心于日前采访了2022年度“南开十杰”,下面就请和小编一起感受榜样力量,汲取新学期的不竭动力吧~

热爱可抵岁月漫长

贾舒涵 肖玉祥 主笔

韩心蕊 李佳音 编辑

人物简介:

王文恺,男,山东临沂人,1997年1月出生,汉族。2018年6月获山东大学理学学士学位,同年9月考入南开大学数学科学学院攻读概率论与数理统计专业硕士学位,导师为柏立华教授。2020年9月考入南开大学数学科学学院攻读生物信息专业博士学位,导师为杨建益教授,主要研究领域为人工智能与大分子结构预测。目前,他主要将深度学习方法应用于蛋白质、rna等大分子的结构预测以及结构设计中,以期解决药物研发等实际问题。

作为一门基础学科,人类对于生物学的研究已经持续了成千上万年,从简单的观察自然,到借助实验手段研究细胞、分子等的结构,生物学的研究技术已经取得了长足进步。随着时代的发展,计算机和数学建模应用到生物领域的研究中,为生物科学研究作出了重要贡献,王文恺就是其中一枚小小的螺丝钉。回望过去两年的博士生时光,王文恺发表了五篇sci论文,多次参加国家级学术竞赛论坛,各项荣誉蜂拥而至,王文恺却始终谦逊从容,他真诚地说:“我要做的工作还有很多,这些成果只是点滴的进展。”

满腔热血,为科研梦想一往无前

2018年夏天,怀着对南开大学数学学科光辉历史的憧憬,王文恺来到南开大学数学科学学院开启了硕士生涯,并选择修读偏理论的“概率论与数理统计”方向。硕士阶段他大部分时间和本科时一样,按部就班地学习专业课,接触的研究并不是很多。相比于硕士阶段就在生物信息领域耕耘的研究人员,王文恺算是“晚出发”的一位。但正是这一阶段认真踏实地“啃书本”“钻理论”,为他以后的研究打下了坚实的基础。

进入博士生阶段,王文恺选择了“生物蛋白结构预测”这一领域。相比传统的x光晶体学实验等方法,计算机预测大大提升了生物蛋白预测研究速度和成功率。王文恺谈道:“利用计算机做结构预测的准确性还有很多提升的空间,我做的课题就是尽量提高准确性,针对几种不同类型的结构设计了相应的预测算法。”

王文恺的五篇sci论文分别从总结蛋白质结构预测算法、捕捉alphafold2蛋白预测盲点、深度学习结合同源模型预测以及蛋白质结构预测方法推广到rna预测等方面入手,对计算机预测生物蛋白领域进行了较为深入的研究。面对众多专业词汇,小编是一窍不通的。但在王文恺耐心细致地讲述下,这些晦涩的词汇也变得通俗易懂、妙趣横生。“‘alphafold2’的中文名就是‘阿尔法折叠2’,它有个很有名的小兄弟,就是阿尔法狗——打败柯洁的人工智能机器人。”“rna就是核糖核酸,新冠病毒就是一种rna病毒,核酸检测就是测试人体内是否存在新冠病毒的rna序列”“蛋白质结构预测就是识别人类细胞中未知的蛋白质复合物并预测它们的结构,这可以为许多疾病提供新的治疗方法,生物健康领域发展的基础就是了解生物的结构。”生物信息专业的有趣之处和研究意义就这样在王文恺的讲述中呈现了出来。正是在以王文恺为代表的广大蛋白质结构预测研究人员的探索和努力下,人类健康的护城河才更加牢固。

迎接挑战,带领团队永攀高峰

casp比赛是王文恺在读博期间勇于挑战自己、追寻科研梦的一项尝试,这项比赛是蛋白预测领域最权威的、检验算法优劣最有说服力的比赛,相当于本领域的“奥林匹克”盛会。三年前的casp14中,王文恺所在的团队在几十支参赛队中披荆斩棘,取得了自动化小组绝对精度排名第二的好成绩,谈及比赛的历程,王文恺的内心感慨万千。在casp14q比赛期间,王文恺主要负责模型的开发工作,在他看来,casp比赛既是“急行军”又是“马拉松”。说这项比赛是“马拉松”,是因为这场比赛要持续三到四个月,期间每天都会发布几个目标蛋白,需要参赛队伍每天“打卡”方能查收新的任务;说这项比赛是“急行军”,指的是接受任务后,要在3天之内设计出预测策略,做出较为精准的结果。这样的比赛毫无疑问是“体力+脑力+协调力”的三重考验,然而“没有比人更高的山”,再多的困难,王文恺和团队的队员都一一克服了。

在开赛前,王文恺和团队成员做好了充足的准备工作,尽可能完善自身的算法体系,争取提高算法的适配性,但在比赛过程中还是出现了突发情况。在开赛前,他开发rna结构预测算法的思路比较简单,即用一套通过大量实验证明比较有效的策略去预测所有rna结构。但随着比赛的进行,他逐渐发现,每个rna都有其特点,且rna的结构要比蛋白质更灵活多变,通用的方法可能整体效果比较好,但对于很多具体的rna都还存在很大的改进空间,这启发了王文恺,也让他意识到这次比赛既是对过去成果的一次检验,也为结构预测领域的未来指明了方向。王文恺所在团队接到了二聚体复合物的预测任务,而之前开发的预测方法主要针对单体开发,集思广益后,团队成功将二聚体的两个单体通过恰当方式组合起来,以单体形式进行预测,从而顺利解决了难题。

casp是一项团队比赛,每位成员擅长的领域不同,备赛过程中也会有一些分歧,比如在挑选模型时应该相信指标数值还是相信人眼观察,对于二聚体如何折叠结构等等,但是也正是这些分歧让大家都注意到了一些之前被自己所忽视的问题,这对于比赛和改进算法都有助益。这次比赛让大家收获的不仅是学术深度的精进,学术宽度的拓展,更是深厚的科研革命友谊。比赛期间,有些队员因赛程过长有了倦怠的心理,这个时候,王文恺就会用自己积极的心态去感染队友,主动承担起困难的工作,鼓励团队成员不放弃、不拖延,带领集体一丝不苟地改进算法。作为整个团队中的一份子,王文恺不仅带给成员技术和研究上的正面影响,更成为了整个团队的主心骨和精神支柱。

不骄不躁,在学术田地执着耕耘

很多人都说,读博是一场个人战役,博士生需要在某个领域深入钻研,要耐得住寂寞、禁得住痛苦。作为年轻的研究者,王文恺面对双重压力,一方面硕士生阶段和博士生阶段转换研究方向,需要一定的适应时间;另一方面,应用型研究方向的博士也要面对节奏快、竞争强度大的压力。王文恺感慨道:“不同领域的研究者面对的压力是不一样的,基础科学的研究者可能会遇到没有研究思路的问题,而应用方向的研究者就要和时间赛跑,有时候做的研究都是差不多的,但其他研究者更早发表了论文,自己想再投稿就有些进退维谷。”这些压力对王文恺的心态提出了更高的挑战。

但压力也可以转化为动力,在学术田地耕耘的过程中,积极向上,面对困难不骄不躁的心态让王文恺在科研之路越走越远、越走越稳。

在转换研究方向初期,导师和同门给了王文恺很多的 助,边用边学、以用促学,在用的过程中逐渐将理论完善的研究方法 助他树立了正确的科研观念,稳定了心态。面对应用科研领域的“内卷”压力,王文恺有自己的“时间管理宝典”,每天的学习时间是有限的,但科研任务又很繁重,如何高效利用时间而不至于手忙脚乱、心态不稳呢?王文恺说道:“人一天到晚的状态是有起伏的,在状态好的时候,我会去选择完成相对困难的任务,比如思考模型如何进一步改进,或是读一些偏理论的文献;在状态差、效率低的时候,我会做一些偏机械化的工作,比如转代码、整理数据、写审稿意见等,运动一会儿也是很好的选择,运动之后身心得到放松,大脑更加清醒,学习状态也会更好。”

酬勤,王文恺丰硕的科研成果正是他朝夕不倦的最好回馈,这份回馈的背后,也隐藏着他面对挫折依然能够保持淡定和理性,不屈不挠继续攻关的积极心态。“alphafold2”在蛋白预测领域做出了比人工预测更精准的结果,让世界瞩目,但“alphafold2”并非无懈可击,王文恺孜孜不怠寻找其预测盲区,做出了更优的预测算法。

唯热爱与努力不可辜负

很多人对理工科学生的印象都是严肃、不苟言笑,而王文恺却
榜样引领“南开十杰”王文恺热爱可抵岁月漫长_预测_比赛_研究生(南开系列学校创始人)插图
是一个温暖阳光、谦逊积极的青年。对待自己的成绩,他不矜不伐,“每个人都有自己的专业,相信每一个南开人在自己的研究领域都有自己的风采。而我所取得的一些成绩,努力占绝大部分,只有努力,才能不让自己遗憾。”

不要让未来的自己后悔,这是王文恺的座右铭。他希望将青春的汗水洒在科研的田地里,等待梦想的种子发芽、开花、结果。逐梦的青年,一直奔跑在路上,从论文到竞赛,从同门传承到学术沟通,在人类生命科学研究的道路上,唯热爱可抵岁月漫长。

供图:王文恺

排版:贾舒涵

校对:刘桐骥

审核:张更辉 晏京 李雨鑫返回搜狐,查看更多

责任编辑:

Related Posts

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

|京ICP备18012533号-378