[学者笔谈]沈红斌:生物分子辨认的机会与应战
来源:青年网 发表于2019-07-10 11:31:32 编辑:潘玮柏
摘要: ? [编者按] 继2019年上半年推出身边的感动系列报导遭到广泛好评后,从2019年10月起,咱们推出了新栏目学者笔谈。本栏目将接连推出一批我校有影响的学者

? [编者按] 继2019年上半年推出“身边的感动”系列报导遭到广泛好评后,从2019年10月起,咱们推出了新栏目“学者笔谈”。本栏目将接连推出一批我校有影响的学者,要点展现他们在人才培育、科学研讨、服务社会和文明传承与立异等方面的观念和见地、思路和做法及理论和实践,旨在宏扬科学精力,激荡人文情怀,回归学术本位,浓郁学术气候,全面提高交大学术的影响力和传达力。

 

■ 近年来跟着生物科学范畴高通量数据收集技能的飞速开展,数字存储、核算、信息和通讯技能的不断进步,生物学逐步从数据匮乏变成数据丰厚的科学。

 

■ 长久以来,人们一向愿望可以获取生物分子的形象直观的相片或许视频,以便可以直观地调查这些分子的长相和活动规则。跟着荧光技能、高清电子显微镜及生物图画拍照和成像技能的快速开展,这一愿望正在逐步成为实际。

 

■ 跟着生物科学与技能的迅猛开展,蛋白质和核酸的测序数据正以指数办法添加,生物学及相关数据数量已日趋巨大,其数量之多可以用汗牛充栋来描绘。

生物信息:发掘包含生命实质的常识

 

婀娜的柳树,芳香的花朵,慵懒的蟾蜍,轻盈的水鸟……这些构成了丰厚多彩的生命世界。自人类社会诞生,人们就不断在探寻生命的奥妙,“神农尝百草”可以看作古代社会对生物学知道的开端萌发。但是探究的进程,艰苦而又绵长,研讨目标也跟着研讨的深化而悄然改动。开端的研讨目标是个别,然后是器官和安排,再然后是细胞,直到近几十年,才转向研讨生物大分子。生物大分子中包含了很多生命实质的信息,怎么发掘、剖析、了解和运用这些信息背面的常识则是首要考虑的问题。

 

众所周知,信息处理最重要的科学要害问题之一是办法论。遍历天然科学的全部学科,数学是不可或缺的理论基础东西。但是,在曩昔适当长的时间里,人们好像找不到数学与生物学的相关性。在《天然辩证法》中,恩格斯曾毫不客气地写道:“数学的运用……在生物学中等于零”——这便是十九世纪的情况。究其原因,其间重要的一条便是因为各方面条件的约束,生物数据相对匮乏,使得研讨作业更多地依赖于假定经历规则,而不是内涵规则性剖析。

 

但是物是人非,今日的技能条件有了长足的开展,特别是近年来跟着生物科学范畴高通量数据收集技能的飞速开展,数字存储、核算、信息和通讯技能的不断进步,生物学逐步从数据匮乏变成数据丰厚的科学。而传统检测不同分子的生物试验手法只能处理有限的丈量,当时的设备却可以挑选出很多的分子,这是20年前生物学家无法幻想的,这种现象逐步地把生物学从假定驱动的研讨改动为数据驱动的研讨。这些爆破性添加的数据信息使得咱们史无前例地领会了生命的美好和丰厚多彩,一起也给咱们提出了艰巨的应战。当时分子生物学的数据量非常巨大且呈爆破性添加,特定的大分子结构及功用反常杂乱,在细胞生命周期中生物大分子的活动轨道具有动态随机性和内涵规则性并存,不同大分子之间又彼此作用构成了杂乱的动态生物网络。正是针对这些布景,有用办法论的研讨已成为生命科学研讨不可或缺的中心成员。数学作为理论东西在生物学科中的作用越来越大,也直接导致了生物核算这样的新式学科和方向;而核算机作为实践东西,在处理海量生命数据中起着无可代替的作用;一起,信号处理、形式辨认和系统控制等多许多研讨方向也逐步加入到提醒生命实质的研讨中来。正是因为这些客观原因促进了这些多学科的交融,而这些学科的彼此穿插,又直接催生了生物信息学这门新的学科的诞生,也被认为是21世纪生命科学和新式生物技能开展的柱石。而生物信息学的定位也逐步从开端的数据存储和康复等底子作用逐步扩展到智能数据处理和从海量生物数据中提取和发掘规则以智能猜测不知道的生命常识这更具应战性的使命上来。

 

生物分子辨认:方兴未已的研讨范畴

 

生物细胞是由各式各样大、小分子组成。生物的小分子不仅在细胞中背负重要的生理功用,并且许多小分子是构成生物大分子的底子单位。生命体中大分子的首要代表有多糖、核酸和蛋白质。其间核酸是遗传信息的载体和蛋白质的翻译东西,而蛋白质则是全部生命活动的体现者与参与者。针对这些杂乱、海量生物分子的形式剖析和辨认研讨,描绘、学习、和猜测他们在生命体中的共同构象和重要功用是今世形式辨认所面临的重要应战之一。

 

对核酸的知道仍旧坚持微弱的研讨态势。尽管上世纪末敞开的人类基因组方案,已取得了阶段性的成功,在人类、水稻等物种的基因组测序研讨方面取得了突破性开展,但怎么知道这些海量的碱基数据成为了现在的要害问题之一,对核酸分子的结构和功用研讨仍然占有着各国研讨的重要方位。如当特定的基因找到后,亟待处理的问题是怎么比较和剖析不同人种间这个特定基因的共性和差异性、正常和患病个别之间又有什么差异、即便关于同一个个别目标怎么点评和猜测在其生命周期的不同阶段基因动态改动和所起作用等都是需求澄清的问题。怎么在全基因组规模的海量数据内找到核苷酸多态性与疾病之间的联系,然后能猜测那些致病性变异也是怎么读懂基因组,发现遗传表达的底子规则的重要课题。寻觅和辨认核酸编码及非编码区域的生物特征以及信息调理与表达规则将会是未来适当长时间内的重要应战。

 

后基因组年代,蛋白质作为全部生命活动的体现者与实施者,其巨大的序列、杂乱的结构、共同的功用和特定的作用环境,是生物分子辨认的重要研讨目标之一。蛋白质“序列-结构-功用”三者联系密切相关,跟着高通量测序技能的开展,已知蛋白质序列与他们已知的结构和功用之间的距离越来越大,从氨基酸序列直接动身猜测和建模蛋白质的结构和他们的生物学功用已成为后基因组年代最具应战性的研讨课题,而随之研发的高性能主动化生物分子辨认算法和办法将有望有用缩小这一距离,并为耗时的生物试验供给直接的支撑和引领。蛋白质组是必定时间内某个细胞中全部蛋白质的总称,生物体内蛋白质组中的蛋白质之间构成一个天然的杂乱网络。杂乱网络所具有模块特性和动态演化特性,在蛋白质网络中得到充分体现。杂乱网络的模块特性在蛋白质网络中体现为蛋白质功用的相似性,而动态性侧重反映了蛋白质的多功用性以及生物体跟着外界环境的改动性和适应性。经过对生物杂乱网络的研讨,将对精确知道生物大分子的杂乱和动态特征,对要害药物靶标辨认以及药物研发供给重要理论根据。

 

长久以来,人们一向愿望可以获取生物分子的形象直观的相片或许视频,以便可以直观地调查这些分子的长相和活动规则。跟着荧光技能、高清电子显微镜及生物图画拍照和成像技能的快速开展,这一愿望正在逐步成为实际。而传统根据字母生物序列的生物分子辨认问题正在悄然向更为直观的分子图画处理和视频剖析课题跨进。比如,可以经过主动显微图画的获取和剖析,确认蛋白质在细胞中的不同方位的散布,并运用正常细胞中蛋白质散布与之比照,然后剖析细胞有无病变,为挑选因为疾病发作而使蛋白质发作方位改动的生物符号成为可能。根据二维和三维图画、视频、和图形的研讨被认为是当时生物分子辨认的最为重要的方向之一,这一改动也极大推行了传统生物分子辨认的研讨范畴和相关知道,是一个具有适当吸引力的新范畴。

 

可见,人们对生物细胞中的分子的辨认与剖析,现已可以分别从序列、结构、功用、网络等多个不同的视点来知道生命活动。一起,研讨目标也不再只是局限于研讨核酸或许蛋白质序列,而是向二维、三维图画方向扩展,乃至可以用视频来调查和模仿细胞周期中各个阶段的分子活动,对生物分子组成、运送和推陈出新供给更为直观的根据。一旦这些研讨开花结果,人类知道生命活动的实质将会发作质的腾跃,为了解生命活动的实质拓荒愈加宽广的视界,为探究生命的奥妙供给愈加深化的视角。

 

海量杂乱生物数据:反哺穿插学科

 

人们从分子水平上对生命活动的研讨,只要短短的几十年的进程。在最开端的一段时间里,人们好像找不到合理的研讨办法和有用的实践办法。伴跟着以核算机技能为中心的信息技能的开展,人们逐步运用这些东西获取了少数的生物学数据。为了处理这些数据,以数理核算、人工智能等为理论中心的很多穿插学科见义勇为地成了推进生命科学开展的助推器,一起这些传统数据处理和剖析办法也遭到了史无前例的应战。

 

跟着生物科学与技能的迅猛开展,蛋白质和核酸的测序数据正以指数办法添加,生物学及相关数据数量已日趋巨大,其数量之多可以用汗牛充栋来描绘。现在,许多科研机构和科研安排,都相继开发了相应的数据库以寄存这些数据,当然处理办法论是从海量数据发掘有用常识的重要内容。杂乱的布景、巨大的核算量、杂乱的噪声形式、海量的时变数据给传统的数学核算剖析带来了巨大的困难,如咱们无法处理直接移植数学组合办法来研讨多基因变异和疾病之间的联系所导致的组合爆破问题。这就要求这些原始学科在处理这些问题上的底子思路上要做实质的观念改动。现有的数理核算、形式辨认与机器学习的一些办法并不能简略地套用在这些杂乱的生物数据之中。这些生物数据的新特征和新形式将带来以下几方面的核算办法改造:一、高效率算法和他们的快速完成。由小规模数据处理办法向大规模乃至超大规模数据推行时,一般并不是算法上的小改善就会取得好的作用。在分子生物学中,传统的试验办法已无法满意处理高速添加的海量数据。同样地,原有的、针对少数数据的生物分子辨认算法并不能处理很多数据的处理和剖析。面临大规模、多类型、多模态的杂乱生物数据集,需求研讨更高效的数据处理理论和他们的快速完成办法。二、静态到动态辨认的改动。一方面而言,生物数据和常识一日千里,而常识发掘的一个重要方面便是怎么可以运用齐备的已知信息,传统静态学习和辨认办法明显不能有用地反映和归纳新增量,迫切需求高性能增量式生物分子辨认理论和算法。另一方面,生命实质是一种动态性,其简直体现在分子的全部生命周期,也体现在生物分子在数百上千年中不断的进化和变异中,精确剖析和知道这些分子在生物网络中的动态性特征、动态进化中的差异性和他们的彼此作用联系等都需求动态的观念和处理办法。三、多物种的常识交互和搬迁辨认。众所周知,试验科学在不同物种上的开展很大程度上不一样,但值得幸亏的是不同物种之间的生物分子在必定程度上具有较高的保存相似性,这就启示咱们不能把各物种数据信息彻底独立开来研讨,而需求有用的常识交互,怎么定量描绘和表达不同来历数据的共性和差异性是完成搬迁辨认的重要内容。综上所述,海量的生物数据因为其高度杂乱且快速添加等特色,加之含糊及不确认性和高噪声等数据特色必然会反过来作用于现有的数理核算、形式辨认等理论和办法,促进这些学科在理论研讨深度和运用范畴广度加以不断地丰厚和完善。

 

现在,生物分子辨认经过了数十年的开展,现已硕果累累,许多学者乐此不疲,使得这门学科欣欣向荣,一日千里。今日,生物信息学现已充分地交融和运用了数理核算、随机进程、形式辨认与机器学习等底子理论与最新效果,不夸大地说,它现已成为研讨生命科学的重要办法论。尽管取得了巨大的成果,但生物信息仍旧犹如一座偌大的常识海洋,它的芳华仍旧吸引着大批科学家争相目击,它的深邃仍旧让很多学者争相探寻,它的众多仍旧让许多博学之士为之披荆斩棘,数十年如一日。

 

学者小传

 

沈红斌,上海交通大学电子信息与电气工程学院研讨员,国家天然科学基金优异青年基金取得者。2007年在上海交通大学主动化系获博士学位,2007至2008年在哈佛大学从事博士后研讨作业,2019年为密西根大学拜访教授。现任Protein and Peptide Letters等5种世界期刊的编委。

 

沈红斌及其团队首要从事生物分子形式辨认理论和办法及海量生物数据发掘的信息特征剖析和处理的研讨作业,在蛋白质分子结构和功用辨认的理论算法和模型,蛋白质网络功用模块发掘方面构成了立异性研讨效果,在Nature Protocols等期刊宣布SCI学术论文60余篇,研讨作业曾被世界期刊Journal of Cellular Biochemistry作为封面故事论文报导。在理论作业的基础上,进一步完成在线生物信息科学服务网站20余个,已接连在线服务七年,被累计运用三百万余次,产生了必定的学术影响。

 

掌管国家天然科学基金优异青年基金、严重研讨方案等研讨项目10项。当选全国优异博士学位论文,教育部新世纪优异人才,上海市浦江人才,获上海交通大学教育新秀,上海市教育系统科研新星,上海市青年五四奖章,上海交通大学烛光二等奖等荣誉。承当本科生大渠道课程《C++程序设计》和本科生专业选修课《生物特征与形式剖析》的教学,辅导研讨生屡次取得上海交大立异才能培育专项基金赞助和优异毕业生等荣誉称号。

 

[学者笔谈]沈红斌:生物分子辨认的机会与应战

排行榜单
投稿邮箱:
相关推荐
汉青研究院代表团拜访美国名校
汉青研究院代表团拜访美国名校

近来,汉青研究院履行院长梁晶,助理教授齐豪、邱志刚访问了芝加哥大学、宾

排行榜单19秒前

木兰汇公益基金会捐献典礼暨何巧女董事长北京
木兰汇公益基金会捐献典礼暨何巧女董事长北京

2019年5月4日,木兰汇公益基金会捐献典礼暨何巧女董事长北京大学声誉校董颁布

排行榜单11小时前

上海交大举行2019计划生育工作总结大会
上海交大举行2019计划生育工作总结大会

12月23日,上海交大方案生育作业总给大会在新行政楼举行。校长助理徐国权、

排行榜单2019-07-09 19:24:52

我馆人员参与“中美高校档案管理座谈会”
我馆人员参与“中美高校档案管理座谈会”

2007年6月6日,我馆常务副馆长吕小明、文书档案室吴静研主任参加了由国家档案

排行榜单2019-07-08 16:14:35

北大青年自愿服务举动评优赞誉作业正式发动
北大青年自愿服务举动评优赞誉作业正式发动

3月底5月初,校团委、青年自愿者协会讲展开主题为自愿服务迎奥运 调和生长树

排行榜单2019-07-08 06:05:42

北大党委常务副书记于鸿君会晤俄罗斯闻名学者
北大党委常务副书记于鸿君会晤俄罗斯闻名学者

2019年5月13日,北京大学党委常务副书记、纪委书记于鸿君在北京大学临湖轩东

排行榜单2019-07-08 06:05:42

习近平持续到会二十国集团领导人第十四次峰会
习近平持续到会二十国集团领导人第十四次峰会

中新社大阪6月29日电 二十国集团领导人第十四次峰会29日在日本大阪继续举行。

排行榜单2019-07-07 13:34:25

警觉大数据“杀熟”(纵横)
警觉大数据“杀熟”(纵横)

跟着互联网技能的不断发展,大数据的运用越来越遍及,咱们随时随地都在享受

排行榜单2019-07-06 13:15:21

时间独享高速安全网络的全时互联便携商务本,
时间独享高速安全网络的全时互联便携商务本,

2019年4月10日,北京 ?ThinkPad宣告,ThinkPad X390 4G版在ThinkPad官网正式敞开预定。

排行榜单2019-07-05 19:18:07

HTC继续发力5G 将推出首款5G 移动智能网络中心
HTC继续发力5G 将推出首款5G 移动智能网络中心

发布时刻:2019-11-29 11:25:38?来历:太平洋电脑网?? 采编:孙月?布景: 5G是下一个

排行榜单2019-07-04 09:55:31