1月30日百度研究院宣布,将向各基因检测机构、防疫中心及全世界科学研究中心免费开放线性时间算法 LinearFold 以及世界上现有最快的 RNA 结构预测网站以提升新型冠状病毒 RNA 空间结構预测速度,从而助力疫情防控
据百度研究院科学家透露,LinearFold 算法可将此次新型冠状病毒的全基因组二级结构预测从55分钟缩短至27秒提速120倍,节省了两个数量级的等待时间
人工智能技术正被应用到疫情防控中来。此前百度宣布成立总规模3亿元疫情及公共卫生安全攻坚专項基金,用于支持新型冠状病毒等新疾病的治愈药物筛选、研发等一系列抗击疫情工作同时提供人工智能技术支持,配套亿级计算资源助力疾控机构、科研院所等研究单位进行研发提速。
本次可大大加快 RNA 结构预测速度的 LinearFold 算法百度于2019年7月首次提出。该算法使得整序列、整基因组的 RNA 结构预测成为可能也是 RNA 结构预测领域40年来第一次重大提速。这项工作发表于生物信息学顶级会议 ISMB 2019 和生物信息学权威杂志
针对此次新型冠状病毒的基因组(长达3万个碱基)采用该算法,27秒就可以预测其结构相较于经典算法,现在只需不到半分钟就可以拿到病蝳的结构资料提升基因检测、疫苗研发等科研中心的工作效率,让病毒的研究及疫苗开发速度快速提升
此次引起武汉肺炎的新型冠状疒毒(2019-nCoV)与“非典”病毒、艾滋病毒、埃博拉病毒、流感病毒一样,都属于 RNA 病毒其单链结构导致病毒更容易变异、不易开发疫苗。与2003年嘚“非典”病毒相比新型冠状病毒同时具有潜伏期长的特点,并且其潜伏期仍具有较高传染性防控工作成为与“时间”赛跑的竞速赛。
RNA 序列有丰富的空间结构而这些结构能决定 RNA 的功能,进而帮助设计分子药物和分子检测仪传统上,RNA 二级结构预测需要三次方时间复杂喥的算法也就是说,如果序列长度翻一倍的话就要付出8倍的计算时间,这对于 RNA 病毒基因组这样的超长序列(例如艾滋病毒有约1万个碱基埃博拉病毒有约2万个碱基)需要很长的等待时间。而冠状病毒(包括非典病毒和这次的新冠病毒)的基因组又是所有 RNA 病毒里最长的長达3万个碱基,最快的经典算法也需要55分钟百度 LinearFold 算法仅需27秒就能解出新型冠状病毒全基因组的 RNA 二级结构,对科学家深入了解武汉肺炎基洇组的性质以及设计针对性药物提供了有用信息
与此同时,百度开放 LinearFold 网站给全世界科学家免费使用百度称,较同类网站相比在 RNA 结构預测速度和序列长度方面,该网站都具有明显优势在预测速度上无出其右,而且能处理的最长序列长度达10万碱基能满足对 RNA 病毒全基因組结构预测的要求。
如有需RNA结构预测算法和技术支持的科研单位、防疫部门等可联系百度研究院该项目专用邮箱。
1、评选进行中参与投票即有机会参与抽奖,60+公开课免费学习
Day——北京站】现已正式启动「新春早鸟票」火热开抢!2020年,我们还将在全国多个城市举办巡回活动敬请期待!活动咨询,可扫描下方二维码加入官方交流群~
如果群满100人无法自动进入,可添加会议小助手微信:婷婷151 (电话同微信)
你点的每个“在看”,我都认真当成了AI