生物计算将成为AI的新高峰-新华网
新华网 > > 正文
2022 06/13 16:52:45
来源:新华网

生物计算将成为AI的新高峰

字体:

人工智能落地已经进入“大模型”时代。大规模预训练模型使用自监督学习的方法让模型对海量无标注数据中的规律和知识进行提炼、学习,当面向任务和场景应用时,只需要少量的任务标注数据,就能通过持续微调得到在应用场景中非常好用的模型,对具体任务的赋能效果显著,大规模预训练模型在NLP、CV等多类任务上已经展现出强大的优势。

作为著名的机器学习和图深度学习专家,宋乐自2008年起就在卡内基梅隆大学和乔治亚理工学院从事生物计算相关研究,利用机器学习技术对靶点挖掘、药物设计取得了一系列突破性成果。在多年学界探索之后,他于去年8月加入百图生科,“投身业界,更多是因为可观测的生物数据量越来越多,比如说蛋白质的序列数据已经超过十亿条。其次是计算能力的提升,再次是AI算法能力的积累,AI和制药领域出现了很多新的模型和方法,能够更准确的预测。当然,目前的研究仅仅是冰山一角,AI+Drug还有无比广阔的探索空间,我对这个赛道非常期待。”宋乐在入职百图生科时对媒体讲到。

在宋乐看来,人工智能大模型的下一个奇迹,将出现在生物计算领域,生物计算行业将出现规模最大、效果最好、价值最高的大模型,成为行业的重大基础设施,不仅彻底改写药物研发的技术能力,也将对人工智能底层技术发展起到巨大的推动作用,反哺其他行业的AI技术发展。

超大规模模型是AI行业的明珠,背后需要巨大的投入和综合的底层技术能力,而这正是生物计算大模型被宋乐看好的原因。“药物发现问题的商业价值极高,比起其他任务场景,更能支持大规模模型的建设投入,目前百图生科作为平台型生物计算企业敢于这样做,未来一定也会有更多企业投身到这个趋势中,最终推动生物计算大模型成为AI届最亮的明珠”。

在技术能力之外,百图生科还通过强大的临床合作网络,为高通量实验能力找到更多的用武之地。“多组学数据、临床科研数据对于模型构建和算法提升帮助很大,因此公司成立之初就投入10亿元建设‘免疫图谱卓越计划’,已经与十余家中国TOP 30的医院建立了合作,一批临床医院的著名专家、院长、主任成为了我们的合作PI,我们也很快会推出‘卓越计划’二期来加速这个过程。”宋乐补充道。“现在的生物计算行业其实很像二十多年前互联网行业爆发的前夜,有人说21世纪是生物学的世纪,也有人说21世纪是人工智能的世纪,我觉得人工智能技术赋能下的生物医药行业,将会成为这个世纪最有潜力的方向。随着越来越多的交叉学科人才涌入这个行业,这个行业的人才竞争也会加剧,但现在还是提早上车的最好时候。”

除了当下的任务,百图生科还在不久前成立了研究院,围绕生命体精细化观测、新型蛋白质合成和细胞编辑、前沿多组学技术等方向建立了研究小组,与国内外众多一线高等院校、科研院所合作,利用公司的场景优势、生物和计算基础设施优势,与高校双轨制培养优秀人才,使其兼具研发能力和工业落地的实践精神。

【纠错】 【责任编辑:张欣烁】