AI算法驱动免疫治疗

2022-11-17 14:45:36 来源: 《环球》杂志

 

8月21日,在2022智博会重庆馆内,媒体记者(中)在工作人员的引导下体验全息智能·精准医疗系统

    “人工智能、大数据等技术的迭代、飞跃,使人类正在以前所未有的速度和深度解码人体、解码疾病、解码免疫。”

文/《环球》杂志记者 张漫子

编辑/马琼

  公开数据显示,全球目前有超10亿人忍受着免疫性疾病的痛苦。更有医学数据表明,人类疾病的90%以上都与人体免疫系统相关。

  尽管在过去近一个世纪,人类学会了使用疫苗及多种免疫调节药物来预防或治疗疾病,然而免疫系统是一个由细胞、组织和器官组成的高度复杂的系统,由于人们对其了解的局限性,当前免疫调控药物尚未实现精准靶向和调控。

  与此同时,全球的新药研发一直面临研发周期长、研发投入高、成功率低等亟待破解的现实问题,为了缩短研发周期、降低成本、提高成功率,这就需要借助人工智能(AI)、大数据等更加智慧的“工具”。

  为克服传统药物在感知、决策、控制等方面的不足,突破破解免疫密码、研发创新药物、治疗复杂疾病的瓶颈,科学家们正在通过AI与免疫学、生命科学、基因组学、蛋白质科学等学科的交叉,解码复杂的蛋白质-蛋白质互作网络,更深入地了解人体防御机制,更有的放矢地解决人类种类繁多的免疫问题,开发免疫疾病药物,为维持人类健康贡献技术力量。

传统免疫疗法的“天花板”

  癌症以其高危险性、低治愈率、高死亡率等特征成为了人类的梦魇。也因此,癌症免疫治疗成为人类探索最多的医学领域。

  以PD-1(一种分子免疫抑制剂)为代表的免疫治疗,使晚期非小细胞肺癌患者5年生存率从不到5%提高至16%——类似令人惊艳的临床数据已经越来越多。

  “在过去,晚期肺癌患者顶多只能存活1年左右。比如化疗,是把免疫细胞和癌细胞都杀死。而免疫疗法,是通过调动自己去对抗异己,调动病人自身的免疫细胞来对抗癌细胞。有了PD-1之后,癌症患者的死亡率明显下降,近1/3的病人可以延长生命,甚至可以达到治愈的标准。这在过去是难以想象的事情。”北京协和医院病理科副主任技师薛晓伟说。

  因此,免疫治疗被不少患者家属视为“神药”。但“神药”并不意味着百发百中。癌细胞可以利用多种细胞内在和外在机制逃避免疫系统的识别。肿瘤微环境的内在复杂性及其多细胞性和动态性,对单一蛋白某个靶点的免疫疗法提出了挑战。

  “每一个免疫细胞里至少有两万种蛋白来决定它的功能,这些蛋白每一个可能有上百种不同的亚型,对这些蛋白的调控可能根据它结合表位、结合方式、调控亲和力的不同,可能有100种以上不同的结果,尤其对免疫细胞的调控,不同的调控方式会带来不同的结果。”百图生科联合创始人刘维说,这不是一个单点,蛋白和蛋白之间是复杂的互相作用、互相调控、此消彼长的网络。

  在复杂的人体免疫系统中,单一调控带来的问题之一就是“效用至上”带来的负面效应。薛晓伟说,免疫治疗可能会出现过度激活的人体免疫系统,甚至导致免疫系统主动攻击患者本身,引发身体瘙痒、红肿、头疼等问题的出现。

  “此外,单一调控还是不够精准,会在安全性、有效性上出现问题。”刘维说,“我们今天免疫调控的药物大多是基于更简单的假设,即对通用的人群,对少数的一个或两个靶点,以与该靶点结合为主。而该靶点的蛋白实体不管在哪个细胞上,只要在全身范围内,只要从代谢角度,都能够与有这个蛋白的细胞进行结合。其导致的结果,就有些像在纷纭复杂的网络中攻其一点不及其余,可能会带来有效性的问题,因为免疫系统的调控机理非常复杂,每一个细胞上可能有上万个蛋白决定它的功能,仅仅是去与一个蛋白结合,是‘按下葫芦浮起瓢’,会使免疫逃逸、免疫耐药成为重大问题。”

  “作为免疫学家,我们希望从不同群体的众多的免疫疾病中总结一些规律,我们也开始试图对疾病进行分类。如果分类成功,对疾病解码成功,就更加有利于医生有针对性地使用药物对病人进行治疗。”中国科学院院士、上海免疫治疗创新研究院院长董晨说。

  面对精准医疗的战略需求,立足于“给人看病,而不是看人的病”的现实需要,传统的免疫疗法亟待改变。

生物计算解码免疫

  “免疫贯穿于人类的整个生命周期,而我们对它的了解还远远不够。”分子肿瘤学家、中国工程院院士詹启敏说。

  百图生科首席AI科学家宋乐认为,人体是一个多尺度的复杂网络,基于免疫系统复杂运作机理的实际,构建一系列对不同生物物质、不同互作关系具有表征能力的大模型,覆盖细胞、蛋白、基因、免疫系统等多个层面,必要且紧迫。

  就技术发展的历程而言,AI也已步入“大模型”时代。大规模预训练模型使用自监督学习的方法让模型对海量无标注数据中的规律和知识进行提炼、学习,当面向任务和场景应用时,只需要少量的任务标注数据,就能通过持续微调得到在应用场景中非常好用的模型,对具体任务的赋能效果显著,大规模预训练模型在自然语言处理(NLP)、计算机视觉(CV)等多类任务上逐步展现出优势。

  数据方面,基因组和蛋白质组学技术的发展极大地改变了免疫学研究,人类和其他模式生物基因组的测序产生了越来越多的与免疫学研究相关的数据,同时大量的功能和临床数据正在科学文献中被报道并存储在临床记录中。

  基于此,生物计算呼之欲出。“人工智能、大数据等技术的迭代、飞跃,使人类正在以前所未有的速度和深度解码人体、解码疾病、解码免疫。”董晨说,我们可以从单细胞的层面,对不同组织、不同时空中的免疫细胞做更深入的分析。我们可以看到细胞更多侧面的可塑性,它在不同时空的表型会有差异性。

  具体而言,生物计算将如何实现解码?如何发挥作用?

  数据是人工智能的基础底座。预训练模型是人工智能算法中的一种技术。百图生科北京中心实验室每年上亿条实验数据的产生,正在加速解码免疫的过程。

  “我们正在开发的超过千亿参数的超大规模多模态预训练模型,有望应用于生物医药领域包括靶点发现和药物开发等多个环节。”宋乐介绍。

  真实数据的积累可还原人体免疫细胞的编辑、扰动,并通过AI大规模预训练模型对免疫细胞、免疫系统进行分析,实验效果会反馈到大模型以持续迭代。宋乐说,这个“巨型数据库”记录了12.6亿种不同细胞和蛋白质之间的1802亿种关系,对免疫相关的互作关系和调控网络进行了深度的刻画,将为免疫相关疾病的靶点发现和药物设计带来关键的能力支撑。

  为寻找靶点、更精准地设计药物,科学家们首先通过大规模预训练模拟人体多尺度的复杂系统。

  具体来说,是对4类不同尺度的信息进行建模:最里一层是大量的蛋白质序列数据,它们主要是弱关联数据,预训练模型可以通过AI算法更好地提取数据中的有效信息,对蛋白质结构、蛋白质性质进行模拟和预测。

  嵌套在蛋白质外面的一层是蛋白质互作网络的信息,包括比较弱关联的蛋白质相互作用的数据、各种各样的蛋白质和其他分子相互作用的数据,预训练模型可以提炼有效信息,以实现蛋白质相互作用复合物结构预测,或是抗体抗原结合的表位预测,以及结合的亲和力等一系列问题的预测。

  在蛋白质互作模型外面嵌套的是更加大的尺度,也就是细胞层面的建模,它同时考虑蛋白质相互作用、蛋白质对基因表达调控的功能关系,可以预测细胞在扰动情况下发生何种变化,甚至在组合扰动的情况下免疫细胞将发生何种变化,并依托模型以及湿试验闭环,寻找一个组合靶点。所以在细胞层面,吸收大量的蛋白质互作数据以及干细胞测序的数据,可对细胞状态以及细胞在扰动情况下的响应模式进行建模。基于该模型可做各种各样的基因表达预测、细胞类型分类、细胞扰动下的功能或表达变化的预测等。

  在单个细胞建模之上,是复杂的免疫系统以及免疫系统和肿瘤或其他环境的相互作用,这里还将引入大量的细胞之间相互通信、细胞和环境之间相互作用的数据。该模型可对免疫系统如何响应扰动做出预测。

  宋乐说,4层存在嵌套关系的系统模型,能够更精准地解析免疫系统,并帮助发现一些靶点或靶点组合。

  基于海量数据,借助生物计算大模型,以对蛋白质-蛋白质互作网络进行细致解析,有助于科学家们趋近解码免疫这一目标——这正是创造更有效的癌症免疫疗法以及治疗许多其他疾病的基石。

计算免疫时代

  有了解码的基础,设计有效的蛋白药物才有可能变成现实。

  “当前,大量的小病种,免疫的罕见病、亚型的疾病在全球范围内还没有合适的靶向药物。而数以亿计的患者还在等待,等待科研人员着手去研发、去攻关。”刘维说。

  目前,中国科学家设计了一种不同于以往的蛋白质药物形态。它由多个免疫功能弹头、组织导航弹头、微环境传感器、可编程控制器等构件拼接而成,形似乐高积木,可程序化地调控多个靶点,实现对免疫系统的重编程。

  基于大数据和AI算法,这一蛋白质药物为每个靶点配备了恰当亲和力、精准定表位、精准功能激发的弹头,提升其有效性和安全性。同时,其靶点组合挖掘能力和多弹头桥接结构可实现更加精准的靶向,作用于多个免疫机制,且更好地防止耐药逃逸等。微环境传感器构件可以实现在特定疾病微环境内激活、针对患者情况选择性激活、序贯弹头激活等灵活的功能,实现对免疫系统的重编程。

  弹头高性能、组合多靶向、编程式控制、构件式组装,有望实现传统抗体药物无法实现的复杂作用机制,为早日攻克肺癌、胃癌、结直肠癌等多种肿瘤以及自身免疫性和纤维化疾病提供可能。

  “近年来,免疫学、基因组学、生物信息学、人工智能等不同领域的专家,都结合各自研究优势,为计算免疫学研究新的工具和方法,为未被满足的临床需求提供治疗方案。”董晨对计算免疫的前景表示看好。

  正如高通量实验技术的开发和大规模数据库的建立对其他生物学领域带来的影响一样,不断增长的信息体量、深度、维度将为免疫学研究带来革新。

  在以实验科学为基础的研究之外,许多针对免疫学特点的计算策略的开发,为免疫学机制研究和临床转化带来新机遇。

  董晨说,免疫疾病的精准治疗一直是临床实践中的难点,计算免疫能在多个方面为“精准”提供可行性支撑。

  一方面,通过机器学习的方法,科学家可预测自身免疫病患者基因组上的变化会对人体的特征、疾病、表型产生的影响,能够更全面地从基因相互作用角度去发掘潜在联系,从而改善治疗效果。

  另一方面,前沿的计算免疫技术可以实现更精细化的动态免疫观测、更精细化的免疫模拟系统、更精细化的免疫扰动。不断扩展的单细胞组学技术将联合多组学分析从更高维度刻画免疫细胞的状态,聚焦分子在组织、器官内与特定分布相关的功能,还原更贴近真实的生理状态,以实现更精准的免疫模拟,在免疫治疗药物药效和副作用预测、临床方案和治疗策略的制定等领域发挥重要作用。

  一系列的免疫学问题,如免疫数据库分析、抗原识别的结构、单细胞分化轨迹构建、新型细胞亚群分型、免疫应答强度和临床预后关联的预测,都将依赖于计算方法的发展。这些领域目前仍空前活跃。多位受访科学家表示,未来计算与实验技术的结合,将成为免疫学创新不可或缺的一部分。

来源:2022年10月19日出版的《环球》杂志 第21期

《环球》杂志授权使用,如需转载,请与本刊联系。

更多内容敬请关注《环球》杂志官方微博、微信:“环球杂志”。

手机版