0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一款“人人可用”的蛋白质设计平台能否带来新气象?

医健AI掘金志 来源:医健AI掘金志 作者:医健AI掘金志 2022-09-21 09:34 次阅读

近年来,AI制药赛道狂奔,但参与大分子药物研发的AI制药公司寥寥可数。一款“人人可用”的蛋白质设计平台能否带来新气象?

AlphaFold 近年来展现给世人的惊喜层出不穷,使得向来被称为生物学圣杯的蛋白质折叠问题有了新的解决方法,为整个计算生物领域带来了更大的关注量。

其中,AI蛋白质预测与设计赛道不断吸引着创业者与Meta、腾讯等大厂的加入。

各种算法、模型互相比拼,不断刷新准确度、运行速度与数据库数量。在AI的赋能下,蛋白质结构数据大大增加,使得AI蛋白质从头设计变得可行起来。

相关算法、平台突增,但在追求硬核指标之外,也有其他值得关注之处。

“我们发现,虽然人工智能现在具备了蛋白质从头设计的能力,但要推动整个领域的快速发展,比算法开发更重要的是要解决大家在产业实践中遇到的种种困难。”

苗洪江来自天壤XLab,是该实验室负责人。

他表示,基于上述背景,天壤XLab发布了一款蛋白质设计工作台——CREATOR,试图解决跨领域技术门槛高、工作流程碎片化的问题,在同个工作台上一站式地完成全部蛋白质设计项目。

在赛道发展的早期阶段,这个工作台还需要直面AI蛋白质预测与设计所遭受的质疑,通过降低使用门槛是否能为赛道带来新的气象?

如何实现“人人”都能设计蛋白质?

蛋白质设计有着非常广泛的应用场景,除了新药研发,还能应用在新材料、新食品等领域。蛋白质设计的重要性毋庸置疑,但在AI介入前进展缓慢。

苗洪江认为,蛋白质设计共经历3个阶段,每一阶段的能力提升都与人类对蛋白质结构的理解分不开。

第一个阶段是最早期的20世纪90年代。

这个阶段只有少量的蛋白质结构,对于蛋白质折叠的理解也非常局限,这使得当时完全无法实现功能上的设计,只能通过手动拼接出很简单的二级结构片段。

第二个阶段,随着蛋白质数据库中的结构信息增加,研究人员得以从这些信息中总结出理性经验以及更为复杂的蛋白质能量函数关系,通过实践设计出越来越多功能的蛋白质。

但在这个阶段,蛋白质设计的流程很复杂,落地也非常困难。

而第三阶段,也就是当下,借助AI的技术能力,研究人员已经能够从头设计蛋白质,蛋白质设计的产业化应用也变得更加容易,标志着蛋白质设计已经进入了全新的时代。

在AI算法的加持下,蛋白质结构预测与设计赛道结束了“无人问津”的状态,逐步收获了巨大的关注。

但在实际的产业实践中,仍有各种困难阻碍推广。在苗洪江看来,在这个阶段,要推动整个领域的快速发展,比算法开发更重要的是要解决一些难以避免的困难。

首先,蛋白质设计本身就是一个门槛超高的交叉领域,串联着非常多的学科知识。

苗洪江介绍,在这个领域的研究人员不仅需要具备生物计算的能力,可能还要具备结构生物学、计算化学、物理学等多方面的知识背景,高门槛导致了整个领域的推广很难进行。

其次,现有平台的能力过于单一。

苗洪江毕业于伦敦帝国理工学院计算生物系,在校时,他就曾参与开发Phyre2蛋白质结构预测及分析平台,该平台是目前全球最常用的模拟工具之一。

他注意到,即使平台相对开源算法已经大大减轻研究员的使用门槛,但平台依然掣肘研究工作。

在AI+蛋白质设计工作里,需要调用多种算法能力,而单个平台往往难以满足所有需求。因此,一种很普遍的研究流程出现了——研究员需要在不同的算法平台之间切换。

“在这个平台上做计算,然后下来再去另一家平台上做计算,把结果拿下来后,还要对不同平台的计算结果进行对比分析,整个流程就非常乱套,严重阻碍了工作效率。”

CREATOR 要解决的正是这些痛点。

CREATOR工作台集成了市面上优秀的算法,包括天壤XLab自研的算法与所有外部开源和合作伙伴的算法。

研究员可以自由地选取算法,在CREATOR 上完成结构预测、蛋白质设计、特性分析优化的工作,省去繁琐的切换步骤。

工作台采用可视化呈现,在使用过程中,研究员无需了解算法及其背后的原理,只需进行简单的输入,建立任务并运行,就能得到结果。

在工作台上,研究员还可以对历史任务进行跟踪查看,以项目的方式对原本零散的任务进行分类、串联和管理,一站式地完成从项目规划到结果分析的整个流程。

6098847a-38c7-11ed-ba43-dac502259ad0.png

60b04466-38c7-11ed-ba43-dac502259ad0.png

CREATOR 适用于多肽、酶、抗体和各类功能蛋白质,使用时无需安装软件,在线登陆账号就能启用核心功能。

苗洪江这样形容CREATOR 的作用,“当跨进门要上楼的时候,我们就是一个电梯,而不是需要一步一步走的楼梯。”

EDA出现后,复杂的芯片功能设计、验证与物理设计都能交由计算机处理,大大节省了时间及人力,推动芯片设计不断往高精方向发展。

下一步,天壤XLab 将继续扩充CREATOR 工作台的功能和算法,建设蛋白质知识图谱,并扩展已有的功能motif库,以进一步赋能研发人员。

能否破除对AI蛋白质设计的质疑?

天壤XLab成立于2019年。

到目前为止,团队已推出了单链蛋白质结构预测平台TRFold2、蛋白质设计平台TRDesign,专注复合体结构预测的TRComplex,以及不依赖MSA信息就能预测蛋白质结构的TRFold-single。

在这些单点能力上,天壤XLab 的TRFold2成绩比较理想,去年在基于CASP14蛋白质测试集内测中,获得了TM-score 打分82.7/100的成绩,今年经数据增强和模型参数扩增后得分达到90.2/100,仅次于全球第一名AlphaFold2的91.1/100的成绩。

今年6月,天壤XLab宣布基于TRDesign成功设计了新冠刺突蛋白结合剂,意图证明AI不仅能准确预测蛋白质结构,还能主动设计蛋白质。

但这些天壤XLab引以为傲的成绩,在圈子外的人看来还不足以令人信服。实际上,整个AI蛋白质预测与设计赛道都面临这样的尴尬境地。

就在不久前,DeepMind宣布,AlphaFold 已经确定了地球上几乎所有已知生物体中大约2亿种蛋白质的结构,以后确定科学已知的蛋白质预测模型将像用“谷歌搜索”一样简单。这一消息引起信徒们的狂欢,但遭受外界诸多质疑。

潘毅、周耀旗、许东等几位生物信息学领域的学者在接受《医健AI掘金志》采访时表示,AlphaFold蛋白质结构数据库新更新的海量数据中存在着部分结果结构不稳定、不能应用于研究中等问题。

美国一位有着30年资深药企从业经历的专家也发文抨击:AlphaFold的作用纯属媒体夸大,靠结构预测做药“纯属自嗨”。

苗洪江坦承,由于研发人员的背景经历不同,对事物的理解也存在差异,大家对于AI预测蛋白质结构的准确度和实用性尚有较大分歧,现在就让大家理解并相信AI可以实现蛋白质设计及应用更是难上加难。

这是还处在年幼阶段的赛道必须面对的现实。正是基于这些认知,天壤XLab选择此时推出CREATOR工作台,希望能通过降低蛋白质设计的门槛,推动技术普及。

据《医健AI掘金志》了解,CREATOR工作台将于10月1日正式上线,面向高校师生免费开放。到后期,天壤XLab也将推动CREATOR工作台面向企业用户的合作。

苗洪江表示,企业级的应用对于后端算力的压力会更大,且相比高校,企业的需求也会偏向个性化,面向企业的服务还需要更完善的团队来支持,公司正在积极筹备。

“这个工作台能帮助我们解决很多问题,比如说,试用并了解这个领域后,会加深大家对AI设计蛋白质的认知,兴趣会不断增加,也能帮我们开启更多合作。”

AI大分子药物研发何时迎“春天”?

AlphaFold 取得突破性进展后,整个蛋白质计算领域十分火热。尽管热度已持续一段时间,但针对蛋白质计算领域的探索其实才刚刚开始。

在苗洪江看来,目前这个领域还远远算不上竞争激烈。

“这是因为之前蛋白质计算领域,特别是在国内,是很冷门的领域,在这个领域有足够积累、了解需要做什么、应该怎么做、对如何将技术落地应用有足够思考和布局的团队其实非常的少。”

比如,最近国内一些高校才逐渐增设计算机加生物学的专业来培养复合型人才,作为根基的人才储备都跟不上,这个领域很难谈得上竞争激烈。

目前,虽然国内外都有不少公司围绕着AlphaFold 算法做商业化,但苗洪江认为,真正属于前沿的探索并不多。

苗洪江介绍,在这些商业化路径中,“有用AlphaFold 做预测服务收费、售卖算力的,也有用AlphaFold 预测结果来做大范围靶点搜索的,像美国的Cyclica,还有借助AlphaFold 辅助小分子药物研发的,像英矽智能今年的一个试验性管线就是借助了AlphaFold。”

而更前沿的探索,如蛋白质的从头设计,以及把设计蛋白开发成大分子候选药物,即发明(create)而不是现在AIDD更集中赋能的发现(screen)药物,所面临的技术难度和商业周期都要更困难、更漫长。

一个明显的信号是,近年来AI制药赛道狂奔,但更多的应用与赋能都是集中在小分子药物研发中。

相较之下,大分子药物数据稀缺,且技术壁垒更高,参与大分子药物研发的AI制药公司寥寥可数。

苗洪江表示,蛋白质从头设计的关注热度在国内要冷清不少,但在全球范围,美国头部的biotech,如Amgen、Genetech已经有所布局,来自这些美国公司的成功经验,能够给予国内创业者信心。

天壤XLab初期也以新药研发为切入场景。

苗洪江提到,在蛋白质计算领域,学术和业界都非常关注的技术方向包括,如何以计算赋能药物的靶点发现、如何设计优化特定功能蛋白质、如何计算检测蛋白质的各项理化特性等,CREATOR 工作台将逐步上线相关的算法和能力支持。

“我们希望蛋白质设计在国内也能得到大范围应用,但这项技术推广的难度很大,所以我们开发了CREATOR 工作台,希望能降低技术门槛,让更多人进入这个领域做研究,从而更快地推动应用落地。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30155

    浏览量

    268426
  • 数据库
    +关注

    关注

    7

    文章

    3765

    浏览量

    64276
  • 蛋白质
    +关注

    关注

    0

    文章

    25

    浏览量

    7976

原文标题:对话天壤XLab负责人苗洪江:如何做一款AI蛋白质设计领域的「EDA软件」?

文章出处:【微信号:IoT_talk,微信公众号:医健AI掘金志】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI实火!诺贝尔又把化学奖颁给AI大模型

    蛋白质结构预测大模型——AlphaFold系列。 今年5月9日,谷歌DeepMind重磅发布了AlphaFold-3,能够精准预测蛋白质-配体、蛋白质-核酸等在内的几乎所有PDB数据库中存在的分子组合形式
    的头像 发表于 10-10 10:38 177次阅读

    差示扫描量热仪测试蛋白质的应用案例

    过程中可能出现的吸热或放热峰,这些峰对应于角蛋白分子链的运动、微纤维的熔融、或蛋白质的变性等现象。    通过对比受延展和热处理前后的DSC曲线,研究人员可以了解这些处理对角蛋白复合物的热性质和结构稳定性的影响。例如,热处理可能
    的头像 发表于 10-09 15:45 153次阅读
    差示扫描量热仪测试<b class='flag-5'>蛋白质</b>的应用案例

    创客中国AIGC专题赛冠军天鹜科技:AI蛋白质设计引领者

    源自自然的蛋白质与现代科技的创新精神相结合,打造蛋白质设计与应用的新范式。”在江西南昌举办的第九届“创客中国”生成式人工智能(AIGC)中小企业创新创业大赛中,上海天鹜科技有限公司(下称“天鹜科技”)分享了这理念。 天鹜科技是
    的头像 发表于 09-18 12:04 212次阅读
    创客中国AIGC专题赛冠军天鹜科技:AI<b class='flag-5'>蛋白质</b>设计引领者

    什么是超声波气象仪?

    气象要素的测量集成在个紧凑的设备中,方便使用和安装。精准测量:利用超声波技术实现对风速风向等的高精度测量。实时性好:能够快速获取和更新气象数据。稳定性高:结构体化
    的头像 发表于 09-18 10:52 202次阅读
    什么是超声波<b class='flag-5'>一</b>体<b class='flag-5'>气象</b>仪?

    用APD探测100MHz脉冲激光,能否推荐一款合适的放大器?

    你好,我用APD探测100MHz脉冲激光,能否推荐一款合适的放大器?或者是合适的方案?谢谢!
    发表于 08-30 11:36

    EvolutionaryScale推出基于NVIDIA GPU模型的新型蛋白质研究方案

    EvolutionaryScale 于 6 月 25 日发布了第三代 ESM 模型 ESM3,该模型可同时对蛋白质的序列、结构和功能进行推理,为蛋白质研发工程师提供了个可编程的平台
    的头像 发表于 08-23 16:45 607次阅读

    利用微流控探针诱导的化学质膜穿孔,实现单细胞胞内蛋白质递送

    将小分子、核酸、蛋白质和药物导入细胞是监测和了解细胞行为以及生物功能的重要途径。
    的头像 发表于 05-28 10:11 507次阅读
    利用微流控探针诱导的化学质膜穿孔,实现单细胞胞内<b class='flag-5'>蛋白质</b>递送

    基于熵驱动链置换策略的高灵敏mRNA检测与细胞内成像研究

    信使RNA(Messenger RNA,mRNA)是类由DNA作为模版转录而来的携带有遗传信息的单链核糖核酸,作用是指导蛋白质的合成。
    的头像 发表于 05-08 09:08 525次阅读
    基于熵驱动链置换策略的高灵敏mRNA检测与细胞内成像研究

    洪亮团队在生信期刊JCIM发布最新成果,蛋白质工程迈入通用人工智能时代

    Networks)。在此项研究中,该团队设计了种微环境感知图神经网络ProtLGN。ProtLGN能够从蛋白质三维结构中学习有益的氨基酸突变位点,建立自然选择下的氨基酸序列分
    的头像 发表于 04-19 17:42 539次阅读
    洪亮团队在生信期刊JCIM发布最新成果,<b class='flag-5'>蛋白质</b>工程迈入通用人工智能时代

    天府锦城实验室在生物传感与蛋白质测序领域取得重要进展

    3月10日,记者从天府锦城实验室(未来医学城)获悉,四川大学华西医院临床检验医学研究中心与生物治疗全国重点实验室、天府锦城实验室(未来医学城)耿佳教授和华西第二医院陈路教授联合团队在生物传感与蛋白质测序领域取得重要进展。
    的头像 发表于 03-17 09:10 900次阅读
    天府锦城实验室在生物传感与<b class='flag-5'>蛋白质</b>测序领域取得重要进展

    种基于分子编程和液滴微流控的替代性技术用于数字检测

    单分子水平的蛋白质分析揭示了集合平均技术所掩盖的异质性行为。
    的头像 发表于 03-13 10:17 626次阅读
    <b class='flag-5'>一</b>种基于分子编程和液滴微流控的替代性技术用于数字检测

    种光固化通道数字微流控芯片(pCDMF)

    pCDMF芯片在生物医学和化学分析等领域具有广泛的应用。在生物医学领域,pCDMF芯片可以用于细胞分析、蛋白质分析和基因分析等方面。通过控制液滴的流动和混合,可以实现对细胞、蛋白质和基因的操作和分析
    的头像 发表于 01-03 13:01 649次阅读

    对新辅助TCHP治疗响应的HER2+乳腺癌空间蛋白质组特征

    GeoMx IPA可以实现对组织中任何区域(如肿瘤区域、免疫交界区域、肿瘤微环境和正常基质区域等)中的570多种蛋白质进行空间原位的表达检测,快速发现新的蛋白质生物标记物和药物靶点。
    的头像 发表于 12-26 16:52 847次阅读
    对新辅助TCHP治疗响应的HER2+乳腺癌空间<b class='flag-5'>蛋白质</b>组特征

    人工智能驱动蛋白质设计取得重大突破,人类健康和环境监测有望受益

     据华盛顿大学化学与生物工程系的David Baker教授透露,其领导的研究小组整合了深度学习算法和序列设计工具ProteinMPNN,从而实现了高效的蛋白质功能性设计。
    的头像 发表于 12-20 14:32 727次阅读

    双水相电泳分离蛋白质的研究

      本文提出了种新型的双水相电泳装1并进行了双水相电泳分离肌红蛋白和牛血清白蛋白和细胞色素C及其混合物的实验,研究了电场方向、pH值、电场强度和电泳时间对双水相萃取分离效果的影响,并与不加电场的双水相萃取的结果进行了比较。
    发表于 11-28 14:46 0次下载