0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于基因表达谱变化直接预测药效的计算模型

hl5C_deeptechch 来源:生辉SciPhi 作者:生辉SciPhi 2021-06-21 15:13 次阅读

鉴于许多疾病机理不明确或者发病机制涉及多条信号通路,基于靶点的药物开发策略存在一定的局限性。因此,开发一种不依赖于靶点,可以直接预测药效的计算模型似乎是一种解决方案,以往的研究人员已经进行了尝试,但是建立的模型往往针对一种疾病有效,缺乏普适性。

由于大部分疾病都会表现出基因表达谱的变化,研究人员利用化合物诱导的基因表达谱变化作为中间指标进行药效预测,开发出了一种基于基因表达谱变化直接预测药效的计算模型,这种模型适用于多种疾病研究和相关药物研发。

6 月 17 日,北京大学谢正伟团队在 Nature Biotechnology 在线发表了这项研究。在这项研究中,他们详细介绍了这种基于基因指纹和深度学习的药效预测系统(DLEPS,中文名灵素系统),并证明了 DLEPS 是一种药物发现和重定位的有效工具。在论文中,他们针对 3 种代谢性疾病开发了重定位和全新化合物分子。

有审稿人称,灵素系统是一个高度原创的解决方案,也是第一个被报道用神经网络连接化合物结构和基因表达谱的研究。

“这项工作初步完成了我的期望和设想”,谢正伟告诉生辉。

借此,生辉独家专访了该研究的共同通讯作者谢正伟博士。

今年是谢正伟独立开展科研活动的第五个年头。他现在是北京大学医学部的副研究员以及独立实验室负责人,长期从事基于多学科交叉和人工智能的创新药物算法开发,以及细胞衰老机制的研究。此前,他从事纯计算的研究工作,开发过微流芯片,并与诺奖得主 Elizabeth H.Blackburn 共同合作在 Cell 发表过论文。

2018 年,他创立了亿药科技,利用 AI 和深度学习加速药物研发。据谢正伟透露,亿药科技拥有一支多学科交叉创始团队,具有从头开发算法的能力,同时也有分子细胞生物学、结构生物学研究能力。目前团队规模 20 人左右,专业涵盖药理学、人工智能、药物化学、药理验证等。

利用 “基因指纹” 预测分子性能

多种疾病特别是年龄、代谢相关疾病的发生和发展都是由于系统失衡造成的基因表达紊乱,通过检测 “基因指纹” 即基因表达谱可以观察和研究疾病变化。

一方面,基因表达谱的检测可以应用于疾病生物标记物的筛选;另一方面,基因表达谱的检测也可以为基因功能研究提供线索,揭示疾病发生发展的分子机制。

在论文中,科研人员开发的灵素系统正是利用基因表达变化谱为中间指标建立了预测药效的计算模型,与传统连接图方法相比,这种模型适用于没有实验数据或者未发现的药物分子。而连接图方法虽然采用基因表达谱变化为指标,但是这种方法往往只适用于已有实验数据的分子,对于新分子束手无策。

在该研究中,他们首先构建了神经网络,使用 SMILES 化学编码输入,将小分子在高维空间进行编码,高维空间的坐标向量进一步预测 1000 个标记基因,然后对超过 1 万个基因进行预测;紧接着,他们用疾病相关基因指纹来反映特定疾病的 “内在痕迹”,并且使用基因集合富集分析 (GSEA) 来评估化合物对疾病的潜在疗效。

SMILES 即简化分子线性输入规范,这是一种用 ASCII 字符串明确描述分子结构的规范。GSEA:是一种分析基因表达信息的方法。

谢正伟团队将这种方法和模型称为基于深度学习的药效预测系统 —— 灵素系统。在预测基因表达变化部分,系统可以准确预测新分子对转录组造成的影响,训练集和测试集中预测的和真实的基因表达谱变化的平均相关性为 0.90 和 0.74,分布峰值分别在为 0.93 和 0.90。

这些指标说明系统成功地从已有数据中学习到深层次的分子结构 - 基因表达谱变化之间的关联,达到了外推到虚拟分子的效果。

“灵素系统在测试集上的优异表现,使我们相信灵素系统对于新结构分子,也可以取得准确的预测结果”,谢正伟说。

接下来,研究人员深入探索了测试集的一部分分子,这些分子在训练集中没有非常相似的分子。

“我们发现,灵素系统可以精确预测新结构小分子诱导的基因表达谱变化(平均相关性 0.6)。同时,系统还可以准确区分结构非常相似的小分子(只差一个基团)诱导的基因表达谱差异”,谢正伟补充道。

研究人员还分析出了哪些基团倾向于保持表达谱不变或者更倾向于改变,这些分析对于后续的药物设计至关重要。

谢正伟告诉生辉,与传统基于靶点的方法或者单基因标记筛选方法相比,灵素系统具有三大优势:

一是,灵素系统同时考虑多个基因指标,精度更高。灵素系统更加灵活,仅基于基因指纹就可预测候选分子,可以在复杂疾病上得到更好药效的化合物,更快的找到工具分子。

二是,灵素系统不需要预先合成实体分子库,大大的降低了成本和工作量,效率更高。

三是,找到小分子以后可以进一步发现疾病的新靶点,从而实现在药效预测和靶点上开发双管齐下、同步进行。

具有通用性,可预测多种疾病药物分子

“第一次看到这么好的拟合效果,我惊讶得半天说不出话来。不过,系统是否真正有用还得在实践中验证。由于动物实验周期长,验证的病种多,我们光验证就花了两年的时间”,谢正伟说。

在实验验证方面,谢正伟遇到了北京大学基础医学部郑瑞茂研究员,郑瑞茂当时正在测试雷公藤素,这是一个和连接图方法有渊源的分子。

两人一拍即合, 一番交流之后,郑瑞茂很快理解了灵素系统的潜在价值,并在促进脂肪褐变和减肥领域进行了尝试。

他们利用灵素系统预测了四个化合物,其中三个化合物可降低小鼠的脂肪含量,并且诱导数十个褐变基因表达上调,使白色脂肪组织变成棕色脂肪组织,减轻了小鼠的体重,达到了减肥目的。

“这大大增强了我们的信心,然后我们继续尝试扩展到其他的领域”,谢正伟说。

据谢正伟透露,针对高尿酸血症,灵素系统成功预测了天然产物紫苏烯,其可降低血清尿酸,效果上优于四种阳性药物,还具有抗炎和抗纤维化的优势。

针对非酒精性脂肪性肝炎(NASH),他们发现三种可缓解 NASH 进展的 MEK-ERK 信号通路抑制剂,并首次揭示了 MEK-ERK 通路在 NASH 中的重要作用。NASH 是一种在全球范围内十分普遍的慢性肝病,NASH 患者 10 年内肝硬化发生率高达 25%,市场需求巨大。吉利德、武田等制药大厂纷纷重金布局该领域,然而目前全球尚无一款药物获批上市。

“针对 NASH 适应症,我们发现至少需要调节七个通路才能取得良好的治疗效果,而这正是灵素系统所擅长的”,谢正伟说。

SaaS 服务基础上做自研

2016 年,谢正伟在北京大学医学院建立独立实验室,立志研发抗衰老药物。

“当时我们已经建立了一套高通量筛选系统,但是筛选效率低,无法满足针对多种疾病筛选药物分子的需求。我希望通过 AI 和深度学习预测化合物性能,寻找一些可以抗衰老的化合物,于是开发了这套灵素系统”,谢正伟说。

2018 年,谢正伟正式落地亿药科技,将自己的科研成果转化为 “药”。同年,亿药科技完成了种子轮融资。

据谢正伟介绍,论文中只提到了 3 种代谢性疾病,实际上,他们还在探索肌腱愈合、骨质疏松、长寿等领域的潜力,现在已经找到了长寿的化合物。借助于研发优势,亿药科技还开发了一条替代 GLP-1 的 “爆款” 管线。GLP-1 是 2 型糖尿病药物的主要作用靶点,GLP-1 类药物是糖尿病和减肥领域最闪耀的药物之一。

基于一系列的研究成果,亿药科技已经搭建了多条创新管线和 “老药新用” 管线,并且申请了十几个相关的专利。

药物发现处于整个生物医药产业链最前端,也是产生核心专利阶段。据了解,论文中涉及的小分子 - 神经网络 - 基因表达变化 - 药效的算法框架已经申请国内外专利。

“对我们来说,这个专利的优先权具有非常重大的意义和保护作用。因为它的出发点是一个原始创新的框架,所以保护范围非常大,能够帮助亿药科技建立专利壁垒和保持竞争优势”,谢正伟说。

谢正伟告诉生辉,一家 AI 制药公司的核心竞争力,主要体现在商业发展上,可以简单归结为两个指标。第一个指标是做技术服务的能力,是否能拿到大公司的订单;另一个指标是自研管线,是否有成为创新型研发中心以及未来成为药企的潜力。

基于灵素系统以及搭建的人工智能平台、药物化学平台、药理验证平台,亿药科技最近拿到中国科学院以及一家头部药企的订单合同。

“我们的商业模式可以简单归结为 3 种,一是提供 SaaS 平台付费计算服务,二是提供化合物筛选等技术服务,三是自有管线的研发”,谢正伟说。

目前,亿药科技正在进行 Pre-A 轮融资,本轮融资将会用于自有管线研发、平台建设、队伍扩充和管线的 IND 推进。

“做药一直是我们的初衷,我希望亿药科技成为一家 AI + 大数据驱动的科研型制药公司。未来,我们会在提供 SaaS 服务和技术服务的基础上,注重推动自研管线,并将这些管线推向临床、推向市场,最终使患者受益”,谢正伟这样描述亿药科技未来的发展规划。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30122

    浏览量

    268407
  • 人工智能
    +关注

    关注

    1791

    文章

    46853

    浏览量

    237544
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120975

原文标题:基于基因指纹的药效预测新模型登顶刊,这家AI制药初创瞄准衰老代谢疾病丨专访亿药科技

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一种创新的动态轨迹预测方法

    本文提出了一种动态轨迹预测方法,通过结合历史帧和历史预测结果来提高预测的稳定性和准确性。它引入了历史预测注意力模块,以编码连续
    的头像 发表于 10-28 14:34 286次阅读
    <b class='flag-5'>一种</b>创新的动态轨迹<b class='flag-5'>预测</b>方法

    规则音频是一种连续变化的什么信号

    规则音频信号是指在时间上具有定规律性的音频信号,它们通常用于通信、音乐、语音处理等领域。 规则音频信号的定义 规则音频信号是一种在时间上呈现周期性或准周期性变化的声波。这种信号可以通过数学函数
    的头像 发表于 08-25 15:41 246次阅读

    matlab预测模型怎么用

    MATLAB预测模型一种基于统计和数学方法的预测工具,广泛应用于各种领域,如金融、气象、生物医学等。本文将介绍MATLAB预测
    的头像 发表于 07-11 14:33 539次阅读

    MATLAB预测模型哪个好

    在MATLAB中,预测模型的选择取决于数据类型、问题复杂度和预测目标。以下是些常见的预测模型
    的头像 发表于 07-11 14:31 380次阅读

    如何使用MATLAB创建预测模型

    在这篇文章中,我们将讨论如何使用MATLAB创建预测模型。MATLAB(矩阵实验室)是一种用于数值计算、可视化和编程的高级编程语言和交互式环境。它广泛应用于工程、科学研究和金融领域。
    的头像 发表于 07-11 14:29 619次阅读

    matlab预测模型有哪些

    环境,使其成为预测模型开发和实现的理想平台。本文将详细介绍MATLAB中常用的预测模型及其应用。 线性回归模型 线性回归是
    的头像 发表于 07-11 14:27 687次阅读

    bp神经网络预测模型建模步骤

    BP神经网络(Backpropagation Neural Network)是一种多层前馈神经网络,其核心思想是通过反向传播算法来调整网络中的权重和偏置,从而实现对输入数据的预测或分类。本文将详细
    的头像 发表于 07-11 10:52 441次阅读

    arimagarch模型怎么预测

    ARIMA-GARCH模型一种时间序列预测方法,它结合了自回归积分滑动平均(ARIMA)模型和广义自回归条件异方差(GARCH)模型。AR
    的头像 发表于 07-09 10:22 411次阅读

    rup是一种什么模型

    RUP(Rational Unified Process,统建模语言)是一种软件开发过程模型,它是一种迭代和增量的软件开发方法。RUP是由Rational Software公司(现为
    的头像 发表于 07-09 10:13 1149次阅读

    神经网络预测模型的构建方法

    神经网络模型作为一种强大的预测工具,广泛应用于各种领域,如金融、医疗、交通等。本文将详细介绍神经网络预测模型的构建方法,包括
    的头像 发表于 07-05 17:41 603次阅读

    人工神经网络模型一种什么模型

    人工神经网络(Artificial Neural Networks,简称ANNs)是一种受生物神经网络启发而产生的数学模型,用于模拟人脑处理信息的方式。它由大量的节点(或称为神经元)相互连接而成
    的头像 发表于 07-04 16:57 767次阅读

    一种利用光电容积描记(PPG)信号和深度学习模型对高血压分类的新方法

    高血压,因为这种情况的初期症状并不明显。高血压阶段的分类也很有用,这样个人就可以根据他所处的阶段进行以下生活方式的改变。 光电体积描记法(PPG)是一种检测血液循环变化的光学方法。它主要是表示血容量随时
    发表于 05-11 20:01

    Meta发布新型无监督视频预测模型“V-JEPA”

    Meta,这家社交媒体和科技巨头,近日宣布推出一种新型的无监督视频预测模型,名为“V-JEPA”。这模型在视频处理领域引起了广泛关注,因为
    的头像 发表于 02-19 11:19 939次阅读

    LabVIEW进行癌症预测模型研究

    LabVIEW进行癌症预测模型研究 癌症是一种细胞异常增生的疾病。随着年龄的增长,细胞分裂速度放缓,但癌细胞会失去控制地不断分裂,形成可能良性或恶性的肿瘤。 2012年的国际癌症数据显示,新发癌症
    发表于 12-13 19:04

    如何从个简单的数学表达式创建个Saber模型

    如何从个简单的数学表达式创建个Saber模型,将你的输出描述为输入的函数?例如 out=a*in*in+b (其中 a 和 b 是常数)。
    的头像 发表于 12-05 13:42 687次阅读
    如何从<b class='flag-5'>一</b>个简单的数学<b class='flag-5'>表达</b>式创建<b class='flag-5'>一</b>个Saber<b class='flag-5'>模型</b>?