伽利略曾认为自然是用数学书写,而生物学可能是用文字来书写。自然语言处理(下文简称 NLP)算法现在能够生成蛋白质序列,并预测病毒突变、包括预测能帮助新冠病毒躲避免疫系统攻击的关键突变。
上述之所以能实现,得益于一重要洞见,即生物系统许多特性可以用单词和句子来解释。麻省理工学院计算生物学家邦妮·伯格说:“我们正在学习进化的语言。”
过去几年里,遗传学家乔治·丘奇的实验室团队、Salesforce 团队等研究人员已经证明,蛋白质序列和遗传密码可以使用 NLP 技术建模。
最近,伯格及其同事的研究发表于《科学》杂志。在研究中,伯格等人将几种毒株集合在一起,利用 NLP 来预测能帮助病毒躲避人体免疫系统抗体的突变。病毒躲过抗体称作“病毒免疫逃逸”,该研究的基本观点认为,免疫系统解读病毒类似于人类解读句子。
Salesforce 科学家阿里·马达尼正利用 NLP 预测蛋白质序列,他说:“论文写得很好,延续之前工作的发展势头。”
伯格团队使用了语法和语义(或称意义)这两种语言学概念,病毒感染宿主的能力等遗传或进化适应性特征,可从语法正确程度的角度来解读。病毒传染性强,在语法层面为正确;病毒传染性不强,则为不正确。
同样,病毒突变可以用语义来解释。比如,病毒表面蛋白质突变,某些抗体便无法发现病毒,像这样导致病毒在环境中与其它事物区分开来的变异,便是改变了病毒的语义。病毒突变可以有不同语义,而每一种有自身语义的病毒可能需要不同抗体来解读。
为建立这些特性的模型,研究人员使用了 LSTM 神经网络,LSTM 诞生在基于变形金刚的神经网络出现之前,后者现为 GPT-3 等大型语言模型所使用。LSTM 等存在较久的网络所需训练数据比变形金刚少得多,并且在许多应用中仍然表现良好。
研究人员不是用数百万个句子,而是利用取自三种病毒的数千个基因序列训练 NLP 模型。这些序列为流感病毒株的 4.5 万个独特序列、HIV 病毒株的 6 万个独特序列、以及新冠病毒病毒株的 3000 到 4000 个独特序列。麻省理工学院研究生布莱恩·希建立了模型。他说:“由于对新冠病毒的监测较少,新冠病毒的数据较少。”
NLP 模型在数学空间中对单词进行编码,单词和单词间若含义相近,距离会更近,反之,距离则更远。这一过程称为“嵌入”。在病毒层面,基因序列的嵌入便是根据病毒突变的相似性,对病毒进行分组。
该方法的总目标,是识别那些可能帮助病毒逃逸免疫系统、且不降低病毒传染性的突变,也就是说要识别那些改变病毒含义、而又不导致病毒语法错误的突变。为测试模型,研究团队使用评估机器学习模型所做预测的通用度量标准,该标准给精确度打分的区间为 0.5(相当于意外发生的概率)到1(完美)。
研究中,研究人员采用由模型识别、最有可能出现的突变,并在实验室中利用病毒,检查这些突变中有多少确实是会帮助病毒逃逸免疫的突变。精确度分数最低值为针对 HIV 病毒株的预测结果精确度,为 0.69;最高值为针对新冠病毒病毒株的预测结果精确度,为 0.85。研究人员表示,实验结果比其他最先进模型的结果要好。
预先警告
知道可能会有哪些突变,医院和公共卫生当局便更容易提前计划。例如,要模型显示出某种流感病毒的语义自 2020 年以来发生了多大变化,就能预计人们已经产生的抗体在今年会发挥多大作用。
该研究团队表示,正在根据新冠病毒新变种运行模型。针对的新变种包括英国出现的变异病毒、丹麦水貂体内出现的变异病毒、以及南非、新加坡和马来西亚出现的变异病毒。研究人员已经发现,这些变异病毒免疫逃逸潜力可能很高,但尚未在实验室外进行测试。
不过,模型没有预测到南非变异病毒出现的一种变异。人们已经开始担心,这种变异可能帮助病毒躲避疫苗接种,目前研究人员正在尝试探明原因。伯格说:“南非变异病毒里包含多个突变,我们认为,这些突变组合起来产生的效应可能会导致免疫逃逸。”
使用 NLP 可以加速原本缓慢的研究进程,以前是从医院里一名新冠患者身上提取病毒、测序基因组,并在实验室里重新创造和研究相应突变。项目研究人员麻省理工学院生物学家布赖恩·布莱森说,以前的做法可能需要几周时间,NLP 模型可以直接预测潜在突变,实验室研究便找到重点、工作速度也加快。
布莱森说:“整个工作很大开眼界。”每周都有新病毒序列。布莱森说:“一边更新模型,一边跑去实验室进行实验测试,很奇妙。计算生物学好就好在这。”
但这也只是开始。将基因突变视为语义变化,可以在生物学中有不同应用。布莱森说:“一个好类比,能起很大作用。”
例如,希认为研究团队的方法可以应用于研究抗药性。希说,“比如癌细胞蛋白质对化疗产生耐药性、或者细菌蛋白质对抗生素产生耐药性”,这些变异也可以看作是意义上出现变化,“我们解读语言模型,可以有很多创意。”
马达尼说:“我认为,生物学正处在革命边缘。我们不再仅仅收集大量数据,而正在转向学习如何深入理解数据。”
总体来说,研究人员正在关注 NLP 的发展,同时发掘语言和生物学之间的新类比,来利用NLP取得的进步。不过,布莱森、伯格和希都认为,生物学和 NLP 算法交叉可以是双向,即新 NLP 算法受生物学概念启发而诞生。伯格说:“生物学有自己的语言。”
责任编辑:lq6
相关推荐
单克隆抗体(monoclonalantibody,mAb)是由单一B细胞克隆产生的高度均一、仅针对某....
发表于 2023-06-15 14:48•
2292次阅读
如果您怀疑自己的 Android 智能手机可能已被黑客入侵,以下是一些有关如何确定的提示
发表于 2022-08-25 14:51•
4305次阅读
多功能酶标分析仪是对酶联免疫检测(EIA)实验结果进行读取和分析的医疗设备。其优点在于能够快速、高精....
发表于 2021-12-09 10:41•
1665次阅读
酶标仪是什么?酶标仪是酶联免疫吸附试验的专用医疗设备,又称微孔板检测器。比较简单的说法就是比分光光度....
发表于 2021-09-03 10:15•
4528次阅读
默沙东从康方生物引进的 CTLA-4 单抗联合疗法在华获批临床 中国国家药品监督管理局药品审评中....
发表于 2021-03-09 11:55•
1929次阅读
如果不需要或者不信任第三方杀毒软件,微软Win10自带的Defender杀毒软件也够用了,比较烦人的....
发表于 2021-01-19 15:06•
1760次阅读
想要了解引导型病毒的攻击原理,首先要了解引导区的结构。硬盘有两个引导区,在0面0道1扇区的称为主引导....
发表于 2021-01-03 16:33•
3908次阅读
计算机病毒(Computer Virus)是人为制造的、能够进行自我复制的、对计算机资源具有破坏作用....
发表于 2020-12-25 15:54•
14280次阅读
富士康被黑客攻击,索要2.3亿元赎金 据外媒报道,富士康母公司鸿海集团的墨西哥工厂被勒索软件“Dop....
发表于 2020-12-09 15:53•
2117次阅读
11月27日消息,据媒体报道,330万台老年机被植入木马病毒,数以万计的公民个人信息被非法获取。 据....
发表于 2020-11-27 15:34•
2662次阅读
近来,科学家们在微型电池上取得了重要突破。他们开始利用只有直径只有6纳米的病毒来制造电池,这种微型电....
发表于 2020-11-12 17:07•
1558次阅读
据美国媒体报道称,该国的佛罗里达州宣布,已经批准向环境中释放7.5亿只转基因蚊子,以减少当地这种吸血....
发表于 2020-11-06 10:23•
1098次阅读
勒索病毒与挖矿病毒可以说是“老熟人”了,各类安全事件一直不乏他们活跃的身影:在第二季度,亚信安全共拦....
发表于 2020-08-27 10:15•
2452次阅读
Signify的首席执行官近日指出有将紫外线灯产量提高八倍的计划,此前Signify已经与波士顿大学....
发表于 2020-07-28 10:59•
757次阅读
昕诺飞宣布,在其与波士顿大学美国国家新发传染性疾病实验室(NEIDL)联合开展的研究证实,昕诺飞的U....
发表于 2020-07-23 11:42•
884次阅读
在新型冠状病毒肺炎疫情爆发之后,美国哥伦比亚大学和日本神户大学皆宣布开展研究证明了波长为222nm的....
发表于 2020-07-21 10:22•
2577次阅读
一种新的基于Node.js的远程访问木马恶意软件正在通过伪装成美国财政部的电子邮件进行传播。
发表于 2020-07-02 14:37•
6806次阅读
在我们日常使用电脑过程,经常会遇到如下问题:学生做网络实验时一台电脑不够用,身边又没有其他电脑;想要....
发表于 2020-07-01 15:29•
2432次阅读
而且如果中了病毒的计算机属于高性能的服务器,病毒还会在这台电脑当中植入“挖矿”程序, 如果中招的电脑....
发表于 2020-06-30 11:15•
5574次阅读
“尽管专家们似乎对COVID-19是否通过空气传播(除了非常特殊的情况,比如当给感染的病人插管时)没....
发表于 2020-06-11 10:00•
2662次阅读
此外基于实际应用需求,电杀菌材料同时要满足如下几个条件:1) 选择材料通透性和耐腐蚀性能要好,不影响....
发表于 2020-06-05 10:46•
3334次阅读
《自然-通讯》发表的一篇论文A human monoclonal antibody blocking....
发表于 2020-06-05 10:38•
2567次阅读
目前根据最新的消息称“WannaRen”病毒存在两个变体,一个通过文字,另一个通过图片发送勒索信息。
发表于 2020-04-13 11:13•
1342次阅读
近日据相关媒体报道,互联网上出现了一种新型的勒索软件“ WannaRen”病毒,它的攻击行为类似于此....
发表于 2020-04-10 14:22•
702次阅读
据媒体报道,近日网络上出现了一种名为“WannaRen”的新型比特币勒索病毒,与此前的“WannaC....
发表于 2020-04-08 09:41•
2860次阅读
近日,工业控制系统安全国家地方联合工程实验室发布了《IT/OT一体化工业信息安全态势报告》。报告显示....
发表于 2020-03-12 11:28•
463次阅读
2019年12月23日发表在《美国国家科学院院刊》上的一项新研究描述了由宾夕法尼亚州立大学和纽约大学....
发表于 2020-01-13 10:35•
1397次阅读
据《数据泄露损失研究》评估显示,遭遇数据泄露事件的公司企业平均要损失386万美元,同比去年增加了6.....
发表于 2019-08-08 11:47•
884次阅读
专家表示,十五年前的病毒MyDoom依旧极具破坏力,迄今已造成超过380亿美元的损失。
发表于 2019-07-31 17:31•
2399次阅读
据外媒报道,Dridex是著名的特洛伊木马,专门窃取网上银行凭证。该恶意软件于2014年被首次发现,....
发表于 2019-07-03 14:51•
2246次阅读
谁能想到你下载的盗版插件竟然能在背地里用你的电脑为他人挖矿?
发表于 2019-07-01 16:32•
3042次阅读
黑客利用了至少三家托管服务提供商,用于扩散勒索软件。
发表于 2019-06-25 15:34•
2097次阅读
工控系统和一般的办公设备不同,工控系统冗余量小,一旦被感染,即使是只有部分的设备也会造成整个生产线的....
发表于 2019-06-18 11:40•
1375次阅读
为未来开发新一类抗病毒药物提供了理论支持。
发表于 2019-06-14 10:22•
4375次阅读
GandCrab的工作人员表示:“目前已经将这笔钱兑换成了现金,该退休了,这些钱是我们应得的,并不存....
发表于 2019-06-03 11:16•
3047次阅读
美国Verint公司的以色列办事处受到了勒索软件的攻击,FireEye公司正协助恢复工作。
发表于 2019-04-23 16:23•
2777次阅读
研究人员最近在美国发现了一件不寻常的事,在美国注册的十多台服务器上,托管着10个不同的恶意软件家族!
发表于 2019-04-08 15:57•
2877次阅读
安全研究人员发现了Mirai物联网僵尸网络的一个新变种,这次的变种是针对商业环境的嵌入式设备。这些新....
发表于 2019-03-21 10:19•
3019次阅读
奥地利杀毒测试机构AV-Comparatives研究发现,大约三分之二的安卓杀毒软件并没有合格的杀毒....
发表于 2019-03-18 14:45•
2114次阅读
俄罗斯杀毒软件公司 Dr.Web 近日公开了一个被称为 Linux.BtcMine.174 的新型木....
发表于 2018-11-25 10:30•
3980次阅读
国内医疗系统受到攻击,医院不能正常开诊;受病毒入侵,国内部分加油站不能通过加油卡和网上支付消费……这....
发表于 2018-08-25 11:41•
867次阅读
DDoS攻击:学名为分布式拒绝服务攻击,在此我们称它为“捣蛋鬼军团”。这帮“家伙”可是串通一气的,它....
发表于 2018-08-22 15:45•
4618次阅读
8月3日晚,台积电突然传出消息,营运总部和新竹科学园区的的12英寸晶圆厂的电脑,遭到勒索病毒入侵,生....
发表于 2018-08-08 11:34•
6255次阅读
在消费者对苹果最新产品翘首以待之时,上游晶圆制造商台湾积体电路制造股份有限公司(简称台积电)突发的一....
发表于 2018-08-08 10:02•
2875次阅读
台积电刚刚公布了遭受电脑病毒攻击之后的详细恢复进展,同时还警告称,该公司产品发货可能因此推迟,营收也....
发表于 2018-08-07 11:33•
621次阅读
` 去年五月份的WannaCry让我第一次知道了勒索病毒,记得病毒爆发的时候,那家...
发表于 2018-03-09 14:00•
9982次阅读
工业物联网以物联网为基础,与工业生产相结合,是从数据传输到信息整理、再通过信息来控制设备的一个过程,....
发表于 2017-11-23 09:09•
6051次阅读
10月25日据多家国外媒体报道,一种名叫“坏兔子(Bad Rabbit)”的新型勒索病毒从俄罗斯和乌....
发表于 2017-10-25 23:48•
83378次阅读
`论坛是不是中病毒了啊?`
发表于 2017-08-22 08:36•
2905次阅读
据外媒消息,乌克兰等多国正在遭遇Petya勒索病毒的袭击,政府、银行等重要系统受攻击影响。此次黑客使....
发表于 2017-07-03 17:06•
724次阅读
27号,包括乌克兰在内的多个欧洲国家遭遇新一拨的大范围电脑病毒攻击,多地出现电脑故障和互联网中断。有....
发表于 2017-06-29 09:26•
857次阅读
6月27日晚间,总部位于伦敦的全球最大广告公司 WPP,是英国第一家被爆受到波及的公司,员工们已经被....
发表于 2017-06-28 11:48•
798次阅读
前段时间,Windows平台下的比特币勒索病毒在全球大规模爆发,引发了人们对网络安全的再次警觉。
发表于 2017-06-20 15:59•
879次阅读
五月中旬,名为 WannaCry (想哭)的勒索病毒在全球范围大爆发,超过150个国家和地区在24小....
发表于 2017-05-24 11:28•
843次阅读
想必周末的时候,wannacry的新闻已经刷爆了小伙伴们的朋友圈,周一上班关于“勒索病毒”的消息更是....
发表于 2017-05-19 14:41•
864次阅读
你被病毒黑客勒索了吗?从上周五开始,一款名为“WannaCry”(想哭)的勒索病毒开始在全球范围内肆....
发表于 2017-05-18 15:42•
785次阅读
评论