微软团队发布生物医学领域NLP基准-电子发烧友网

来自：HyperAI超神经

微软的研究团队近日在 arxiv.org 发布了论文：《Domain-Specific Language Model Pretraining for BiomedicalNatural Language Processing生物医学特定领域的语言模型预训练》，介绍并开源了一个能够用于生物医学领域 NLP 基准，并命名为 BLURB。

BiomedicalLanguageUnderstanding andReasoningBenchmark 的首字母缩写，即为 BLURB 的命名规则，翻译为生物医学语言理解和推理基准。

医学 NLP 基准，BLURB 身负重任

BLURB 包括 13 个公开可用的数据集，涉及 6 个不同的任务。

为了避免偏重多可用数据集的任务，如命名实体识别（NER），BLURB 的报告和排名，将所有任务的宏观平均数作为主要得分。

图为 BLURB 中使用的数据集、以及

团队列出的训练、开发和测试中的实例数量

BLURB 排行榜是不分模型的。任何能够使用相同的训练和开发数据产生测试预测的系统都可以参与。

团队表示 BLURB 的主要目标是：降低生物医学NLP的准入门槛，帮助加快该领域的进展，能对社会和人类产生积极影响。

生物医学 NLP ：必须使用域内文本

研究已经表明生物医学 NLP 可以在医学领域提高数据集的准确性。但是在跨学科的数据集中，准确性又会大大降低。而由于不同医学领域之间（Domain）跨度较大，所以对于 NLP 的预训练会花费非常多的时间。

微软研究人员为了提升 NLP 的训练速度，通过对预训练和特定任务的微调，对生物医学 NLP 应用的影响进行了建模比较，从而评估最适合的预训练方法。

团队对域内文本与混合域外文本进行的对照

首先，团队创建了一个名为「生物医学语言理解与推理基准」（BLURB）的基准，该基准侧重于 PubMed 提供的出版物，涵盖了相似问题解答和文本提取之类的任务。

实验证明，这种对比的方法能够将 NLP 训练的速度提升数倍。

同时，为了鼓励对生物医学 NLP 的研究，研究人员创建了以 BLURB 基准为基准的排行榜，还开源了预训练模型。以求快速生物医学 NLP 能够早日投入使用。

原文标题：医学AI又一突破，微软开源生物医学NLP基准：BLURB

文章出处：【微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

微软

微软

+关注

关注
4

文章
6644

浏览量
105048
AI

AI

+关注

关注
87

文章
33025

浏览量
272812
生物医学

生物医学

+关注

关注
0

文章
47

浏览量
11244

原文标题：医学AI又一突破，微软开源生物医学NLP基准：BLURB

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

安泰：1600V高电压放大器生物研究超声测试怎么做

超声波在生物医学领域的应用已经相当广泛，包括诊断、治疗和基础研究。超声波具有无创、无痛、无辐射等优点，使得它在生物医学领域的研究中占据了重要地位。本文Aigtek 安泰电子将重点探讨

发表于 01-22 11:11 •258次阅读

安泰：1600V高电压放大器<b class='flag-5'>生物</b>研究超声测试怎么做

函数信号分析仪的原理和应用场景

可以用于测量和分析声音信号的频谱特性、声压级、声速等参数。它还可以用于测试音频设备的性能，如扬声器、麦克风等。 生物医学：在生物医学领域，函数信号分析仪可以用于测量和分析生物电信号，如

发表于 01-20 14:13

雷钰团队及合作者在二维材料缺陷调控及生物应用等领域取得新进展

自石墨烯首次被成功剥离之后，二维材料于储能、柔性器件、电子学、光子学、生物医学以及催化等诸多领域均展现出广泛的应用前景。在可规模化合成二维材料方法中，液相剥离法通过削弱块状层状材料中的范德华力，将

发表于 12-31 11:36 •359次阅读

雷钰<b class='flag-5'>团队</b>及合作者在二维材料缺陷调控及<b class='flag-5'>生物</b>应用等<b class='flag-5'>领域</b>取得新进展

短波、中波、长波和近红外VCSEL在各个领域的革命性研究

短波红外、近红外、中波及长波红外各有应用，短波红外用于目标探测等，近红外用于生物医学等，中波用于热源探测，长波用于热成像，各波段基于物质吸收特性，对应不同领域。

发表于 11-29 09:23 •850次阅读

短波、中波、长波和近红外VCSEL在各个<b class='flag-5'>领域</b>的革命性研究

功率放大器应用：超声波换能器从材料策略到生物医学的应用

，本次Aigtek安泰电子就给大家分享一篇关于超声换能器应用的综述文章，希望能对各位业内工程师的研究提供一些思路。医用超声以其安全、低成本、便捷等独特优势，在生物医学工程领域得到了广泛应用。超声换能器作为超声系统的核

发表于 11-21 11:26 •426次阅读

功率放大器应用：超声波换能器从材料策略到<b class='flag-5'>生物医学</b>的应用

高通量生物分析技术之微流控芯片

、流式芯片、毛细管电泳芯片、微电子芯片、色谱芯片及各类样品制备芯片等，目前已广泛应用于生物医学领域中。美迪西生物分析部提供全面符合FDA/CFDA GLP的生物分析服务，以支持小分子药

发表于 11-14 15:50 •447次阅读

高光谱成像技术在生物物证领域的研究进展2.0

目前高光谱成像技术主要应用于食品安全、医学诊断、航天等领域，在生物物证领域涉足较少，相关生物物证的检验与鉴定还处于空白，伴随着高光谱成像技术

发表于 10-30 18:29 •426次阅读

高光谱成像技术在<b class='flag-5'>生物</b>物证<b class='flag-5'>领域</b>的研究进展2.0

BioMEMS的原理、结构及应用

BioMEMS，一般指生物微机电系统，是一种融合微电子技术与生物医学原理的交叉学科领域。它涉及微型器件的设计、制造和应用，用于生物医学研究和临床实践中的诊断、治疗和监测。BioMEMS

发表于 10-18 15:28 •618次阅读

威世科技硅PIN光电二极管VEMD8082,引领生物医学监测新纪元

了一款革命性的硅PIN光电二极管——VEMD8082。这款新型光电二极管在可见光及近红外波长范围内展现出前所未有的高灵敏度，专为心率监测、血氧饱和度检测等前沿生物医学应用量身打造。

发表于 08-21 14:35 •8705次阅读

NLP技术在人工智能领域的重要性

智能的桥梁，其重要性日益凸显。本文将从NLP的定义、发展历程、核心技术、应用领域以及对人工智能领域的深远影响等多个维度，深入探讨NLP技术在人工智能

发表于 07-04 16:03 •924次阅读

北卡罗来纳州立大学:加速外骨骼机器人控制系统的研发

在科技日新月异的今天，生物医学工程领域的进步尤为引人注目。近日，国际知名学术期刊《自然》杂志发表了一项重要研究成果，报道了北卡罗来纳州立大学苏浩团队在生物医学工程

发表于 06-18 16:53 •732次阅读

基于CMOS芯片的高分辨、低剂量钙钛矿直接转化X射线探测器研制成功

X射线探测与成像在生物医学、工业检测和安防安检等领域应用广泛。

发表于 05-28 10:22 •2199次阅读

微软发布新版Team Copilot，强化团队协作功能

微软表示，在会议主持、团队工具、项目管理三大方向，Microsoft Team Copilot均能发挥显著作用。具体而言，其可协助会议主持人高效管理议程，制作公开会议笔记，提高讨论效果；

发表于 05-22 11:27 •592次阅读

受蜂巢结构启发的SERS微阵列，用于自动化检测唾液中脲酶活性

表面增强拉曼散射（SERS）技术，作为一种强有力的分析工具，已在化学和生物医学传感领域获得广泛应用。

发表于 05-19 10:19 •1304次阅读

电化学生物传感器在生物检测领域的显著优势

电化学生物传感器在生物检测领域具有显著的优势，这些优势不仅体现在其高灵敏度、快速响应等方面，更在于其在医学诊断、环境监测、食品安全等多个领域

发表于 04-29 10:00 •1125次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

微软团队发布生物医学领域NLP基准

评论

安泰：1600V高电压放大器生物研究超声测试怎么做

函数信号分析仪的原理和应用场景

雷钰团队及合作者在二维材料缺陷调控及生物应用等领域取得新进展

短波、中波、长波和近红外VCSEL在各个领域的革命性研究

功率放大器应用：超声波换能器从材料策略到生物医学的应用

高通量生物分析技术之微流控芯片

高光谱成像技术在生物物证领域的研究进展2.0

BioMEMS的原理、结构及应用

威世科技硅PIN光电二极管VEMD8082,引领生物医学监测新纪元

NLP技术在人工智能领域的重要性

北卡罗来纳州立大学:加速外骨骼机器人控制系统的研发

基于CMOS芯片的高分辨、低剂量钙钛矿直接转化X射线探测器研制成功

微软发布新版Team Copilot，强化团队协作功能

受蜂巢结构启发的SERS微阵列，用于自动化检测唾液中脲酶活性

电化学生物传感器在生物检测领域的显著优势