0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软亚洲互联网工程院NLP团队重磅推出开源项目NeuronBlocks

DPVg_AI_era 来源:lq 2019-05-13 09:02 次阅读

近日,为了提高NLP深度学习模型过程中的效率,微软亚洲互联网工程院NLP团队重磅推出开源项目NeuronBlocks,使得上述复杂的任务像搭积木一样简单!

其实,构建NLP深度学习模型就是搭积木。

在构建自然语言理解深度学习模型过程中,研究人员或者工程师们经常需要在编程细节和代码调试上花费大量精力,而不是专注于模型架构设计与参数调整。

为了提升构建深度模型的效率,微软亚洲互联网工程院自然语言理解团队 (STCA NLP Group, Microsoft) 推出了开源项目NeuronBlocks——自然语言处理任务的模块化深度学习建模工具包。

论文地址:https://arxiv.org/abs/1904.09535

项目地址:https://github.com/Microsoft/NeuronBlocks

NeuronBlocks将常用的神经网络层封装为标准模块,通过配置简单的配置文件,就可以轻松构建复杂的深度神经网络模型。与此同时,工具包还提供了一系列针对常见NLP 任务的经典模型。NeuronBlocks能使工程师们在几秒钟内快速构建和训练各种自然语言处理模型。工具包的可扩展性很强,支持快速加入新的神经元模块用于新的网络模型的构建,最大程度地避免重复的代码工作。

目前工具包支持的任务包括:句子分类(二/多分类),文本匹配,序列标注,阅读理解,基于知识蒸馏的模型压缩,等等。

NeuronBlocks设计

NeuronBlocks是基于PyTorch的NLP深度学习建模工具包,可以帮助研究员或者工程师们快速构建自然语言理解任务的深度神经网络模型。该工具包的主要目标是将NLP深度神经网络模型构建的开发成本降到最低,包括模型训练阶段和推断阶段。NeuronBlocks整体框架如下图所示,包括Block Zoo和Model Zoo两个重要组件。

Block Zoo将常用的神经网络层抽象并封装为可重用的标准模块。这些模块将被用于构建各种针对不同自然语言理解任务的深度学习模型。工具包目前支持的标准神经网络模块包括:词嵌入、CNN、LSTM/GPU、Transformer和各种Attention等。

Model Zoo提供大量预构建好的深度神经网络模型,涵盖了常见的NLP任务。这些模型以JSON配置文件的形式呈现,用户可以通过简单修改Model Zoo中的示例模型配置,即可将其应用于自己的任务中。此外,工具包支持Linux和Windows操作系统CPU与GPU处理器、以及PAI等GPU调度平台。

快速开始

NeuronBlocks目前支持:Python 3.6, PyTorch 0.4.1,Linux/Windows,GPU/CPU。

1、获取源码:

gitclonehttps://github.com/Microsoft/NeuronBlocks

2、安装依赖包:

pipinstall-rrequirements.txtpipinstalltorch==0.4.1

3、运行示例模型:

#训练cdPROJECT_ROOTpythontrain.py--conf_path=model_zoo/demo/conf.json#测试pythontest.py--conf_path=model_zoo/demo/conf.json#预测pythonpredict.py--conf_path=model_zoo/demo/conf.json

NeuronBlocks工作流程

用户可以选择Model Zoo中的示例模型(JSON配置文件)开启模型训练,或者利用Block Zoo中的标准神经网络模块自由构建新的模型架构,就像玩乐高积木一样。

模型可视化工具

NeuronBlocks提供了一个模型可视化工具,可以快速绘制模型架构图,如下图所示。

NeuronBlocks优势

模型构建:用户只需要配置简单的JSON文件,就能够构建模型和调整参数,大大减少了模型实现的工作量;

模型分享:可以通过分享JSON配置文件来分享模型,使模型共享变得非常容易。对于不同的任务或模型,用户只需维护一个通用的源码库;

代码重用:可以在各任务与模型间共享神经网络模块,减少重复的编程工作;

平台灵活性:可以在Linux和Windows机器上运行,支持CPU和GPU,也支持像Open PAI这样的GPU管理平台;

模型可视化:提供了一个模型可视化工具,用于观察模型结构及检查JSON配置的正确性;

可扩展性:支持用户贡献新的神经网络模块或者新的模型。

当然,有兴趣的读者可以加入NeuronBlocks开源项目,一起贡献代码!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120969
  • 自然语言处理

    关注

    1

    文章

    612

    浏览量

    13504
  • nlp
    nlp
    +关注

    关注

    1

    文章

    487

    浏览量

    22010

原文标题:【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    esp8266已连接到Wifi但无法连接到互联网,为什么?

    首先,我想说对不起,如果我的帖子在错误的线程中。在那之后,我想问一个问题,我的 esp12E 已连接到 Wifi,但它无法连接到互联网,即使 wifi 连接到互联网和其他设备,它仍然完美地使用互联网
    发表于 07-09 07:11

    工业互联网平台中什么是关键

    工业互联网平台是工业领域数字化转型的重要支撑,其关键要素包括以下几个方面: 网络基础设施 网络基础设施是工业互联网平台的基础,包括有线网络、无线网络、物联网等。工业互联网平台需要实现设
    的头像 发表于 07-02 09:37 652次阅读

    开芯发布全球首个开源大规模片上互联网络IP“温榆河”

    2024年5月21日,北京开源芯片研究(简称“开芯”)通过线上会议的方式,向会员单位正式发布了全球首个开源大规模片上互联网络(Netwo
    的头像 发表于 06-04 08:37 11.7w次阅读
    开芯<b class='flag-5'>院</b>发布全球首个<b class='flag-5'>开源</b>大规模片上<b class='flag-5'>互联网</b>络IP“温榆河”

    启明信息参与主编《工业互联网平台》系列团体标准

    为贯彻落实《国务关于深化“互联网+先进制造业”发展工业互联网的指导意见》,加快推进我国工业互联网创新发展,中国和平利用军工技术协会已批复《工业互联
    的头像 发表于 05-19 09:52 534次阅读
    启明信息参与主编《工业<b class='flag-5'>互联网</b>平台》系列团体标准

    嵌入式学习-飞凌嵌入式ElfBoard-项目分享|基于ELF 1S开发板完成的物联网开源项目

    网络连接,这几种方式都可以选用,由于ELF 1S开发板默认板载了一个RTL8723DU1 无线Wi-Fi模块,因此,本项目选用Wi-Fi无线连接方式,让开发板接入互联网。 十分方便
    发表于 05-16 09:19

    飞凌嵌入式-ElfBoard-项目分享|基于ELF 1S开发板完成的物联网开源项目

    网络连接,这几种方式都可以选用,由于ELF 1S开发板默认板载了一个RTL8723DU1 无线Wi-Fi模块,因此,本项目选用Wi-Fi无线连接方式,让开发板接入互联网。 十分方便
    发表于 05-16 09:12

    华为副总裁胡玉海重磅发布《新型工业互联网平台参考架构》白皮书

    近日,在华为分析师大会上,华为混合云副总裁胡玉海重磅发布《新型工业互联网平台参考架构》白皮书,在传统工业互联网的基础上,融入大模型的能力,让智能化赋能新型工业化。
    的头像 发表于 04-20 09:55 1102次阅读

    什么是卫星互联网?卫星互联网的组成

    卫星互联网是指基于卫星通信技术接入互联网,其业务可覆盖全球。通过一定数量卫星的规模组网,构建具备实时信息传输能力的星座系统,卫星互联网可向终端用户提供以宽带互联网接入为主的通信服务。
    发表于 04-17 10:01 970次阅读
    什么是卫星<b class='flag-5'>互联网</b>?卫星<b class='flag-5'>互联网</b>的组成

    工业互联网平台是什么

    工业互联网平台(Industrial Internet Platform)是面向工业领域的一种综合性的云计算和大数据分析平台。它将互联网、物联网、大数据、人工智能等新一代信息技术与传统工业技术深度
    的头像 发表于 03-28 15:38 1515次阅读

    能源互联网平台的功能和应用场景

    能源项目通常涉及电、热、冷、气、水等多个能源种类,涉及的能源设备更是多种多样,加上分布式的特点,对能源工程师的要求越来越高。随着科技的飞速发展,能源互联网平台作为一种创新的能源管理模式,引领着未来
    的头像 发表于 03-18 17:27 431次阅读

    浪潮云洲成功入选2023年工业互联网试点示范名单

    济南2024年2月23日 /美通社/ -- 近日,2023年工业互联网试点示范名单公示,浪潮云洲旗下国器智眸(重庆)科技有限公司申报的"基于云边端协同的智能视觉检测装备"项目成功入选。   为深入
    的头像 发表于 02-26 20:43 298次阅读
    浪潮云洲成功入选2023年工业<b class='flag-5'>互联网</b>试点示范名单

    工业互联网实训是什么?工业互联网实训包括哪些?

    工业互联网实训是一种针对工业互联网领域的培训课程,旨在帮助学员掌握工业互联网的基本概念、技术、应用和发展趋势。通过实训,学员可以了解工业互联网的体系架构、平台功能、应用场景和解决方案,
    的头像 发表于 01-17 17:00 998次阅读

    浪潮云洲两项目入选工业互联网平台创新领航应用案例

    济南2024年1月11日 /美通社/ -- 近日,工业和信息化部公示2023年新一代信息技术典型产品、应用和服务案例(第一批)名单,浪潮云洲两个项目成功入选工业互联网平台创新领航应用案例,包括
    的头像 发表于 01-11 22:10 384次阅读
    浪潮云洲两<b class='flag-5'>项目</b>入选工业<b class='flag-5'>互联网</b>平台创新领航应用案例

    跨周期,创未来!华秋喜获中国产业互联网十周年-杰出企业

    ,未来也将推动中国经济的快速发展。 12月27日,由中国信息协会指导,B2B内参、产业互联网大视野、产业互联网创新研究联合主办的2023年中国产业互联网企业家年会暨产业
    发表于 01-04 11:57

    华秋荣获亿邦动力2023产业互联网千峰奖

    喜讯! 继华秋荣获2023中国产业数字化百强榜企业 2023深圳行业领袖企业100强后 华秋再次荣获亿邦动力2023产业互****联网“千峰奖·数字供应链 12月1日晚,在2023亿邦产业互联网
    发表于 12-15 09:53