0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

您今天可能已经与BERT网络进行了互动

倩倩 来源:互联网分析沙龙 作者:互联网分析沙龙 2020-12-05 16:58 次阅读

在一篇新论文中,Frankle及其同事发现了潜伏在BERT中的此类子网,BERT是一种用于自然语言处理(NLP)的先进神经网络方法。作为人工智能的一个分支,NLP旨在通过预测文本生成或在线聊天机器人等应用程序来解密和分析人类语言。在计算方面,BERT体积庞大,通常需要大多数用户无法获得的超级计算能力。从而可能使更多用户在智能手机上开发有效的NLP工具。

弗兰克勒说:“我们正在达到必须使这些模型更精简,更高效的地步。”他补充说,这一进步有一天可能会“减少NLP的准入门槛”。

麻省理工学院计算机科学与人工智能实验室的迈克尔·卡宾小组的博士生Frankle是该研究的共同作者,该研究将于下个月在神经信息处理系统会议上发表。德克萨斯大学奥斯汀分校的陈天龙是该论文的主要作者,其中包括得克萨斯州A&M的合作者Wang Zhangyang Wang,以及所有MIT-IBM Watson AI Lab的常石宇,刘思佳和张扬。

您今天可能已经与BERT网络进行了互动。这是Google搜索引擎的基础技术之一,自Google于2018年发布BERT以来,它一直引起研究人员的兴奋。BERT是一种创建神经网络的方法-使用分层节点或“神经元”的算法来学习执行通过培训大量实例来完成一项任务。

BERT是通过反复尝试填写写作段落中遗漏的单词来进行训练的,它的功能在于此初始训练数据集的庞大大小。然后,用户可以将BERT的神经网络微调至特定任务,例如构建客户服务聊天机器人。但是争吵的BERT需要大量的处理能力。

弗兰克尔说:“如今,标准的BERT模型-园林品种-具有3.4亿个参数,”他补充说,这个数字可以达到10亿。对如此庞大的网络进行微调可能需要一台超级计算机。“这简直太贵了。这远远超出了您或我的计算能力。”

为了削减计算成本,Chen和他的同事试图找出隐藏在BERT中的较小模型。他们通过迭代修剪整个BERT网络的参数进行了实验,然后将新子网的性能与原始BERT模型的性能进行了比较。他们对一系列NLP任务进行了此比较,从回答问题到填充句子中的空白词。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4767

    浏览量

    100663
  • 人工智能
    +关注

    关注

    1791

    文章

    47059

    浏览量

    238045
  • 自然语言处理

    关注

    1

    文章

    618

    浏览量

    13541
收藏 人收藏

    评论

    相关推荐

    FPGA通过SPI对DAC进行了配置,用频谱仪测不到输出是怎么回事?

    FPGA通过SPI对DAC进行了配置,确定配置时序正确,写了组测试的单音数据,data,clk,frame发的都对,用频谱仪测不到输出,可能是哪些地方不对呢?求助大神
    发表于 12-09 06:35

    请问怎么检查ADS1299已经初始化好了呢?

    hello ,请问我按照了ADS1299的上电初始化流程图(62页 Figure 67 图)对我的ADS1299进行初始化,也进行了相关的配置寄存器,但是我去读刚配置的寄存器的时候读出来的是0
    发表于 11-27 06:13

    思尔芯与相约上海,这份ICCAD-Expo 2024互动指南请查收

    ICCAD-Expo12月11-12日ICCAD-Expo2024盛会启幕,亲爱的朋友们,思尔芯S2C诚邀共赴这场科技盛宴!在这里,我们的大咖将登台献智,硬核产品静待的探索,更有实时互动
    的头像 发表于 11-26 01:02 211次阅读
    思尔芯与<b class='flag-5'>您</b>相约上海,这份ICCAD-Expo 2024<b class='flag-5'>互动</b>指南请查收

    TSW14J58EVM数据转换软件HSDC pro报错的原因?

    bit no set。 已按照ADCxxQJxx00 Evaluation Module和TSW14J58EVM中的叙述对硬件进行了正确的连接、软件进行了相应的设置,在设置完采样率后,点击
    发表于 11-22 07:39

    TLV320AIC3106IRGZT随着PGA音量的抬高是不是同时将底噪也进行了放大?

    我的问题如下 1. 随着PGA音量的抬高是不是同时将底噪也进行了放大? 2. 这样的放大是不是芯片固有的现象?能否进一步降低频谱底噪?
    发表于 10-24 06:15

    石墨烯基导电油墨具有良好的渗透性和低阻抗,针对 RFID天线性能进行了

    “电子丝网印刷技术”是指电子信息技术与具有历史的丝网印刷技术相结合而产生的崭新技术。Haydale这款石墨烯墨水除了优异的柔韧性、附着力和兼容性外,用于 RFID 产品还能够传输和接收特定的无线电频率,具有好的渗透性和低阻抗,针对 RFID天线性能进行了优化
    的头像 发表于 09-13 15:26 375次阅读
    石墨烯基导电油墨具有良好的渗透性和低阻抗,针对 RFID天线性能<b class='flag-5'>进行了</b>优

    M8020A J-BERT 高性能比特误码率测试仪

    32 Gb/s 的单通道和多通道器件中的接收机。 M8020A 综合了更广泛的功能,可以简化的测试系统。 自动对信号条件进行原位校准,确保获得准确、可重复的测量结果。 它还能担当被测器件的链路伙伴
    的头像 发表于 08-21 17:13 203次阅读

    AWG和BERT常见问题解答

    随着信号的速率越来越高,调制格式越来越复杂,对测试仪器的性能要求也越来越高。是德科技也一直在推出业界领先的高带宽、高采样率的AWG和高性能的BERT
    的头像 发表于 08-06 17:27 585次阅读

    ESP32S3的EEPROM是由FLASH虚拟的,直接在arduinoIDE中擦写EEPROM时是否在底层自动进行了磨损平衡?

    ESP32S3的EEPROM是由FLASH虚拟的,请问直接在arduinoIDE中擦写EEPROM时是否在底层自动进行了磨损平衡? 在用ESP32S3做含有计数器功能的设备,希望可以掉电保存数据
    发表于 06-07 06:27

    认为今天使用了多少人工智能?

    这比您想象的要多——一切从晶体振荡器开始 人工智能(AI)在我们的生活中扮演着重要的角色。这项技术已经无缝地融入到我们生活、工作和娱乐的空间中。您可能会对您在日常生活中与人工智能接触的频率感到惊讶
    的头像 发表于 05-24 13:42 270次阅读
    <b class='flag-5'>您</b>认为<b class='flag-5'>您</b><b class='flag-5'>今天</b>使用了多少人工智能?

    【RTC程序设计:实时音视频权威指南】新书一瞥

    本书目录,可以看到对RTC技术的各个环节进行了深入的剖析,从音视频编解码、网络传输、同步播放到实时交互等方面进行了全面的介绍。 另外,书中针对基础知识的描述非常详细,通过这本书可以对这些基础知识有非常
    发表于 04-22 09:09

    针对功率密度和低EMI进行了优化的LM62460、LM61480和LM61495引脚兼容6A/8A/10A降压转换器数据表

    电子发烧友网站提供《针对功率密度和低EMI进行了优化的LM62460、LM61480和LM61495引脚兼容6A/8A/10A降压转换器数据表.pdf》资料免费下载
    发表于 04-11 09:55 0次下载
    针对功率密度和低EMI<b class='flag-5'>进行了</b>优化的LM62460、LM61480和LM61495引脚兼容6A/8A/10A降压转换器数据表

    一款基于ESP32的情侣互动小电视,如何含蓄地告诉你对象你想她了?

    都说工程师里面直男多,但工程师浪漫起来就没小鲜肉什么事儿了。今天社长带来的是一款基于ESP32的情侣互动小电视:具备天气时钟、恋爱纪念日及情话显示、想你啦互动等功能(天知道单身狗社长抱着怎样的心情
    发表于 03-28 09:27

    使用STM32H7的AD进行了7M频率的采集信号,采集进去后可以实现实时处理吗?

    使用STM32H7的AD进行了7M频率的采集信号,采集进去后可以实现实时处理吗?
    发表于 03-08 08:10

    如何精调出自己的领域大模型

    BERT和 GPT-3 等语言模型针对语言任务进行了预训练。微调使它们适应特定领域,如营销、医疗保健、金融。在本指南中,您将了解 LLM 架构、微调过程以及如何为 NLP 任务微调自己的预训练模型。
    的头像 发表于 01-19 10:25 1116次阅读
    教<b class='flag-5'>您</b>如何精调出自己的领域大模型