0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

BERT是一种用于自然语言处理的先进神经网络方法

倩倩 来源:互联网分析沙龙 作者:互联网分析沙龙 2020-12-13 10:08 次阅读

在一篇新论文中,Frankle及其同事发现了潜伏在BERT中的此类子网,BERT是一种用于自然语言处理(NLP)的先进神经网络方法。作为人工智能的一个分支,NLP旨在通过预测文本生成或在线聊天机器人等应用程序来解密和分析人类语言。在计算方面,BERT体积庞大,通常需要大多数用户无法获得的超级计算能力。从而可能使更多用户在智能手机上开发有效的NLP工具。

弗兰克勒说:“我们正在达到必须使这些模型更精简,更高效的地步。”他补充说,这一进步有一天可能会“减少NLP的准入门槛”。

麻省理工学院计算机科学与人工智能实验室的迈克尔·卡宾小组的博士生Frankle是该研究的共同作者,该研究将于下个月在神经信息处理系统会议上发表。德克萨斯大学奥斯汀分校的陈天龙是该论文的主要作者,其中包括得克萨斯州A&M的合作者Wang Zhangyang Wang,以及所有MIT-IBM Watson AI Lab的常石宇,刘思佳和张扬。

您今天可能已经与BERT网络进行了互动。这是Google搜索引擎的基础技术之一,自Google于2018年发布BERT以来,它一直引起研究人员的兴奋。BERT是一种创建神经网络的方法-使用分层节点或“神经元”的算法来学习执行通过培训大量实例来完成一项任务。

BERT是通过反复尝试填写写作段落中遗漏的单词来进行训练的,它的功能在于此初始训练数据集的庞大大小。然后,用户可以将BERT的神经网络微调至特定任务,例如构建客户服务聊天机器人。但是争吵的BERT需要大量的处理能力。

弗兰克尔说:“如今,标准的BERT模型-园林品种-具有3.4亿个参数,”他补充说,这个数字可以达到10亿。对如此庞大的网络进行微调可能需要一台超级计算机。“这简直太贵了。这远远超出了您或我的计算能力。”

为了削减计算成本,Chen和他的同事试图找出隐藏在BERT中的较小模型。他们通过迭代修剪整个BERT网络的参数进行了实验,然后将新子网的性能与原始BERT模型的性能进行了比较。他们对一系列NLP任务进行了此比较,从回答问题到填充句子中的空白词。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4772

    浏览量

    100803
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24712
  • 自然语言处理

    关注

    1

    文章

    618

    浏览量

    13562
收藏 人收藏

    评论

    相关推荐

    卷积神经网络自然语言处理中的应用

    自然语言处理是人工智能领域的个重要分支,它致力于使计算机能够理解、解释和生成人类语言。随着深度学习技术的发展,卷积神经网络(CNNs)作为
    的头像 发表于 11-15 14:58 275次阅读

    循环神经网络自然语言处理中的应用

    自然语言处理(NLP)是人工智能领域的个重要分支,它致力于使计算机能够理解、解释和生成人类语言。随着深度学习技术的发展,循环神经网络(RN
    的头像 发表于 11-15 09:41 261次阅读

    使用LSTM神经网络处理自然语言处理任务

    自然语言处理(NLP)是人工智能领域的个重要分支,它旨在使计算机能够理解、解释和生成人类语言。随着深度学习技术的发展,特别是循环神经网络
    的头像 发表于 11-13 09:56 399次阅读

    自然语言处理前馈网络综述

    自然语言处理(NLP)前馈网络是人工智能和语言学领域的个重要交叉学科,旨在通过计算机模型理解和处理
    的头像 发表于 07-12 10:10 319次阅读

    怎么对神经网络重新训练

    重新训练神经网络个复杂的过程,涉及到多个步骤和考虑因素。 引言 神经网络一种强大的机器学习模型,广泛应用于图像识别、
    的头像 发表于 07-11 10:25 465次阅读

    递归神经网络的实现方法

    (Recurrent Neural Network,通常也简称为RNN,但在此处为区分,我们将循环神经网络称为Recurrent RNN)不同,递归神经网络更侧重于处理树状或图结构的数据,如句法分析树、
    的头像 发表于 07-10 17:02 332次阅读

    基于神经网络语言模型有哪些

    基于神经网络语言模型(Neural Language Models, NLMs)是现代自然语言处理(NLP)领域的个重要组成部分,它们通
    的头像 发表于 07-10 11:15 760次阅读

    前馈神经网络自然语言处理中的应用

    自然语言处理(Natural Language Processing, NLP)作为人工智能领域的个重要分支,旨在让计算机能够理解和处理人类语言
    的头像 发表于 07-08 17:00 386次阅读

    RNN神经网络用于什么

    RNN(Recurrent Neural Network,循环神经网络)是一种具有循环结构的神经网络,它可以处理序列数据,具有记忆功能。RNN在许多领域都有广泛的应用,以下是
    的头像 发表于 07-04 15:04 1005次阅读

    递归神经网络主要应用于哪种类型数据

    递归神经网络(Recurrent Neural Network,简称RNN)是一种具有循环结构的神经网络,能够处理序列数据。它在许多领域都有广泛的应用,以下是对递归
    的头像 发表于 07-04 14:58 690次阅读

    循环神经网络的应用场景有哪些

    循环神经网络(Recurrent Neural Network,简称RNN)是一种具有记忆功能的神经网络,能够处理序列数据,广泛应用于
    的头像 发表于 07-04 14:39 1508次阅读

    用于自然语言处理神经网络有哪些

    取得了显著进展,成为处理自然语言任务的主要工具。本文将详细介绍几种常用于NLP的神经网络模型,包括递归神经网络(RNN)、长短时记忆
    的头像 发表于 07-03 16:17 1219次阅读

    自然语言处理是什么技术的一种应用

    自然语言处理(Natural Language Processing,简称NLP)是人工智能和语言学领域的个分支,它涉及到使用计算机技术来处理
    的头像 发表于 07-03 14:18 944次阅读

    卷积神经网络的原理是什么

    卷积神经网络(Convolutional Neural Network,简称CNN)是一种深度学习模型,广泛应用于图像识别、语音识别、自然语言处理
    的头像 发表于 07-02 14:44 666次阅读

    神经网络自然语言处理中的应用

    自然语言处理(NLP)是人工智能领域中的个重要分支,它研究的是如何使计算机能够理解和生成人类自然语言。随着人工智能技术的飞速发展,神经网络
    的头像 发表于 07-01 14:09 517次阅读