0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种针对来自互联网的数万亿个单词训练的语言模型

倩倩 来源:新经网 2020-07-07 08:58 次阅读

商业概览:

OpenAI是一个人工智能研究实验室,由OpenAI LP及其上级组织非营利组织OpenAI Inc.组成。该公司是技术巨头DeepMind的竞争对手,在人工智能(AI)领域进行研究,以共同促进并以有益于整个人类的方式开发友好的AI。该组织由埃隆·马斯克(Elon Musk),萨姆·奥特曼(Sam Altman)等人于2015年年底在旧金山成立,他们共同认捐了10亿美元。马斯克于2018年2月从董事会辞职,但仍是捐助者。2019年,OpenAI LP从微软获得了10亿美元的投资。2020年6月,OpenAI宣布了GPT-3,这是一种针对来自互联网的数万亿个单词训练的语言模型。它还宣布了一个关联的API,简称为“ API”,将成为其首个商业产品的核心。GPT-3旨在以自然语言回答问题,但也可以在各种语言之间进行翻译,并且可以连贯地生成即兴文本。

自动点唱机:

自动点唱机是一种神经网络,可以产生包括基本唱歌在内的音乐,作为各种类型和艺术风格的原始音频。他们将发布模型权重和代码,以及用于探索生成的样本的工具。自动音乐生成可追溯到半个多世纪。一种突出的方法是以钢琴卷的形式象征性地产生音乐,该音乐指定要演奏的每个音符的时机,音高,速度和乐器。这导致了令人印象深刻的结果,例如制作巴赫合唱,使用多种乐器的和弦音乐以及时长的音乐作品。

但是符号生成器有局限性,它们无法捕获人的声音或音乐必不可少的许多更细微的音色,动态性和表现力。另一种方法是将音乐直接建模为原始音频。由于音序很长,因此在音频级别上生成音乐非常具有挑战性。17以CD质量(44 kHz,16位)播放一首典型的4分钟歌曲需要超过1000万步。为了进行比较,GPT-2有1,000个时间步长,而OpenAI Five每场比赛花费了数万个时间步长。因此,要学习音乐的高级语义,模型将必须处理极长距离的依赖关系。

MuseNet:

MuseNet是一个深度神经网络,可以用10种不同的乐器生成4分钟的音乐作品,并且可以将乡村音乐,莫扎特音乐和甲壳虫音乐的风格进行组合。MuseNet并未根据他们对音乐的理解进行明确编程,而是通过学习预测数十万个MIDI文件中的下一个标记来发现和谐,节奏和风格的模式。MuseNet使用与GPT-2相同的通用无监督技术,GPT-2是一种大型变压器模型,经过训练可以预测序列中的下一个标记(无论是音频还是文本)。MuseNet使用Sparse Transformer的重新计算和优化的内核来训练具有24个关注头的72层网络-充分关注4096个令牌的上下文。如此长的语境可能是它能够记住片段中长期结构的原因之一。

其使命:

OpenAI的使命是确保人工智能(AGI)惠及全人类,人工智能(AGI)表示高度自主的系统,在大多数具有经济价值的工作中,它们要胜过人类。该公司将尝试直接建立安全有益的AGI,但如果他们的工作帮助其他人实现了这一目标,也将认为他们的使命已经实现。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1789

    文章

    46636

    浏览量

    236991
  • OpenAI
    +关注

    关注

    9

    文章

    1033

    浏览量

    6378
收藏 人收藏

    评论

    相关推荐

    从零开始训练语言模型需要投资多少钱?

    ,前言   在AI领域,训练大型语言模型(LLM)是
    的头像 发表于 11-08 14:15 57次阅读
    从零开始<b class='flag-5'>训练</b><b class='flag-5'>一</b><b class='flag-5'>个</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>需要投资多少钱?

    【《大语言模型应用指南》阅读体验】+ 基础知识学习

    的表达方式和生成能力。通过预测文本中缺失的部分或下一个词,模型逐渐掌握语言的规律和特征。 常用的模型结构 Transformer架构:大语言
    发表于 08-02 11:03

    语言模型的预训练

    随着人工智能技术的飞速发展,自然语言处理(NLP)作为人工智能领域的重要分支,取得了显著的进步。其中,大语言模型(Large Langu
    的头像 发表于 07-11 10:11 364次阅读

    llm模型训练般用什么系统

    LLM(Large Language Model,大型语言模型)是近年来在自然语言处理领域取得显著成果的一种深度学习模型。它通常需要大量的计
    的头像 发表于 07-09 10:02 323次阅读

    esp8266已连接到Wifi但无法连接到互联网,为什么?

    首先,我想说对不起,如果我的帖子在错误的线程中。在那之后,我想问问题,我的 esp12E 已连接到 Wifi,但它无法连接到互联网,即使 wifi 连接到互联网和其他设备,它仍然完
    发表于 07-09 07:11

    语言模型:原理与工程时间+小白初识大语言模型

    开拓深度学习的思路。对于新涌现的大语言模型的能力,主要是表现在学习能力的提升、语言理解和生成能力、创新和探索的能力。 基础技术 词表示技术 词表示般分为三
    发表于 05-12 23:57

    【大语言模型:原理与工程实践】大语言模型的应用

    实际应用前需解决的挑战。为提升大语言模型的性能,高级的提示词技术可以促进大语言模型与环境进行动态交互,引导其生成和推理规划。 检索增强生成技术(RAG)的核心理念在于从知识库或
    发表于 05-07 17:21

    【大语言模型:原理与工程实践】大语言模型的预训练

    训练数据时,数量、质量和多样性三者缺不可。 数据的多样性对于大语言模型至关重要,这主要体现在数据的类别和来源两方面。丰富的数据类别能够
    发表于 05-07 17:10

    【大语言模型:原理与工程实践】大语言模型的基础技术

    处理各种自然语言任务时都表现出了惊人的能力。这促使新的研究方向诞生——基于Transformer 的预训练语言
    发表于 05-05 12:17

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    学习能力。这些模型以生成能力强和灵活性强为特点,逐渐演变成一种通用计算平台。其参数多样性、生成能力和涌现性使其不仅在自然语言处理领域表现出色,还能适应多种复杂任务。参数多样性让模型能学
    发表于 05-04 23:55

    工业互联网平台是什么

    工业互联网平台(Industrial Internet Platform)是面向工业领域的一种综合性的云计算和大数据分析平台。它将互联网、物联网、大数据、人工智能等新
    的头像 发表于 03-28 15:38 1429次阅读

    名单公布!【书籍评测活动NO.30】大规模语言模型:从理论到实践

    ,在大模型实践和理论研究的过程中,历时8月完成 《大规模语言模型:从理论到实践》 书的撰写。希望这本书能够帮助读者快速入门大
    发表于 03-11 15:16

    语言模型中的语言与知识:一种神秘的分离现象

    自然语言处理领域存在着非常有趣的现象:在多语言模型中,不同的语言之间似乎存在着
    发表于 02-20 14:53 470次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>中的<b class='flag-5'>语言</b>与知识:<b class='flag-5'>一种</b>神秘的分离现象

    工业互联网实训是什么?工业互联网实训包括哪些?

    工业互联网实训是一种针对工业互联网领域的培训课程,旨在帮助学员掌握工业互联网的基本概念、技术、应用和发展趋势。通过实训,学员可以了解工业
    的头像 发表于 01-17 17:00 950次阅读

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    、计算机时代、互联网时代,而这个时代叫做 ——人工智能时代 想象 GPT 是语言天才,她擅长制作一种特殊的串联词语游戏。这个游戏的目标是在给定的起始词汇后,找到
    发表于 12-22 10:18