0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿拉伯语自然语言处理模型NOOR的详细介绍

文传商讯 来源:文传商讯 作者:文传商讯 2022-04-12 11:53 次阅读

阿布扎比先进技术研究委员会旗下的全球研究中心和应用研究支柱部门技术创新研究所(TII)今天宣布推出NOOR语言处理模型,这是迄今为止全球规模居首的阿拉伯语自然语言处理(NLP)模型。

TII的高级研究人员和人工智能专家团队与LightOn联手,对这个阿拉伯语NLP模型进行了改进。LightOn是一家专为企业提供超大规模机器智能的技术公司。NOOR模型能够执行超出语言领域的任务,可提供覆盖整个端到端处理管道的高质量数据,包括大规模数据抓取、过滤和管理。该模型可促进超大规模数据的分布式训练和服务,基于该模型的应用具有高效推理能力,并可针对特定领域进行模型调整。

TII和ASPIRE首席执行官Ray O. Johnson博士表示:“这一进展将大幅提升我们的研究能力和资质,并提升阿布扎比和阿联酋作为重要研究生态系统的地位。我们的专家团队再次证明,阿布扎比和阿联酋地区可以取得具有世界影响力的、突破性的研发成果。”

TII人工智能跨学科中心部门主任Ebtesam Almazrouei博士表示:“在自然语言处理领域,大型语言模型不断涌现。能推出这个拥有100亿个参数的先进模型,我们感到很自豪。这是全球规模居首的阿拉伯语NLP模型。为训练该模型,我们采集了一套独一无二的大型阿拉伯语数据集。相关工作历经数月时间,包括对各种来源数据的整理、剔除和过滤。在此特别感谢参与该项目的整个团队,他们使NOOR成为世界各地学者和企业首选的阿拉伯语研究模型。”

TII数字科学研究中心和人工智能跨学科中心部门首席研究员Mérouane Debbah教授在发布会上表示:“通过NOOR,TII利用在大型语言模型方面的专有技术,扩大了现代标准阿拉伯语模型的范围,以在新一代人工智能研究中建立跨学科的先进专长。”

NOOR拥有超过300亿字的独特数据集,涵盖网络数据、书籍、诗歌、新闻文章和技术信息等来源,从而打造出全球规模居首的高质量跨领域阿拉伯语数据集,并大幅拓宽了该模型的适用范围。

Ebtesam Almazrouei博士表示,NOOR模型基于流行的Transformer架构,仅包含解码器,结构与GPT-3相似,其设计旨在处理生成类任务。经过升级的架构引入了机器学习领域的最新发展,包括更好的位置嵌入等改进。为确保NOOR大规模数据集的质量,TII团队设计了一个基于机器学习技术的自动过滤管道。相关工具可以识别优质参考文本,并保障模型不受垃圾内容污染。

NOOR利用先进的3D并行技术,在配备128个A100 GPU的高性能计算资源上进行了训练,该过程采用分布式计算模式,能够确保有效利用可用的硬件资源。

人工智能跨学科中心部门主任指出,NOOR只是该部门努力为更广泛的阿联酋人工智能战略做出贡献的第一步。

该模型以阿拉伯语中的“光”命名,以体现模型旨在启迪人类智慧的宗旨。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1800

    文章

    48083

    浏览量

    242164
  • 模型
    +关注

    关注

    1

    文章

    3415

    浏览量

    49477
  • 自然语言处理

    关注

    1

    文章

    624

    浏览量

    13722
收藏 人收藏

    评论

    相关推荐

    如何优化自然语言处理模型的性能

    优化自然语言处理(NLP)模型的性能是一个多方面的任务,涉及数据预处理、特征工程、模型选择、模型
    的头像 发表于 12-05 15:30 989次阅读

    自然语言处理与机器学习的关系 自然语言处理的基本概念及步骤

    Learning,简称ML)是人工智能的一个核心领域,它使计算机能够从数据中学习并做出预测或决策。自然语言处理与机器学习之间有着密切的关系,因为机器学习提供了一种强大的工具,用于从大量文本数据中提取模式和知识,从而提高NLP系统的性能。
    的头像 发表于 12-05 15:21 1107次阅读

    语音识别与自然语言处理的关系

    在人工智能的快速发展中,语音识别和自然语言处理(NLP)成为了两个重要的技术支柱。语音识别技术使得机器能够理解人类的语音,而自然语言处理则让机器能够理解、解释和生成人类
    的头像 发表于 11-26 09:21 791次阅读

    ASR与自然语言处理的结合

    ASR(Automatic Speech Recognition,自动语音识别)与自然语言处理(NLP)是人工智能领域的两个重要分支,它们在许多应用中紧密结合,共同构成了自然语言理解和生成的技术体系
    的头像 发表于 11-18 15:19 645次阅读

    科大讯飞发布讯飞星火4.0 Turbo大模型及星火多语言模型

    ,科大讯飞以其一贯的创新精神,开创性地发布了星火多语言模型。这一创新之举不仅进一步巩固了科大讯飞在中文和英文处理领域的领先地位,更将语言的支持范围大幅扩展,涵盖了俄语、日语、
    的头像 发表于 10-24 13:58 568次阅读

    【AWTK使用经验】如何在AWTK显示阿拉伯文本

    。本篇文章将简单介绍阿拉伯文本相关整形与排序规则,接着介绍在AWStudio设置阿拉伯语言翻译的步骤。阿拉伯文本整形规则一般GUI显示英文或
    的头像 发表于 09-12 08:07 472次阅读
    【AWTK使用经验】如何在AWTK显示<b class='flag-5'>阿拉伯</b>文本

    图像识别技术包括自然语言处理

    计算机视觉技术对图像进行处理、分析和理解,从而实现对图像中的目标、场景、行为等信息的识别和理解。图像识别技术包括图像预处理、特征提取、分类器设计、模型训练等多个环节。 1.2 自然语言
    的头像 发表于 07-16 10:54 1045次阅读

    nlp自然语言处理模型怎么做

    自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个重要分支,它涉及到计算机对人类语言的理解和生成。随着深度学习技术的发展,NLP领域取得了显著
    的头像 发表于 07-05 09:59 791次阅读

    nlp自然语言处理模型有哪些

    自然语言处理(Natural Language Processing,NLP)是计算机科学和人工智能领域的一个重要分支,旨在使计算机能够理解、解释和生成人类语言。以下是对NLP领域一些模型
    的头像 发表于 07-05 09:57 972次阅读

    用于自然语言处理的神经网络有哪些

    取得了显著进展,成为处理自然语言任务的主要工具。本文将详细介绍几种常用于NLP的神经网络模型,包括递归神经网络(RNN)、长短时记忆网络(L
    的头像 发表于 07-03 16:17 1621次阅读

    自然语言处理技术有哪些

    自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个分支,它致力于使计算机能够理解、解释和生成人类语言自然语言
    的头像 发表于 07-03 14:30 1572次阅读

    自然语言处理模式的优点

    自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个重要分支,它致力于使计算机能够理解、生成和处理人类语言。随着技术的发展,
    的头像 发表于 07-03 14:24 940次阅读

    自然语言处理是什么技术的一种应用

    广泛,包括机器翻译、语音识别、情感分析、信息检索、问答系统、文本摘要、聊天机器人等。 一、自然语言处理的基本概念 自然语言自然语言是人类用来交流思想、表达情感和传递信息的
    的头像 发表于 07-03 14:18 1315次阅读

    自然语言处理包括哪些内容

    ,从而实现人机之间的自然交流。本文将详细介绍NLP的主要内容,包括基本概念、关键技术、应用领域等。 一、自然语言处理的基本概念
    的头像 发表于 07-03 14:15 1341次阅读

    神经网络在自然语言处理中的应用

    自然语言处理(NLP)是人工智能领域中的一个重要分支,它研究的是如何使计算机能够理解和生成人类自然语言。随着人工智能技术的飞速发展,神经网络在自然语言
    的头像 发表于 07-01 14:09 661次阅读