0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 赋能中科深智实现 NPC 与玩家的千人千面多模态互动

NVIDIA英伟达 来源:未知 2023-07-11 23:10 次阅读

中科深智成立于 2016 年,是一家专注于端到端生成式 AI 虚拟人技术的公司,从底层自研的大语言模型、动作和表情生成算法模型以及 3D 自动建模,到 Motionverse 虚拟人业务中台,再到 3D 生成式 AI 产品和应用层。中科深智除了为生态合作伙伴提供 AI 虚拟人 API 外,还开发了一系列 3D 生成式 AI 产品,包括超写实虚拟人生成系统 Anyhuman、元宇宙电商和虚拟人直播工具百宝箱自动播、AI 快速动画生成系统自动画、虚拟人实时交互和应答系统云小七等。

传统 NPC 人机交互

生硬且成本高昂

在动作和表情方面,传统 NPC 因为无法获取用户的画面信息和语音信息,也就无法做出实时的反馈,动作和语音的呈现皆靠预设,所谓的人机交互其实非常的刻板和生硬。

在文字和语音的对话能力方面,大语言模型的出现赋予了 NPC 实时对话的能力。但无论是何种大语言模型的诞生,都经历了数据清洗、预训练、指令微调、测试、合规、部署和应用接口开发等环节,这些环节此前是彼此分散的,而并非一体化的,这也意味着每两个环节之间都需要进行大量的人工处理和匹配部署,这本质上是对人力成本和时间成本的浪费,亟需一种更加省时和高效的解决方案。

NVIDIA 赋能游戏 NPC

实现智能化互动

中科深智的虚拟人实时交互和应答系统云小七可以支持智能 NPC 的批量化生产,提升游戏开发效率。云小七基于生成式 AI 的设计,可以通过将 NPC 赋予如形象、声音、性格特征、背景等特定的人设来与游戏内容进行有机融合。此外,云小七还能够在不需要编写复杂脚本的情况下,让 NPC 与游戏玩家进行顺畅的文字、语音、动作、表情等多模态的实时互动。这将为游戏开发商带来更有力的支持,同时也为玩家提供更加生动、真实的游戏体验。云小七的核心能力之一还包括中科深智自研实现的 CLAP 大模型算法,这种算法可以实现对于语音、语义以及外部环境输入的实时反馈,从而输出动作和表情等,使得 NPC 具有更加生动的表现能力。

NVIDIA Omniverse 中的 Audio2Face 可以辅助云小七实现音频输入的面部输出,通过预训练的深度神经网络、调整角色网格的 3D 顶点等方式,快速实现表情切换。通过利用 NVIDIA Maxine 对于音频和视频通信方面进行优化,即使用户使用普通的麦克风和摄像头,NPC 也能监测到他们的行为并且产生反馈,与玩家实现实时互动。

此外,云小七底层的文字对话能力来自于中科深智今年 5 月推出的自有大语言模型 GenSense 数智姜尚。数智姜尚是国内商用大模型在轻量化领域内的重要尝试,是针对垂直领域和虚拟人端到端应用而专门设计的大语言模型,可成为虚拟人的“大脑”,为其提供实时互动的能力支撑。数智姜尚采用了先进的优化技术,轻巧便利且占用资源极少,可为用户提供流畅的使用体验。配合 NVIDIA GPU,数智姜尚能够以高性能运行并展现出色的表现。其次,数智姜尚的部署和定制非常简便,可以轻松集成到现有的企业工作流中,为用户提供个性化和智能化的解决方案,同时实现快速的模型训练和应用部署。

NVIDIA NeMo 在数智姜尚的训练过程中提供了低门槛、经济、高效的帮助。

首先,NVIDIA NeMo 帮助解决了训练全流程的问题,包括数据清洗、预训练和指令微调,以及测试、合规、部署和应用接口开发等。在此之前,这需要多个架构才能完成,因此极大的提高了自有模型的开发效率。

同时,NVIDIA NeMo 还提供了大量的、可应用于多个不同场景的预训练模型。选择 NVIDIA 已经训练好的模型,能够大幅缩短微调和再训练的时间,也帮助扩充了中科深智自身大模型数智姜尚的适应性。NeMo 本身的 ASR/TTS 也直接带来了自然交互工具,无需借助第三方,从而加速了数智姜尚的开发和交付。

此外,通过使用 NVIDIA 提供的 NeMo Guardrails 工具,中科深智还高效解决了对话式 AI 合规性和安全性的风险。通过 NeMo Guardrails 为对话设置响应的范围和边界,使数智姜尚的回答范围仅限于适当的主题并仅提供必要的信息,能够限制 AI 只与已确认安全的第三方应用程序建立联系。

NVIDIA 助力中科深智

加速AI 对话数字人建设

中科深智联合创始人兼 CTO 宋健说:“中科深智是 NVIDIA 初创加速计划的高级会员,通过该计划,一方面中科深智与 NVIDIA 进行了深入的技术合作,另外一方面也链接到大量外部企业资源,可以快速有效的将产品和需求方进行对接。

大模型驱动的对话式 AI 和数字人的结合引发了新一轮的商业增量,也是我们的企业客户关注的重点。对话式数字人正在不同领域发挥着越来越大的作用,帮助企业用户解决客户服务等难题,提高客户的体验。然而开发和运行可落地的语音人工智能服务仍然是一项复杂而艰巨的任务,通常需要面临实时性、可理解性、自然性、低资源、鲁棒性等挑战。在 NVIDIA 初创加速计划的支持之下,我们深入了解并且成功应用了 NVIDIA 各项最新技术和工具,包括 NVIDIA Nemo,NVIDIA Omniverse 等等,切实帮助我们加速了 AI 对话数字人的建设。”

NVIDIA 初创加速计划

中科深智是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。

想获得 NVIDIA 初创加速生态助力?扫描下方二维码,仅需一分钟填写意向申请表单,获得快速联系。

66502e82-1ffc-11ee-962d-dac502259ad0.png


原文标题:NVIDIA 赋能中科深智实现 NPC 与玩家的千人千面多模态互动

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3727

    浏览量

    90737

原文标题:NVIDIA 赋能中科深智实现 NPC 与玩家的千人千面多模态互动

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中科创达推动下一代模态智能机器创新

    具身智能在业界被普遍认为即将掀起人工智能领域的全新浪潮。人形机器作为具身智能的绝佳载体,随着模态大模型的迅猛发展,人形机器的智能化程度将显著提升,进而加速其产业化进程。2024
    的头像 发表于 11-15 11:03 201次阅读

    觉机器完成数千万元天使轮融资

    近日,模态触觉感知传感器公司觉机器(Xense Robotics)成功完成了数千万元人民币的天使轮融资。本轮融资由高瓴创投(GL Ventures)领投,交大菡源基金等投资方跟投
    的头像 发表于 10-14 16:02 251次阅读

    Meta发布模态LLAMA 3.2工智能模型

    Meta Platforms近日宣布了一项重要技术突破,成功推出了模态LLAMA 3.2工智能模型。这一创新模型不仅能够深度解析文本信息,还实现了对图像内容的精准理解,标志着Met
    的头像 发表于 09-27 11:44 355次阅读

    突发!英特尔或将裁员数千人,削减成本计划曝光!

    面对竞争激烈的市场,行业巨头也难逃“窘境”。 7月31日,据美国彭博社报道:半导体巨头英特尔公司或将启动新一轮大规模裁员行动。这场裁员风暴预计在本周内正式拉开帷幕,具体人数尚未明确,可能达到数千人
    的头像 发表于 08-05 10:57 284次阅读
    突发!英特尔或将裁员数<b class='flag-5'>千人</b>,削减成本计划曝光!

    英特尔将裁员数千人 降本增效

    裁员、降本增效似乎总在不经意间就来临,为节约成本、应对盈利下滑和市场份额下降;英特尔或将裁员数千人。 据彭博社31日报道,英特尔的裁员计划最早可能会在本周宣布。目前英特尔公司大约有11万名员工;裁员
    的头像 发表于 07-31 18:10 1144次阅读

    萨科微Slkor参与大佳源第八届千人峰会 宋仕强总经理出席并发表主旨演讲

    主办、萨科微Slkor半导体等多家单位协办,以“数字经济新质生产力”为主题的「2024电子产业链第八届千人峰会」在深圳宝立方酒店四楼多功能厅隆重举办;同时举办的还有
    的头像 发表于 05-24 08:12 350次阅读
    萨科微Slkor参与大佳源第八届<b class='flag-5'>千人</b>峰会  宋仕强总经理出席并发表主旨演讲

    视机架式编解码器:引领 AV over IP 行业新风向

    “交钥匙”的简化方案?视给出的答案是:在活动会场布置一套机架式编解码器-即可实现一对/对一传输、多画面监看/互动以及跨互联网制作/管理
    的头像 发表于 03-23 08:07 931次阅读
    <b class='flag-5'>千</b>视机架式编解码器:引领 AV over IP 行业新风向

    裁员潮仍在继续 诺基亚将在印度裁员约250 谷歌将再裁员数千人

    裁员潮仍在继续 诺基亚将在印度裁员约250 谷歌将再裁员数千人 尽管时间已经进入到2024年但是似乎科技巨头们的大规模裁员潮仍在继续!已经看到外媒有报道诺基亚将在印度裁员约250;此外巨头谷歌将
    的头像 发表于 02-21 11:30 1509次阅读

    思科计划裁员5%,达数千人

    2月14日,思科(Cisco)宣布最新一季财报,同时表示,作为全公司重组的一部分,计划裁员5%,达数千人。主要原因是客户仍处「去库存」阶段,导致思科保守看待营运展望。
    的头像 发表于 02-19 14:43 861次阅读

    拓维信息2024全国研发人才千人招聘计划正式发布

    2月7日下午,拓维信息2024全国研发人才千人招聘计划启动仪式,以现场直播的方式在长沙盛大举行。在中国科技创新由跟随转向并行、乃至领跑的关键当口,拓维信息作为一家长期深耕IT国产化的上市科技企业
    的头像 发表于 02-19 14:02 345次阅读
    拓维信息2024全国研发人才<b class='flag-5'>千人</b>招聘计划正式发布

    机器基于开源的模态语言视觉大模型

    ByteDance Research 基于开源的模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器操作模型,只用单机就可以训练。
    发表于 01-19 11:43 355次阅读
    机器<b class='flag-5'>人</b>基于开源的<b class='flag-5'>多</b><b class='flag-5'>模态</b>语言视觉大模型

    鸿蒙帆起】《开心消消乐》完成鸿蒙原生应用开发,创新多端联动用户体验

    技术还为用户打造出创新的分布式游戏玩法。通过与 HarmonyOS 分布式有机结合,可实现设备协同的分布式 PK 场景。在此场景下,用户操作各自的 HarmonyOS 设备,使用智慧屏实时显示对战
    发表于 01-03 10:22

    【鸿蒙帆起】《钢岚》成为首款基于HarmonyOS NEXT开发的战棋新游

    通过元服务在负一屏或桌面呈现,为玩家带来更便捷的游戏体验;另一方在保证用户安全与隐私的前提下,AI 大模型可以识别用户意图,实现服务精准投放,实现游戏全方位用户触达,促进用户转化。
    发表于 12-28 10:24

    大模型+模态的3种实现方法

    我们知道,预训练LLM已经取得了诸多惊人的成就, 然而其明显的劣势是不支持其他模态(包括图像、语音、视频模态)的输入和输出,那么如何在预训练LLM的基础上引入跨模态的信息,让其变得更强大、更通用呢?本节将介绍“大模型+
    的头像 发表于 12-13 13:55 1608次阅读
    大模型+<b class='flag-5'>多</b><b class='flag-5'>模态</b>的3种<b class='flag-5'>实现</b>方法

    求助,关于ADuCM360与AD7903使用官网例程问题

    主控:千人360传感器:ad7903程序为官网例程 链模式波形图如下所示(其中,黄色为sccx( sckx),蓝色为cnvx , cnvx , cnvx , cnvx , cnvx , cnvx
    发表于 12-05 07:29