0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SmartCow的Apollo音频/视频AI工程套件

星星科技指导员 来源:嵌入式计算设计 作者:嵌入式计算设计 2022-07-11 10:00 次阅读

市场研究估计,自然语言处理市场将从 2021 年的 209.8 亿美元增长到 2028 年的超过 1270 亿美元。同样,人工智能视觉市场预计将从 2020 年的 70.4 亿美元增长到 1444.6 亿美元。

显然,人工感官知觉正在兴起。

对于构建视觉和对话计算系统的开发人员,Smart Cow Apollo AI 工程套件考虑了 NVIDIA Jetson Xavier NX 计算模块的 21 TOPS 性能和四个麦克风、两个扬声器端子、两个 3.5 毫米电话插孔、一个 8MP 摄像头模块、一个 OLED 显示器,以及一个 128 GB NVMe SSD 进入等式。

Apollo 套件的特色NVIDIA Jetson Xavier NX 计算模块与 NVIDIA Riva、DeepStream 和开箱即用的 JetPack SDK 可加速创建基于边缘 AI 的自动语音识别 (ASR) 和自然语言处理 (NLP) 解决方案。

两个 PVA 视觉加速器、两个深度学习加速器、H.264 和 H.265 视频编码器/解码器增强了这种性能。高速数据传输还可以使用 8 GB 到 16 GB 的 128 位 LPDDR4x 内存,运行速度高达 60 Gbps,或者通过使用 16 GB 的板载 eMMC 5.1 闪存使事情更持久。

当然,Apollo Kit 的独特之处在于它周围的一切:

内置音频编解码器支持其 4 个 MEMS 麦克风

8MP IMX179 摄像头模块支持多种视觉应用

2.08 英寸 OLED 显示屏显示状态和其他读数

随附的 128 GB NVMe SSD 预装了上述 NVIDIA SDK

底架使其能够直立以进行符合人体工程学的工程

SmartCow Apollo 音频/视频工程套件在行动:

希望开发基于感知的应用程序原型的开发人员可以通过设备正面的 40 针接头或侧面的 USB 端口访问 Apollo Kit 资源。套件上还有一个以太网 RJ45 插孔,供希望在项目中添加网络元素的用户使用。

通过系统访问,工程师几乎可以立即开始利用 NVIDIA SDK 提供的所有软件功能。不仅 Riva、DeepStream 和 JetPack SDK 提供了简化应用程序开发的框架,在许多情况下,SmartCow 还在套件上实施了可立即运行的演示和用例优化的 AI 模型,以帮助您起步。

例如:

ASR示例利用 NVIDIA Citrinet 模型转录口语(语音到文本)

基于开源 NLTK 模型的 NLP 示例应用程序分析文本数据以确定输入文本的正面或负面程度,该应用程序将在 OLED 屏幕上显示一头表情牛。此设置还支持命名实体识别 (NER),这是一个从句子中确定命名实体的过程。

第三个聊天机器人演示利用 Chatterbot 开源 GitHub 存储库在 Jetson 上创建两个互相通信的聊天机器人实例。用户可以运行其他 NLP 任务,例如对聊天机器人生成的文本进行情感分析,并在生成的文本上使用文本到语音。

该套件随附的其他软件包括用于视听 AI 应用程序的 Gstreamer (webRTC) 开源多媒体框架示例和主机 Ubuntu Linux 操作系统

Apollo 音频/视频 AI 工程套件入门

Apollo 音频/视频 AI 工程套件的尺寸为 81 x 69 x 125 毫米,因此您真正需要的只是工作台和开发 PC 上的足够空间。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    11313

    浏览量

    209748
  • 操作系统
    +关注

    关注

    37

    文章

    6838

    浏览量

    123397
  • AI
    AI
    +关注

    关注

    87

    文章

    31000

    浏览量

    269334
收藏 人收藏

    评论

    相关推荐

    AI健康助手超值之选:问答式AI智能体套件29.9元拿下!

    问答式AI智能体套件是一款集成高性能PCBA主板、LED触摸灯板、高品质喇叭与麦克风、嵌入式软件、大模型云平台以及用户友好的小程序的AI套件,29.9元的超值价格,就能为企业提供一套端
    的头像 发表于 01-02 10:35 73次阅读
    <b class='flag-5'>AI</b>健康助手超值之选:问答式<b class='flag-5'>AI</b>智能体<b class='flag-5'>套件</b>29.9元拿下!

    XMOS将亮相CES 2025,展示全新AI音频技术

    带来更加智能、完美、准确和低延时的音频体验。 这些创新技术包括空间音效、语音捕获与降噪、音视频多模态AI处理等,均由XMOS的xcore.ai系列多核控制器提供支持。xcore.
    的头像 发表于 12-13 11:20 360次阅读

    贸泽开售适用于AI和机器学习应用的 AMD Versal AI Edge VEK280评估套件

    VEK280评估套件。Versal AI Edge VEK280评估套件采用AMD Versal AI Edge VE2802自适应SoC,该系列
    发表于 11-21 14:23 120次阅读

    tlv320Ai32在输出音频时总有丝丝声,为什么?

    tlv320Ai32在输出音频时总有丝丝声,即使输出的滤波将噪声调整到90mV以下还是存在。测试发现HPout的噪声有将近480mV 请问这是什么原因,Ai32还有什么寄存器要设置的? 模拟电源的纹波大概60mV,有影响吗?
    发表于 11-05 06:09

    高清视频线与音频线的连接方式

    随着家庭娱乐系统的不断升级,高清视频和高质量音频成为了现代家庭影院系统的重要组成部分。 1. 了解不同类型的连接线 在开始连接之前,了解不同类型的连接线是非常重要的。常见的高清视频线包括HDMI
    的头像 发表于 10-30 16:11 637次阅读

    高清视频线与音频线的主要接口

    在现代家庭娱乐系统中,高清视频音频线扮演着至关重要的角色。它们不仅连接各种设备,还确保信号的高质量传输。 1. HDMI接口 HDMI(High-Definition Multimedia
    的头像 发表于 10-30 14:41 453次阅读

    NVIDIA RTX AI套件简化AI驱动的应用开发

    NVIDIA 于近日发布 NVIDIA RTX AI套件,这一工具和 SDK 集合能够帮助 Windows 应用开发者定制、优化和部署适用于 Windows 应用的 AI 模型。该套件
    的头像 发表于 09-06 14:45 462次阅读

    【xG24 Matter开发套件试用体验】初识xG24 Matter开发套件

    今天带刚收到xG24 Matter开发套件的快递,为大家做个xG24 Matter开发套件视频介绍,带大家认识一下这款xG24 Matter开发套件。 EFR32xG24 Explo
    发表于 07-11 23:31

    音频语音数据(AVD)模块开发套件DA14AVDDECTDEVKT数据手册

    电子发烧友网站提供《音频语音数据(AVD)模块开发套件DA14AVDDECTDEVKT数据手册.rar》资料免费下载
    发表于 05-30 16:39 1次下载
    <b class='flag-5'>音频</b>语音数据(AVD)模块开发<b class='flag-5'>套件</b>DA14AVDDECTDEVKT数据手册

    联发科发布天玑AI开发套件,赋能终端生成式AI应用

    联发科近日推出了全新的天玑AI开发套件,旨在为合作伙伴打造一站式解决方案,以加速终端生成式AI应用的开发。这款套件集合了四大核心模块,为AI
    的头像 发表于 05-10 11:19 601次阅读

    USB AI话务语音降噪音频方案

    USB AI话务语音降噪音频方案
    的头像 发表于 04-25 18:16 631次阅读
    USB <b class='flag-5'>AI</b>话务语音降噪<b class='flag-5'>音频</b>方案

    炬芯科技赵新中:无线音频SoC的AI算法未来和应用

    的平台。 炬芯科技算法研发中心高级总监赵新中受邀出席,于电声元器件及芯片专题论坛发表以《无线音频SoC的AI算法未来和应用》为主题的演讲,分享了炬芯科技的音频AI算法研究、应用经验和最
    的头像 发表于 04-10 11:13 480次阅读
    炬芯科技赵新中:无线<b class='flag-5'>音频</b>SoC的<b class='flag-5'>AI</b>算法未来和应用

    阿里巴巴推出全新AI图生视频模型EMO

    近日,阿里巴巴集团智能计算研究院宣布推出了一款革命性的AI图片-音频-视频模型技术——EMO。据官方介绍,EMO是一种先进的音频驱动肖像视频
    的头像 发表于 03-05 11:00 1364次阅读

    Adobe在Premiere Pro中引入AI音频编辑功能

    Adobe近日宣布,其视频剪辑软件Premiere Pro正式引入全新的AI驱动音频编辑功能。这一创新旨在解放剪辑师的双手,减少繁琐的操作,进一步提升工作效率。
    的头像 发表于 01-19 15:31 784次阅读

    ADI将采用SambaNova套件,加速AI转型进程

    ADI与SambaNova Systems共同宣布,ADI将采用SambaNova套件,以此引领公司在全球范围内的AI转型。此举旨在推动AI在公司内部的广泛应用。
    的头像 发表于 01-11 13:55 599次阅读