0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SmartCow的Apollo音频/视频AI工程套件

星星科技指导员 来源:嵌入式计算设计 作者:嵌入式计算设计 2022-07-11 10:00 次阅读

市场研究估计,自然语言处理市场将从 2021 年的 209.8 亿美元增长到 2028 年的超过 1270 亿美元。同样,人工智能视觉市场预计将从 2020 年的 70.4 亿美元增长到 1444.6 亿美元。

显然,人工感官知觉正在兴起。

对于构建视觉和对话计算系统的开发人员,Smart Cow Apollo AI 工程套件考虑了 NVIDIA Jetson Xavier NX 计算模块的 21 TOPS 性能和四个麦克风、两个扬声器端子、两个 3.5 毫米电话插孔、一个 8MP 摄像头模块、一个 OLED 显示器,以及一个 128 GB NVMe SSD 进入等式。

Apollo 套件的特色NVIDIA Jetson Xavier NX 计算模块与 NVIDIA Riva、DeepStream 和开箱即用的 JetPack SDK 可加速创建基于边缘 AI 的自动语音识别 (ASR) 和自然语言处理 (NLP) 解决方案。

两个 PVA 视觉加速器、两个深度学习加速器、H.264 和 H.265 视频编码器/解码器增强了这种性能。高速数据传输还可以使用 8 GB 到 16 GB 的 128 位 LPDDR4x 内存,运行速度高达 60 Gbps,或者通过使用 16 GB 的板载 eMMC 5.1 闪存使事情更持久。

当然,Apollo Kit 的独特之处在于它周围的一切:

内置音频编解码器支持其 4 个 MEMS 麦克风

8MP IMX179 摄像头模块支持多种视觉应用

2.08 英寸 OLED 显示屏显示状态和其他读数

随附的 128 GB NVMe SSD 预装了上述 NVIDIA SDK

底架使其能够直立以进行符合人体工程学的工程

SmartCow Apollo 音频/视频工程套件在行动:

希望开发基于感知的应用程序原型的开发人员可以通过设备正面的 40 针接头或侧面的 USB 端口访问 Apollo Kit 资源。套件上还有一个以太网 RJ45 插孔,供希望在项目中添加网络元素的用户使用。

通过系统访问,工程师几乎可以立即开始利用 NVIDIA SDK 提供的所有软件功能。不仅 Riva、DeepStream 和 JetPack SDK 提供了简化应用程序开发的框架,在许多情况下,SmartCow 还在套件上实施了可立即运行的演示和用例优化的 AI 模型,以帮助您起步。

例如:

ASR示例利用 NVIDIA Citrinet 模型转录口语(语音到文本)

基于开源 NLTK 模型的 NLP 示例应用程序分析文本数据以确定输入文本的正面或负面程度,该应用程序将在 OLED 屏幕上显示一头表情牛。此设置还支持命名实体识别 (NER),这是一个从句子中确定命名实体的过程。

第三个聊天机器人演示利用 Chatterbot 开源 GitHub 存储库在 Jetson 上创建两个互相通信的聊天机器人实例。用户可以运行其他 NLP 任务,例如对聊天机器人生成的文本进行情感分析,并在生成的文本上使用文本到语音。

该套件随附的其他软件包括用于视听 AI 应用程序的 Gstreamer (webRTC) 开源多媒体框架示例和主机 Ubuntu Linux 操作系统

Apollo 音频/视频 AI 工程套件入门

Apollo 音频/视频 AI 工程套件的尺寸为 81 x 69 x 125 毫米,因此您真正需要的只是工作台和开发 PC 上的足够空间。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    11362

    浏览量

    210949
  • 操作系统
    +关注

    关注

    37

    文章

    6927

    浏览量

    124015
  • AI
    AI
    +关注

    关注

    87

    文章

    32143

    浏览量

    271053
收藏 人收藏

    评论

    相关推荐

    AI智能体套件

    AI智能体套件,型号ZXAIEC43,是深圳市启明智显科技旗下产品。该套件包含PCBA主板、LED触摸灯板、喇叭、麦克风、嵌入式软件、大模型云平台以及小程序,集成AI大模型技术,为用户
    发表于 02-25 16:48 0次下载

    问答式AI智能体套件助力“IP+AI”产业化落地

    AI智能体套件应用于IP玩具中,给IP玩具赋予灵魂,让AI智能体赋能玩具给予更具有沉浸式的陪伴体验
    的头像 发表于 02-25 16:31 236次阅读
    问答式<b class='flag-5'>AI</b>智能体<b class='flag-5'>套件</b>助力“IP+<b class='flag-5'>AI</b>”产业化落地

    AI开发板】正点原子K230D BOX开发板来了!一款性能强悍且小巧便携的AI开发板!

    AI开发板】正点原子K230D BOX开发板来了!一款性能强悍且小巧便携的AI开发板! 正点原子K230D BOX是一款性能强悍且小巧便携的AI视觉开发套件,其内嵌的正点原子K2
    发表于 02-18 16:56

    端侧 AI 音频处理器:集成音频处理与 AI 计算能力的创新芯片

    电子发烧友网综合报道:端侧 AI 音频处理器是专为智能物联网(AIoT)端侧设备设计,集成了人工智能(AI)加速器的系统级音频处理器。这类处理器旨在打造低功耗、高算力的芯片平台,以满足
    的头像 发表于 02-16 00:13 1444次阅读

    AI健康助手超值之选:问答式AI智能体套件29.9元拿下!

    问答式AI智能体套件是一款集成高性能PCBA主板、LED触摸灯板、高品质喇叭与麦克风、嵌入式软件、大模型云平台以及用户友好的小程序的AI套件,29.9元的超值价格,就能为企业提供一套端
    的头像 发表于 01-02 10:35 249次阅读
    <b class='flag-5'>AI</b>健康助手超值之选:问答式<b class='flag-5'>AI</b>智能体<b class='flag-5'>套件</b>29.9元拿下!

    XMOS将亮相CES 2025,展示全新AI音频技术

    带来更加智能、完美、准确和低延时的音频体验。 这些创新技术包括空间音效、语音捕获与降噪、音视频多模态AI处理等,均由XMOS的xcore.ai系列多核控制器提供支持。xcore.
    的头像 发表于 12-13 11:20 987次阅读

    贸泽开售适用于AI和机器学习应用的 AMD Versal AI Edge VEK280评估套件

    VEK280评估套件。Versal AI Edge VEK280评估套件采用AMD Versal AI Edge VE2802自适应SoC,该系列
    发表于 11-21 14:23 171次阅读

    tlv320Ai32在输出音频时总有丝丝声,为什么?

    tlv320Ai32在输出音频时总有丝丝声,即使输出的滤波将噪声调整到90mV以下还是存在。测试发现HPout的噪声有将近480mV 请问这是什么原因,Ai32还有什么寄存器要设置的? 模拟电源的纹波大概60mV,有影响吗?
    发表于 11-05 06:09

    高清视频线与音频线的连接方式

    随着家庭娱乐系统的不断升级,高清视频和高质量音频成为了现代家庭影院系统的重要组成部分。 1. 了解不同类型的连接线 在开始连接之前,了解不同类型的连接线是非常重要的。常见的高清视频线包括HDMI
    的头像 发表于 10-30 16:11 1126次阅读

    NVIDIA RTX AI套件简化AI驱动的应用开发

    NVIDIA 于近日发布 NVIDIA RTX AI套件,这一工具和 SDK 集合能够帮助 Windows 应用开发者定制、优化和部署适用于 Windows 应用的 AI 模型。该套件
    的头像 发表于 09-06 14:45 564次阅读

    【xG24 Matter开发套件试用体验】初识xG24 Matter开发套件

    今天带刚收到xG24 Matter开发套件的快递,为大家做个xG24 Matter开发套件视频介绍,带大家认识一下这款xG24 Matter开发套件。 EFR32xG24 Explo
    发表于 07-11 23:31

    音频语音数据(AVD)模块开发套件DA14AVDDECTDEVKT数据手册

    电子发烧友网站提供《音频语音数据(AVD)模块开发套件DA14AVDDECTDEVKT数据手册.rar》资料免费下载
    发表于 05-30 16:39 1次下载
    <b class='flag-5'>音频</b>语音数据(AVD)模块开发<b class='flag-5'>套件</b>DA14AVDDECTDEVKT数据手册

    联发科发布天玑AI开发套件,赋能终端生成式AI应用

    联发科近日推出了全新的天玑AI开发套件,旨在为合作伙伴打造一站式解决方案,以加速终端生成式AI应用的开发。这款套件集合了四大核心模块,为AI
    的头像 发表于 05-10 11:19 674次阅读

    炬芯科技赵新中:无线音频SoC的AI算法未来和应用

    的平台。 炬芯科技算法研发中心高级总监赵新中受邀出席,于电声元器件及芯片专题论坛发表以《无线音频SoC的AI算法未来和应用》为主题的演讲,分享了炬芯科技的音频AI算法研究、应用经验和最
    的头像 发表于 04-10 11:13 535次阅读
    炬芯科技赵新中:无线<b class='flag-5'>音频</b>SoC的<b class='flag-5'>AI</b>算法未来和应用

    阿里巴巴推出全新AI图生视频模型EMO

    近日,阿里巴巴集团智能计算研究院宣布推出了一款革命性的AI图片-音频-视频模型技术——EMO。据官方介绍,EMO是一种先进的音频驱动肖像视频
    的头像 发表于 03-05 11:00 1518次阅读