Neon AI SDK 是第一个面向对话式 AI 开发人员的“全源”软件开发工具包。
随着对话式人工智能 (CAI)、语音处理、语音转文本和文本转语音的采用,人机交互的步伐正在加快。以每分钟字数 (wpm) 衡量,通过语音传达信息的速度通常是打字速度的两倍多(语音 = 140 到 200+ wpm,打字 = 20 到 90 wpm)。此外,说话通常更方便、更容易。相比之下,听力可能比阅读更容易——例如在开车、锻炼或做家务时——但速度只有大约 60%(听力 = 140 到 >200 wpm,阅读 = <180 到 >400 wpm)。另请注意,如下所述,包括 Neon AI 在内的一些音频播放器启用了可以缩小差距的加速选项。
CAI 很快将在人机交互中无处不在,而读者仍处于优势地位(尤其是语音到文本)。市场数据显示,到 2020 年,语音输入(和图像)用于搜索的次数将超过打字,到 2025 年,超过 50% 的人机交互将通过语音进行。消费者正在等待免提方式与他们的设备,从数字助理到照明和电器控制,再到汽车,再到记录患者信息的医疗服务提供者。添加语音处理的价格已经下降到单个设备可以在物联网 (IoT) 上启用语音的水平。将从打字转换为语音,从阅读转换为听力的应用程序的列表是无穷无尽的。
语音处理的发展
虽然语音记录和输出自爱迪生于 1877 年发明留声机以来就已经可用,但语音处理技术直到数字电子革命才成为可能,语音识别的进步遵循摩尔定律(集成密度电路每两年翻一番)。以下列表提供了发展的高级摘要:
1952 — 贝尔实验室 — 奥黛丽 — 10 位数
1962 — IBM — Shoebox — 16 个英文单词
1976 年 — 卡内基梅隆大学 — Harpy — 1,011 字
1985 — IBM — Tangora — 20,000 字
1990 — Dragon — Dictate — 消费者语音识别
1993 — 卡内基梅隆大学 — Sphynx-II 连续语音识别
2002 — 微软 — Office
2006 — IBM — 沃森
2008 年——谷歌——iPhone 语音搜索
2011——苹果——Siri
2013 — 中国 — 百度、腾讯、阿里巴巴
2014 年——微软——Cortana
2015 年 — 亚马逊 — Alexa
2016 — Mycroft.ai — 开源对话式 AI
2018 — 亚马逊 — Alexa 应用程序编程接口 (API)
2019 — Neongecko — Neon AI 对话式软件开发套件 (SDK)
人工智能革命
人工智能 (AI) 是一个现代术语,用于结合算法、数据结构和大数据,根据训练语料库(尤其是神经网络)统计预测结果。在人工智能之前,人工任务的自动化仅限于机械化的泰勒主义和琐碎任务的自动化。人工智能预测算法的使用已经彻底改变了许多领域,从语音到文本到翻译、从驾驶到广告、从医学到政治,以及服务行业的快速自动化,延续了可能被称为服务任务的泰勒主义。
具有独立于说话者的语音到文本的用户友好型 AI 系统(即会话式 AI)所需的当前技术仅适用于“云中”的专门系统,特别是来自 Google、Amazon、Apple 和 IBM 的系统。在不到两年的时间里,最新一代的人工智能芯片将结合起来,让具有对话功能的物联网变得负担得起,可能比键盘成本更低,并且通过消除对网络连接的要求来提高隐私和可靠性。
下一代 CAI 系统开发需要的不仅仅是 API
开发人员和消费者今天使用的大多数 CAI 开发系统都是“封闭的”——它们要求开发人员完全按照设备制造商想要的方式使用服务,并且他们提供所有用户数据到 CAI 系统。亚马逊、谷歌、苹果、微软和 IBM 在 1990 年代由美国在线推广的“围墙花园”方法正在卷土重来。相比之下,在Neongecko,我们认为“围墙花园”并不适合这项令人难以置信的技术的未来。
我们很自豪地提供了一个开源解决方案——Neon AI 软件开发工具包 (SDK) ——拥有无限的机会,我们鼓励在我们的代码上进行协作构建。我们认为,世界各地数以千计的公司、实验室和大学的开发人员应该决定技术的进程,而不是少数公司。不幸的是,对于谷歌、亚马逊、苹果和其他人工智能公司来说,情况并非如此。
虽然我们感谢这些主要人工智能参与者所做的贡献,并且虽然我们使用了他们的一些软件,但我们认识到现在是时候将事情提升到一个新的水平了。现在,您可以选择适合您需求的解决方案——而不是少数 AI 公司的底线需求——并且不与继续“与可信赖的合作伙伴共享您的数据”的实体共享您的数据。您可以完全独立于我们的服务器和服务使用我们的软件。我们的 Neon AI SDK 可以提供框架来定制您的产品、企业、学校或家庭,以满足您所有的对话式 AI 需求。
Neon AI SDK 提供更多选项和更好的隐私
使用我们的服务时,您可以使用亚马逊和谷歌等其他流行的 AI 服务提供商的部分内容。如果这让您对自己的隐私感到紧张,我们为您提供保障。我们的软件就像一个代理,因此您可以获得行业标准的 STT 和 TTS,而无需放弃您的所有私人信息。此外,如果您决定使用自己的服务器进行完全自定义的路由,则根本不需要使用它们。
Neon AI SDK
Neon AI SDK 将高级 AI 和自然语言理解集成到一个具有凝聚力的软件工程平台中,该平台完全可定制且易于使用。
我们在各种平台上提供 Neon AI。此外,我们还创建了下一代定制设备,并在各种现成的解决方案中提供 Neon AI。Neon Nano 只需一行代码即可将 Neon AI 安装到任何网站。同时,我们的Klat.com Adaptive Forums 互联网聊天应用程序可在 100 多个网站上使用,它提供基于 Neon AI 的全功能人工智能聊天服务。适用于 Android 手机的 Neon AI 应用程序将我们的最佳功能结合到第一个开源多平台 CAI 系统中。
开发人员将被我们产品的无限潜力所吸引。我们以文本和视频的形式提供了大量关于如何安装 SDK、创建技能和使用 Neon AI 开发产品的说明。
Neon AI SDK 是一个全栈应用程序,开发人员可以通过它整合新的 AI 技能并增强核心执行能力。Neon AI 技能包括实时转录、翻译、对话、设备控制、可听手势(如鼓掌)等等。
Neon AI SDK 在我们的私有 GitHub 存储库中可用。Neongecko 存储库使开发人员和用户能够在开发系统和目标设备(如 NeonU、通用 Linux PC 和具有虚拟环境的 Windows)上安装我们的技术。设备和标准浏览器客户端可以连接到我们或您的服务器。
Neon AI 与其竞争对手
Amazon Alexa、Microsoft Cortana、Apple Siri 和 Google Home 之间的差异总结:
封闭系统
有限的选择
他们平台上的隐私问题包括 STT、TTS、位置信息、网络数据等。
用户许可证允许他们“与可信赖的合作伙伴共享”
Neongecko 霓虹灯 AI:
更好的隐私
Neongecko 尽可能不分享信息。
Neon AI 可以使用亚马逊或谷歌的服务,我们的服务器会聚合连接,从而混淆个人用户。
可用于更多平台。
Neon AI 支持智能扬声器、“查看”设备和 PC。
Neon AI 应用程序适用于 Android 手机。
Neon AI 支持“标准”网站。
Neon AI 在网络浏览器中提供了一个对话控制台。
Neon AI 支持平台之间的通信。
可以在任何地方使用服务:我们的服务器、共享服务器(如 Mycroft AI)或您自己的服务器(如用于 STT 的 Deep Speech 和用于 TTS 的 Mimic)
更高级的技能(从数据库和网站内容集成到简单的脚本编写)
在所有级别上开放以进行自定义和增强
使用户能够在多个级别的编程中工作
带有可供 Neon AI 服务器使用的许可证的白标系统
总结
不要被 AI 淹没。您需要快速、复杂的 AI 支持,而我们已经做到了。从实时转录和语言翻译到智能警报和数据库集成,我们的开源和专利技术可以让您的应用程序和设备领先一步。请访问我们的neongecko.com了解更多信息。
审核编辑 黄昊宇
评论
查看更多