资料介绍
描述
是时候谈谈了。
我想我应该给这个它自己的特定帖子——这是我在我的Raspbinator和Nvidinator项目中使用的聊天机器人。下面链接的 GitHub 将随着我对其进行改进而不断更新。
我已经决定了 Chatbot 8 这个名字——在我使用 GitHub 之前,我把它放在了我的 Google Drive 上,每次迭代我都会增加它的数量;我很高兴在 Raspbinator 中使用的第一个是第 8 次迭代,现在,这个名字有点卡住了。
主要目标:
- 制作一个可以响应人类输入的机器人,随着时间的推移学习并返回更多有机响应。
- 能够从大型文本文件(例如电影脚本和对话记录)中进行训练。
- 使其能够轻松集成到其他项目中。
工作原理。
所以这是我的GitHub 上的代码。
我已经让这些聊天机器人与Raspberry Pi项目一起工作——因此一切都将基于 Pi 和 Raspbian 操作系统。
有几个依赖项:
其他一切都应该包含在Raspbian上的 Python 包中。
在较高层次上,系统的逻辑如下:
Bot 说最初的“你好”。
人类回应。
Bot 存储对“Hello”的响应,并在其数据库中搜索其之前所说的与人类输入的内容非常匹配的任何内容,然后显示先前交互的结果。
通过存储人类对机器人 Mongo 数据库的反应并将它们分配给机器人之前说过的事情,然后将人的输入与这些项目进行比较以找到合适的反应,您可以从机器人那里得到一些相当不错的反应。
举个例子; 如果机器人说“天气怎么样”并且我输入“外面正在下雨”,它会存储该响应并将其与该输入相关联。现在,如果其他人出现并输入“天气如何”,它将在其数据库中搜索相近的匹配项并找到之前的回复“天气怎么样”,此时它将搜索对此的回复并找到我的回复“它的外面在下雨”。因此,虽然它并没有真正“思考”它的反应,但它确实最终会给出一些合理的回复。
它将首先以相当高的准确度搜索已知输入,然后如果失败,它将降低到中等准确度,最后降低到低准确度。我目前正在使用 这个 库来比较字符串:
准确度级别为:
- fuzz.ratio(Str1.lower(),Str2.lower())
- fuzz.partial_ratio(Str1.lower(),Str2.lower())
- fuzz.token_set_ratio(Str1,Str2)
您可以在我上面链接的网站上看到这些函数是如何工作的——但通常所需的准确性会随着函数的运行而降低。每个的阈值也可以调整。
因此,如果输入字符串/存储字符串的最高返回比率低于阈值,它将下降到第二个部分匹配并执行相同的操作,最后如果失败;它将移动到设定的比率匹配。最后一个适用于具有匹配单词的不同大小的字符串。
现在如果上面没有匹配项会发生什么?在机器人响应之前,它会将收到的输入存储到数据库中,它还会拆分每个输入并存储所有单个单词。因此,当它找不到之前对您的输入的回复时,它有 40% 的机会从这些词中生成一个随机句子,并有 60% 的机会选择一个它知道的完全随机的完整句子。
现在你可能会认为这会导致机器人说很多废话——你是对的,但一开始它只会在你和它说话时重复你说的话。但是你输入和回复的越多,它学到的越多,它生成的随机句子有时实际上有一定的意义;当你回复它时,它就会有一个参考点,用于确定它何时收到类似于它刚才所说的输入。
这是另一个例子:
如果我对机器人说:“我喜欢奶酪”,它的数据库中没有任何输入信息,也没有足够的词来生成一个随机句子,基本上是一个猜测,它可能会返回:“Hello television like usually”。这当然没有意义,但如果我随后回复“是的,我也喜欢电视”,它会存储该回复。现在,比方说,其他人出现并输入“我通常看电视”,它会在数据库中运行它并找到它与之前所说的相似(“你好电视就像通常一样”)并找到我的回答(“是的,我喜欢电视也是”),给人一种真实反应的错觉。
它本质上是从头开始学习,它什么都不知道,所以它会尽力使用以前的经验,作为最后的手段,猜测——直到它学到更多,这样它就不必再猜测了。
它还能够与多人保持对话——为与之交谈的每个人创建一个新班级,并记录他们与机器人的最后回应。因此,当您使用“change_name”命令或通过从外部程序向对话功能输入不同的名称来切换人员时,它可以与在该会话中已经与之交谈过的人进行对话。
模块化的。
最近,我添加了将聊天机器人导入其他程序的功能,并且能够从机器人获取文本输入和接收输出——具有一个简单的界面,只需要一个带名称的输入字符串。然后机器人本身会处理之前的回复和机器人响应;随着对话切换并返回响应。
它还可以独立运行以进行测试,即使作为另一个项目的组件也可以轻松进行训练和测试——例如与Nvidianator的 STT/TTS 和 ML 部分集成。
要使用它,只需将 bot .py 文件放在与它将使用的程序相同的文件夹中并使用:
将 bot_8 导入为聊天机器人
一旦导入到 Python 程序中,它就可以与命令交互:
回复 = chatbot.conversation(inputWords,humanid)
输入的单词当然就是输入的内容,因此这可以从语音到文本功能(例如wit.ai 或其他一些文本输入)中获取。
humanid 是当前与之交互的人的名字。
将这两个输入都放入函数后,它将以字符串形式返回回复——然后可用于在导入聊天机器人的程序中进行进一步处理。
训练。
我还添加了一个训练模块——这可以很方便地加载大型文本文件,例如电影剧本或对话记录,这样机器人就可以在现有数据上进行训练——我已经用合金装备的脚本试过了它工作得很好。
它通过扫描每一行并将数据放入机器人来工作——当每一行新行进入机器人代码时,都会将其分配为对前一行的响应。
它被编程为过滤掉以非字母字符开头的空行和句子,以及以“:”分割行;因此,如果一个脚本的名字表示谁在说话,并且有各种注释,应该跳过这些行并删除名字。虽然目前这有点混乱并且可以做一些工作,但这基本上意味着你可以插入一个脚本并且它(应该)整齐地通过它,只选择相关的语音文本。
通过在脚本上训练机器人,您可以输入来自游戏/电影/对话的输入,它会非常可靠地返回正确的响应——就上面的《合金装备》脚本而言,您可以通过输入角色所说的话。
例如,使用上述 MGS 训练数据:
- 如果我输入“你是菜鸟吗?”
- 机器人用 Meryl 的一句话回应:“小心,我不是菜鸟!!”
等等。
可以使用开关“-fresh”调用训练模块,这将清除数据库并从头开始训练,如果没有此开关,它将进一步训练现有数据库。
训练数据需要与机器人位于同一文件夹中,并称为“learning.txt”。
还有一个 deleteDB 模块,当它运行时,它按照它说的去做并清除数据库。
从理论上讲,如果它接受大量正常人类对话的训练,它会返回大量有机反应;此外,根据他们接受的培训输入,每个机器人都可以有自己独特的个性。
正在进行中。
随着时间的推移,我将继续改进它以使其变得更好。因此,请继续检查我的 GitHub 以获取更新。
我也在努力让聊天机器人与Docker打包在一起 ——这样它就可以很容易地与所有依赖项一起部署,并且在同一台机器上也有单独的持久机器人,甚至不需要在操作系统本身上安装 MongoDB。
您有任何改进机器人的想法吗?让我知道。
也可以随意下载并自己尝试——请注意,从空白开始,在它开始变得有意义之前需要大量的训练数据/与之交谈。
下个项目见。
- 坦克机器人开源分享
- 扫地机器人开源资料 43次下载
- 智能聊天机器人ChatGPT的初体验
- 英雄机器人开源
- WhatsApp地图和天气预报聊天机器人开源
- 机器人开源案例
- 基于STM32简易DIY智能聊天机器人
- 基于DSP和PC的农业机器人控制系统 17次下载
- 如何解决聊天机器人中用户就医意图识别方法 2次下载
- 检索式智能对话机器人开发实战案例详细资料分析概述 16次下载
- 分享几款聊天机器人平台玩转聊天机器人 0次下载
- 实例阐述聊天机器人的可扩展架构 0次下载
- 机器人的传感器详解 0次下载
- 聊天机器人的作用分析 2次下载
- 五步诠释聊天机器人 10次下载
- 字节发布机器人领域首个开源视觉-语言操作大模型,激发开源VLMs更大潜能 360次阅读
- 机器人技术中常用的路径规划算法的开源库 843次阅读
- 面对疫情 医疗机器人能帮上什么忙? 2126次阅读
- dfrobotSparki机器人套装简介 2064次阅读
- 工业机器人编程入门_工业机器人的编程要求 9571次阅读
- 医用机器人的定义_医用机器人发展 3122次阅读
- 医用机器人的功能_医用机器人分类 2227次阅读
- 协作机器人的起源_为什么需要协作机器人 8127次阅读
- 详细梳理聊天机器人的现状及技术,并讨论了未来可能的发展方向 7215次阅读
- 用Python轻松做一个智能聊天机器人 6756次阅读
- 机器视觉的机器人取代四台传统的火焰处理机器人 3270次阅读
- 如何区分机器人、协作机器人和移动机器人? 6828次阅读
- 常识知识有助于开放域对话系统中语言的理解与生成 5043次阅读
- 软体机器人 前所未见的机器人 3692次阅读
- 机器人的最佳编程语言是什么?机器人十大流行编程语言汇总 3.4w次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多