在我们运行Python程序之前,我们需要安装两个库:语音识别和PyAudio。要安装这两个库,需要在终端窗口中运行以下两个命令:
$ sudo pip install SpeechRecognition
$ sudo pip install PyAudio
如果您在安装PyAudio时遇到问题,可以使用以下系列安装它说明:
$ sudo apt-get install git
$ sudo git clone http://people.csail.mit.edu/hubert/git/pyaudio.git
$ sudo apt-get install libportaudio0 libportaudio2 libportaudiocpp0 portaudio19-dev
$ sudo apt-get install python-dev
$ cd pyaudio
$ sudo python setup.py install
一旦安装了这两个库,您就需要禁用Raspberry Pi上的板载音频驱动程序,因为它可能会干扰PyAudio。为此,首先打开一个新终端并运行以下命令:
$ cd /etc/modprobe.d
$ sudo nano alsa-blacklist.conf
Nano是终端的简单文本编辑器,加载时只需要输入一行:
blacklist snd_bcm2835
按Ctrl + X退出nano并使用文件名alsa-blacklist.conf保存文件。这个简单的文件禁用了Raspberry Pi的Broadcom音频系统,因此Pi上唯一可用的音频系统是USB声卡。
语音控制冰箱列表如何工作
Python脚本首先导入语音识别模块,该模块用于将口语单词转换为字符串。导入模块后,我们创建一个对象r,它是一个语音识别器对象,用于记录麦克风的音频,然后请求转换。在定义了语音识别对象之后,我们还定义了变量,包括项目列表,命令,当前项目以及包含已解析命令的数组。
import speech_recognition as sr
r = sr.Recognizer()
items = dict()
command = “”
item = “”
初始配置完成后,下一个要执行的代码块就是主循环。循环中的第一个任务是通过打印单词“Speak”通知用户发言,然后创建一个名为“audio”的音频对象,它保存我们的麦克风流。
while(1):
with sr.Microphone() as source:
print(“Speak:”)
audio = r.listen(source)
当麦克风检测到声音并完成录制时(当声级低于阈值时录制停止),它会将录制的音频传递给识别器对象。执行此操作后,r将使用Google服务尝试将音频转换为句子,然后将其传递给名为speechString的变量。所有这些代码都在try/except块中完成,以防音频被理解或服务不可用。收到的字符串也被解析为prasedCommands,其中分隔符是空格。因此,如果说“添加培根”这个词,结果将是parsedCommands [0]将是“add”而parsedCommands [1]将是“bacon”。
try:
speechString =r.recognize_google(audio)
parsedCommands = speechString.split(“ ”)
except sr.UnknownValueError:
print(“Could not understand audio”)
except sr.RequestError as e:
print(“Could not request results; {0}”.format(e))
if(len(parsedCommands) 》 0):
command = parsedCommands[0]
if(len(parsedCommands) 》 1):
item = parsedCommands[1]
现在我们拥有我们解析的命令和项目,我们可以将它们添加到我们的项目列表中。但是,为了保持清洁,我们会执行以下几项检查:
如果该项目已存在且已添加,则增加项目值
如果该项目不存在且添加了该项目,则将该项目添加到列表中
如果该项目已存在且已删除,则如果总计大于1则减去1
/li》
如果该项目已存在,则说明已删除,并且只剩下项目,删除项目
如果该项目不存在,忽略命令
if(command == “add”):
if item in items:
items[item] = str(int(items[item]) + 1)
else:
items[item] = str(1)
print(item + “ added”)
if(command == “remove”):
if item in items:
if(int(items[item]) 》 1):
items[item] = str(int(items[item]) - 1)
else:
try:
items.pop(item, None)
except:
pass
print(item + “ removed”)
这个简单脚本中的最后一个命令是“display”,它将变量项的内容打印到显示中。
if(command == “display”):
print(items)
完整代码
import speech_recognition as sr
r = sr.Recognizer()
items = dict()
command = “”
item = “”
while(1):
with sr.Microphone() as source:
print(“Speak:”)
audio = r.listen(source)
try:
speechString =r.recognize_google(audio)
parsedCommands = speechString.split(“ ”)
except sr.UnknownValueError:
print(“Could not understand audio”)
except sr.RequestError as e:
print(“Could not request results; {0}”.format(e))
if(len(parsedCommands) 》 0):
command = parsedCommands[0]
if(len(parsedCommands) 》 1):
item = parsedCommands[1]
if(command == “add”):
if item in items:
items[item] = str(int(items[item]) + 1)
else:
items[item] = str(1)
print(item + “ added”)
if(command == “remove”):
if item in items:
if(int(items[item]) 》 1):
items[item] = str(int(items[item]) - 1)
else:
try:
items.pop(item, None)
except:
pass
print(item + “ removed”)
if(command == “display”):
print(items)
command = “”
item = “”
days = “”
parsedCommands.clear()
此项目以Raspberry Pi为中心,除麦克风和显示器外不需要任何电路或硬件。虽然可以使用普通的显示器或电视显示器,但它对于安装来说并不是很实用,因此在这个项目中,我得到了一个小型的3.5英寸Raspberry Pi显示器,分辨率为480x320。虽然这对于正常使用而言太小,但它非常适合命令行工作,如果通过网络编程和使用此Pi(使用SSH),则可以从任何具有Internet连接的PC上运行Python程序。
-
python
+关注
关注
56文章
4797浏览量
84741 -
树莓派
+关注
关注
116文章
1708浏览量
105679
发布评论请先 登录
相关推荐
评论