python语音识别的转换方法
作者:辉煌zzg
语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。本文给大家介绍python语音识别的方法,感兴趣的朋友一起看看吧
使用pyttsx的python包,你可以将文本转换为语音。
安装命令
pip install pyttsx3 -i https://pypi.tuna.tsinghua.edu.cn/simple
运行一个简单的语音 ‘大家好'。
import pyttsx3 as pyttsx engine = pyttsx.init() #初始化 engine.say('大家好') engine.runAndWait()
另一种文本转语音方法。
from win32com.client import Dispatch speaker = Dispatch('SAPI.SpVoice') #创建Dispatch对象 speaker.Speak('大家好') #调用Speak方法 del speaker #释放
这种方法可能会报错,
ImportError: DLL load failed while importing win32api: 找不到指定的模块。
网站下载与自己安装的 “Python" 版本相适应的 "pywin32" 安装程序。
使用SpeechLib完成文本转换语言
from comtypes.client import CreateObject from comtypes.gen import SpeechLib engine = CreateObject('SAPI.SpVoice') #调用方法 stream = CreateObject('SAPI.SpFileStream') #输出到目标对象的流 infile = '1.txt' #要读取的文本 outfile = 'demo_audio.wav' #输出到语音文件 stream.open(outfile,SpeechLib.SSFMCreateForWrite) engine.AudioOutputStream = stream #读取文本内容 f = open(infile,'r',encoding='utf-8') theText = f.read() f.close() engine.speak(theText) stream.close()
使用PocketSphinx将语音转换成文本
首先安装两个工具包
pip install PocketSphinx pip install SpeechRecognition
然后下载cmusphinx-zh-cn-5.2.tar中文识别的放到anaconda的python虚拟环境的目录下
Lib\site-packages\speech_recognition\pocketsphinx-data路径下
解压文件重命名为zh-CN
#将语音转换成文本 使用PocketSphinx import speech_recognition as sr audio_file = 'demo_audio.wav' r = sr.Recognizer() with sr.AudioFile(audio_file) as source: #打开语音文件并读取 audio = r.record(source) try: print('文本内容:',r.recognize_sphinx(audio)) #默认识别成英文 print('文本内容:',r.recognize_sphinx(audio,language='zh-CN')) #指定中文 except Exception as e: print(e)
到此这篇关于python语音识别的文章就介绍到这了,更多相关python语音识别内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!