python利用pyttsx3 API实现文本转语音处理
作者:无水先生
一、说明
介绍一款python调用库,离线软件包pyttsx3 API,它能够将文字转化成语音文件。Python 中有多种 API 可用于将文本转换为语音。pyttsx3 是一个非常易于使用的工具,可将输入的文本转换为音频。与其它类似的库不同,它可以离线工作,并且与 Python 2 和 3 兼容。
二、环境安装
安装 pyttsx3 API,请打开终端并写入:
pip install pyttsx3
该库依赖于 win32,因此我们在执行程序时可能会出现错误。为了避免这种情况,只需在您的环境中安装 pypiwin32 即可。
pip install pypiwin32
三、pyttsx3 中重要函数
一些重要函数包括:
- pyttsx3.init([driverName : string, debug : bool]) – 获取对将使用给定驱动程序的引擎实例的引用。如果请求的驱动程序已被另一个引擎实例使用,则返回该引擎。否则,将创建一个新引擎。
- getProperty(name : string) – 获取引擎属性的当前值。
- setProperty(name, value) – 将命令排队以设置引擎属性。新的属性值会影响此命令之后排队的所有话语。
- say(text : unicode, name : string) – 将命令排队以说出话语。语音根据队列中该命令之前设置的属性输出。
- runAndWait() – 处理所有当前排队的命令时发生阻塞。适当地调用引擎通知的回调。当在此调用之前排队的所有命令都从队列中清空时返回。
四、文本转语音程序示范
现在我们已经准备好编写一个将文本转换为语音的示例程序。
# Python program to show # how to convert text to speech import pyttsx3 # Initialize the converter converter = pyttsx3.init() # Set properties before adding # Things to say # Sets speed percent # Can be more than 100 converter.setProperty('rate', 150) # Set volume 0-1 converter.setProperty('volume', 0.7) # Queue the entered text # There will be a pause between # each one like a pause in # a sentence converter.say("Hello GeeksforGeeks") converter.say("I'm also a geek") # Empties the say() queue # Program will not continue # until all speech is done talking converter.runAndWait()
输出:
上述程序的输出将是一个声音,说“Hello GeeksforGeeks”和“I'm also a geek”。
五、变语速处理
我们将设置发动机的速率和音量。设置讲话的速率和音量:
rate = engine.getProperty('rate') engine.setProperty('rate', rate-100)
默认情况下,速率是200,所以我们将其降低到100。速率是说话速率,200对我们来说很高。所以我们降低了它。
速率简单来说就是说话者说出文本的速度。设置速率后,我们将通过首先获取音量属性然后设置它来更改或设置音量。
volume = engine.getProperty('volume') engine.setProperty('volume', volume+0.50)
默认音量为 1,即 100%,我们通过将 0.50 添加到从读取音量属性接收到的值,将其增加到 150%。
现在我们完成了这两个属性的设置,我们将调用 say(),语音现在将具有我们的参数,即 1x 速度和 1.50 音量。
engine.say("Hello, This is the test for the pyttsx3") engine.runAndWait()
现在这个 runAndWait 对我们来说很重要。我们想要运行这个引擎,并继续运行,直到它完成所传递文本的 TTS。
六、改变声音
假设您想将生成的声音从男性更改为女性。你怎样做呢?让我们来看看。
您会注意到,当您运行上述代码来实现文本到语音转换时,响应的声音是男性声音。要更改语音,您可以通过从引擎获取语音属性来获取可用语音列表,并且您可以根据系统中可用的语音更改语音。
要获取声音列表,请编写以下代码。
voices = converter.getProperty('voices') for voice in voices: # to get the info. about various voices in our PC print("Voice:") print("ID: %s" %voice.id) print("Name: %s" %voice.name) print("Age: %s" %voice.age) print("Gender: %s" %voice.gender) print("Languages Known: %s" %voice.languages)
Output:
要更改语音,请使用 setProperty() 方法设置语音。上面找到的 Voice Id 用于设置语音。
下面是变声的实现。
voice_id = "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-US_ZIRA_11.0" # Use female voice converter.setProperty('voice', voice_id) converter.runAndWait()
现在,您可以根据需要在声音之间切换。您可以尝试运行 for 循环来将不同的语句分配给不同的声音。运行代码并享受结果。
到此这篇关于python利用pyttsx3 API实现文本转语音处理的文章就介绍到这了,更多相关python 文本转语音内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!