关于Python调用百度语音合成SDK实现文字转音频的方法
作者:培根芝士
这篇文章主要介绍了关于Python调用百度语音合成SDK实现文字转音频的方法,AipSpeech是语音合成的Python SDK客户端,为使用语音合成的开发人员提供了一系列的交互方法,需要的朋友可以参考下
Python百度语音合成实现文字转音频
安装百度语音Python SDK
pip install baidu-aip
AipSpeech是语音合成的Python SDK客户端,为使用语音合成的开发人员提供了一系列的交互方法。
初始化AipSpeech
from aip import AipSpeech """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。
配置AipSpeech
如果用户需要配置AipSpeech的网络请求参数(一般不需要配置),可以在构造AipSpeech之后调用接口设置参数,目前只支持以下参数:
| 接口 | 说明 |
| setConnectionTimeoutInMillis | 建立连接的超时时间(单位:毫秒) |
| setSocketTimeoutInMillis | 通过打开的连接传输数据的超时时间(单位:毫秒) |
语音合成
- 合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。文本长度不可超过限制
result = client.synthesis('培根芝士', 'zh', 1, {'spd':5,'vol': 5,'per':4})
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
with open('output.mp3', 'wb') as f:
f.write(result)- 参数说明:
| 参数 | 类型 | 描述 | 是否必须 |
| tex | String | 合成的文本,使用UTF-8编码,请注意文本长度必须小于1024字节 | 是 |
| cuid | String | 用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,长度为60以内 | 否 |
| spd | String | 语速,取值0-9,默认为5中语速 | 否 |
| pit | String | 音调,取值0-9,默认为5中语调 | 否 |
| vol | String | 音量,取值0-15,默认为5中音量 | 否 |
| per | String | 发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女 | 否 |
- 返回样例:
// 成功返回二进制文件流
// 失败返回
{
"err_no":500,
"err_msg":"notsupport.",
"sn":"abcdefgh",
"idx":1
}- 错误返回格式
若请求错误,服务器将返回的JSON文本包含以下参数:
- error_code:错误码。
- error_msg:错误描述信息,帮助理解和解决发生的错误。
错误码:
| 错误码 | 含义 |
| 500 | 不支持的输入 |
| 501 | 输入参数不正确 |
| 502 | token验证失败 |
| 503 | 合成后端错误 |
到此这篇关于关于Python调用百度语音合成SDK实现文字转音频的方法的文章就介绍到这了,更多相关Python百度语音文字转音频内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
