热门排行
简介
VPot是一款免费无广的文字转语音的工具,内置多语种多声音角色,可将任意文字内容转换为流畅的语音文件,完全调用微软及edge公共API接口,纯CPU处理,适用于譬如短视频配音、教学平台、有声读书等各种应用场景。
虽然这类软件多的是,尤其是在线网页版确实不计其数,缺点都是限制字数的居多,不排除要登录及限制次数的可能。另外,某些真人克l类TTS也相当成熟,无奈老旧系统无缘。而此款并无以上束缚,u1s1这么多厂商的TTS当中唯有微软TTS的声音合成算是yyds,简洁而无登录接口,不限次数不限字数,实现不失真全输出,支持 win 7 – 11 64位系统 。
VPot支持多种语言的转换,包括但不限于普通话、英语、日语等主流语言。它还支持港普(香港普通话)和台普(台湾普通话),这使得它在处理不同地区的语音需求时更加得心应手。
软件特点:
1. 支持导入txt、srt字幕文件;
2. 实现音频文件管理,方便反复试听和对比;
3. 现可自选音频保存目录;
4. 保留超长文本转录的可行性;
5. 文件重命名不再受软件影响。
使用说明:
单文件版即开即用即删,ctrl + v 粘贴对应的文字,合成语音成功后会自动弹出输出的音频结果。常用语种识别包括但不限于普通话、粤语、港普、台语、日韩马来等等,前提是部分外语文字要相应匹配。所以一般而言公共接口已经可以满足日常的转录使用了。文本越长,合成处理自然越久。
若是使用 win 7 及精简版系统,需到微软官方安装 > > Webview2 依赖环境才能玩。不排除可能还需要常用C++运行库的加持。
另外,如果想要更多语种识别多角色演绎且会折腾的,则需自行到 > > 微软Azure 申请免费api自行导入,教程在小破站随处可见,具体自行搜索即可。 况且可直接录制对应的报时声音,可用于某些语音报时工具,如 > > 自动化任务工具(选定“报时”任务,音频默认放在对应的Data——Sound目录文件夹内,直接对应替换原始音频的文件命名及格式)
*已测win 11 平台可正常转录3万+ 文字章节无异常(极限字数则请自行测试),可下载并成功输出约1个半钟的音频文件。
PS:
1.已测火绒无拦截,请戳 > > 查杀结果 。若担心的请扔至虚拟环境当中运行,介意的则勿下勿用,嫌弃的推荐直接del删除。
2.文本内容不得含有特殊符号或表情字符,如井号、星号又或者表情式符号之类的,否则可能提示合成失败。但由于公共接口受网络服务器影响,不排除可能滥用导致偶尔抽风的问题。。。