CapsWriter离线识别语音输入工具 绿色版
- 大小:1.2GB
- 分类:音频处理
- 环境:Windows
- 更新:2023-05-31
热门排行
简介

CapsWriter离线识别语音输入工具是一款绿色的语音输入类型的工具,能够辅助个人在PC上面完成语音输入的内容,并且支持离线识别的功能,在你下载好相关模型的请款之下能够轻松的进行使用,满足个人用户对于语音输入的需求,快来下载CapsWriter离线识别语音输入工具!
这是 CapsWriter 简陋的离线版,一个 PC 端的语音输入工具。
运行后,只要按下键盘上的 大写锁定键,就会开始录音,当你松开 大写锁定键 时,就会识别你的录音,并将识别结果立刻输入。
安装说明
安装 Python 后,在 cmd 窗口进入本文件夹,运行 pip install -r requirements.txt 安装依赖
sherpa-onnx-bin 文件夹中已经放置了在 Win10-64 端预先编译的 sherpa-onnx 二进制。
其它系统暂时需要按照 sherpa-onnx — sherpa 1.2 documentation 编译后,放入 sherpa-onnx-bin 文件夹。
运行和使用
运行 01sherpa-onnx-server.py 脚本,会载入 Paraformer 模型识别模型(这会占用1GB的内存,载入时长约十几秒)
运行 02-CapsWriter-client.py 脚本,它会打开系统默认麦克风,开始监听按键
按住 CapsLock 键,录音开始,松开 CapsLock 键,录音结束,识别结果立马被输入(录音时长短于0.3秒不算)
注意事项
目前使用的模型是 Paraformer 非实时模型,即录完再转,因此录音时间越长,上屏延迟越大。
主流性能的 Windows 笔记本,RTF 大约 0.06,即大约每 10s 录音需 0.6s 转录时长。
本地模型对算力要求非常低,基本无需担心性能问题
暂不支持标点符号,暂不支持逆标准化(如把中文数字转阿拉伯数字)
为方便用户检查录音质量、识别效果,脚本默认开启了保存录音,所有都被保存在了 audios 文件夹













chrome下载
知乎下载
Kimi下载
微信下载
天猫下载
百度地图下载
携程下载
QQ音乐下载