CapsWriter下载 CapsWriter离线识别语音输入工具绿色版下载-脚本之家

热门排行

简介

CapsWriter离线识别语音输入工具绿色版

CapsWriter离线识别语音输入工具是一款绿色的语音输入类型的工具，能够辅助个人在PC上面完成语音输入的内容，并且支持离线识别的功能，在你下载好相关模型的请款之下能够轻松的进行使用，满足个人用户对于语音输入的需求，快来下载CapsWriter离线识别语音输入工具！

这是 CapsWriter 简陋的离线版，一个 PC 端的语音输入工具。

运行后，只要按下键盘上的大写锁定键，就会开始录音，当你松开大写锁定键时，就会识别你的录音，并将识别结果立刻输入。

安装 Python 后，在 cmd 窗口进入本文件夹，运行 pip install -r requirements.txt 安装依赖

sherpa-onnx-bin 文件夹中已经放置了在 Win10-64 端预先编译的 sherpa-onnx 二进制。

其它系统暂时需要按照 sherpa-onnx — sherpa 1.2 documentation 编译后，放入 sherpa-onnx-bin 文件夹。

运行 01sherpa-onnx-server.py 脚本，会载入 Paraformer 模型识别模型（这会占用1GB的内存，载入时长约十几秒）

运行 02-CapsWriter-client.py 脚本，它会打开系统默认麦克风，开始监听按键

按住 CapsLock 键，录音开始，松开 CapsLock 键，录音结束，识别结果立马被输入（录音时长短于0.3秒不算）

目前使用的模型是 Paraformer 非实时模型，即录完再转，因此录音时间越长，上屏延迟越大。

主流性能的 Windows 笔记本，RTF 大约 0.06，即大约每 10s 录音需 0.6s 转录时长。

本地模型对算力要求非常低，基本无需担心性能问题

暂不支持标点符号，暂不支持逆标准化（如把中文数字转阿拉伯数字）

为方便用户检查录音质量、识别效果，脚本默认开启了保存录音，所有都被保存在了 audios 文件夹

CapsWriter离线识别语音输入工具 绿色版