热门排行
简介
WhisperDesktop可实现本地电脑的音频转文字软件!双向转换,完全免费开源!支持 Windows、macOS、Linux,目前界面只有英文的,但支持中文的转换。
【功能特点】
基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT
内置性能分析器,可测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。
用于音频捕获的语音活动检测。
模型说明:
base、tiny、small:虽然快,效果很差,直接忽略吧。
medium:速度不错,英文推荐使用这个,如果转带时间戳的中文也推荐这个,但转出来的是繁体,需要配合打包的繁简转换工具。
large:速度较慢,如果要生成简体中文纯文本的话,推荐这个。