《STT-Powered by Fster Whisper/语音转文字》v0.2版

Whisper v0.2是一款免费开源的本地语音转文字工具，基于通用的语音识别模型，它是在各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。软件可以实现录音转换为文字的需求，基于Faster Whisper模型，即便在普通的CPU上也能实现出色的效果。

1.选择下载的安装包右键解压。

2.解压后，右键以管理员身份运行软件（也可将此程序发送到桌面快捷方式，便于后期使用）。

3.软件功能说明：

❶模型选择：在左上角选择你想使用的模型，本工具已集成medium模型，small与large需要另外下载，下载进度可以在控制台中查看。

❷GPU选择：如果你的电脑没有支持CUDA的GPU，务必不要选择GPU选项，否则程序可能会崩溃。

❸推理方式与精度：在左下角选择推理方式和精度。推荐在CPU上选择'int8'模式，这样速度更快。使用'large'模型时，建议将精度设置为'float32'。

4.点击【选择文件】支持wav与mp3格式，模型选择【medium】此模型已集成无需下载，点击【开始识别】。

5.识别完成后，点击【保存结果】即可。

《STT-Powered by Fster Whisper/语音转文字》v0.2版插图-拾艺肆

本站名称

拾艺肆

隐私政策

privacy-policy

用户协议

agreement

许可协议

NC-SA 4.0

本站内容均转载于网络，版权归原作者所有，仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任，如有侵权，请联系 1322812658@qq.com 删除

THE END