软件介绍
Whisper v0.2是一款免费开源的本地语音转文字工具,基于通用的语音识别模型,它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。软件可以实现录音转换为文字的需求,基于Faster Whisper模型,即便在普通的CPU上也能实现出色的效果。
-
软件大小:1.57G
-
安装环境:Win10~Win11或更高
使用教程
1.选择下载的安装包右键解压。
2.解压后,右键以管理员身份运行软件(也可将此程序发送到桌面快捷方式,便于后期使用)。
3.软件功能说明:
❶模型选择:在左上角选择你想使用的模型,本工具已集成medium模型,small与large需要另外下载,下载进度可以在控制台中查看。
❷GPU选择:如果你的电脑没有支持CUDA的GPU,务必不要选择GPU选项,否则程序可能会崩溃。
❸推理方式与精度:在左下角选择推理方式和精度。推荐在CPU上选择'int8'模式,这样速度更快。使用'large'模型时,建议将精度设置为'float32'。
4.点击【选择文件】支持wav与mp3格式,模型选择【medium】此模型已集成无需下载,点击【开始识别】。
5.识别完成后,点击【保存结果】即可。
© 版权声明
本站内容均转载于网络,版权归原作者所有,仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任,如有侵权,请联系 1322812658@qq.com 删除
THE END
请登录后查看评论内容