从人工智障到真正的人工智能,写文案,编码,画图,做视频,做表格...除了生孩子,它几乎可以做任何事情。用不了多久,OpenAI的GPT3.5就火了,GPT-4就要来了,新发布的微软365 Copilot也将全面接入GPT-4。不赘述,先说说今天分享的,基于OpenAI衍生自Whisper的语音识别Windows应用。
由OpenAI和开源训练的神经网络Whisper,对普通用户并不是很友好。Const-me的Whisper桌面不一样。界面可用后,点击几下鼠标即可完成。然而,外国人做的所有东西都是英文的,这仍然对小白不太友好。不起眼的老白做了最初级的定位,操作起来更轻松。
Whisper Desktop最大的优势就是离线,开源免费,用起来非常简单,使用GPU的速度还不错,而且机型都是本地的,不用担心后续的变量付费和网络不好。
识别效果也很理想,除了音乐演唱部分,坤坤说的是100%准确识别。
基数,微小,小:虽然快,但是效果很差,忽略就好。
中等:速度不错。推荐给英文,也推荐给带时间戳的中文,但是是繁体,需要结合打包的繁简转换工具。
大:速度慢。如果想生成简体中文文本,我推荐这个。
站长日志索引标题:《【免费开源】AI字幕生成|语音转文字|音频转文字|中文离线版》
具体业务可咨询站长:微信 GOGOGO9196 咨询