Whisper是一种通用的语言转录模型。它在包含各种音频的大型数据集上进行训练,也是一个多任务模型,并且可以执行多种语言语言语音转呈言识别。 大型v2 型号尺寸 版本 大型v2 所有其他人