本地語音轉(zhuǎn)文字STT Powered by Faster Whisper

軟件介紹
最近接到一個需求,需要把錄音轉(zhuǎn)換為文字,一看網(wǎng)上幾款常用的工具,想不到都是收費的;找了找,發(fā)現(xiàn)基本上都需要云端api,僅有的幾個本地的都需要使用GPU中的cuda計算。因此,開發(fā)了這么一款語言轉(zhuǎn)文字的小工具,基于Faster Whisper模型,在cpu上也能達到不錯的效果。
使用方法
雙擊文件打開,在左上角選擇模型,左下角選擇推理方式與精度(cpu推薦int8,速度更快)。
若沒有支持cuda的GPU請不要選擇GPU,否則會崩潰(原本想導入pytorch庫判斷cuda_is_available的,但是這樣打出來的包會把一整個pytorch一起打包進去,太大了,后來就沒這么處理)
首次使用需要下載模型,進度在console中可見,請耐心等待。
相關文件下載地址
©下載資源版權歸作者所有;本站所有資源均來源于網(wǎng)絡,僅供學習使用,請支持正版!
? 版權聲明
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關文章
暫無評論...