Whisperを利用したAI文字起こしツール

音声ファイルから文字を起こすツールを作成した。 GPT-4と対話しつつできあがった。GoogleColabで作成。あと、さっき見つけたけど、GoogleColab、AIチャット機能できている。手を動かしてAI使うのは面白い。

https://colab.research.google.com/drive/13aBq7Gqg6SZo1WQetP1NCN-wIj7Sorgt

次のステップ

Whisperのバージョンとかあげた方がいいのかも

fastバージョンみたいなものがある?

Whisperについてまだ調べられることある

話者変更できるようになってほしい

議事録のフォーマット指定して音声から起こした文字を素材として、実務で顧客に提示できるレベルのファイル作成までしてほしい。

動画からも音声起こせるか試すのはあり

そもそも文字起こしツールなんて自作しなくても、AIか誰かがもっといいのつくっているだろうから、それ調べてみる。

裏でWhisperAPI動かしているだけっぽい有料サービスもあったりしたのみた。