音声ファイルから文字を起こすツールを作成した。 GPT-4と対話しつつできあがった。GoogleColabで作成。あと、さっき見つけたけど、GoogleColab、AIチャット機能できている。手を動かしてAI使うのは面白い。
https://colab.research.google.com/drive/13aBq7Gqg6SZo1WQetP1NCN-wIj7Sorgt
次のステップ
Whisperのバージョンとかあげた方がいいのかも
fastバージョンみたいなものがある?
Whisperについてまだ調べられることある
話者変更できるようになってほしい
議事録のフォーマット指定して音声から起こした文字を素材として、実務で顧客に提示できるレベルのファイル作成までしてほしい。
動画からも音声起こせるか試すのはあり
そもそも文字起こしツールなんて自作しなくても、AIか誰かがもっといいのつくっているだろうから、それ調べてみる。
裏でWhisperAPI動かしているだけっぽい有料サービスもあったりしたのみた。