ソフトウェア/whisper の履歴(No.1)
更新OpenAI の Whisper を使って授業動画に正しい字幕を付けたい†
Microsoft Stream の標準機能で動画に字幕を付けられるのだけれど、 精度が悪すぎて残念な感じになっている。
OpenAI の Whisper を使うとより正確な文字起こしができそうなので試してみます。
Docker を使うと簡単に動かせるようです†
https://dev.classmethod.jp/articles/openai_whisper_only_local_cpu/ を参考に、
LANG:sh $ mkdir whisper $ cd whisper $ cat <<EOF >Dockerfile FROM python:3.9-slim WORKDIR /workspace RUN apt update && apt install -y \ build-essential \ gcc \ git \ ffmpeg \ && rm -rf /var/lib/apt/lists/* RUN pip install --upgrade pip RUN pip install git+https://github.com/openai/whisper.git EOF $ docker build -t whisper . $ docker images REPOSITORY TAG IMAGE ID CREATED SIZE whisper latest 5f346a2f452e 40 minutes ago 3.52GB python 3.9-slim 690ca4c8a70d 6 hours ago 125MB $ alias whisper='docker run --rm -v $(pwd):/workspace/ whisper whisper' $ whisper --language ja --model medium audio.mp3 | tee script.txt
のようにして、簡単に動かすことができました。
ただ、GPU を使わないとかなり時間がかかるみたい。。。
Counter: 3519 (from 2010/06/03),
today: 2,
yesterday: 3