Minutes Makerは、会議や講義の書き起こしと要約を自動生成するウェブアプリです。
主な機能:
- faster-whisperを使用して、ほぼ全ての音声/動画ファイルを書き起こすことができます。
- OpenAIの言語モデルを使用して要約を作成します。
- Webインターフェースで操作可能です。
- 英語と日本語に対応しています。
- GPUに対応しているほか、CPUのみのコンピューターでも動作します。
以下の環境変数を設定する必要があります。
-
OPENAI_API_KEY
は要約作成のために必要となるAPIキーで、こちらで発行できます。 -
REACT_APP_PUBLIC_IP
は、アプリケーションを実行するマシンの公開IPアドレスです。- アプリをローカルマシンでデプロイする場合は、
'0.0.0.0'
になります。 - アプリをリモートサーバーでデプロイする場合は、サーバーの公開IPアドレスになります。
- アプリをローカルマシンでデプロイする場合は、
以下のコマンドを実行することで、環境変数を.env
ファイルに設定できます:
cd minutes-maker
echo "OPENAI_API_KEY='sk-XXX'" >> .env
echo "REACT_APP_PUBLIC_IP='XXX.XXX.XXX.XXX'" >> .env
マシンがNVIDIA GPUを持っているかどうかは自動的に検出され、適切なDockerイメージがビルドされます。
make build
make up
ブラウザでhttp://<PUBLIC_IP or 0.0.0.0>:10356
を開きます。
フォームの簡単な説明は以下の通りです:
-
音声/ビデオファイルのアップロード
書き起こしと要約を行いたい音声/動画ファイルを選択します。ほぼ全ての音声/動画ファイルが使用でき、ファイルサイズに制限はありません。
-
target language
の選択_どの言語で要約したいか_の言語を選択します。 現在、英語と日本語がサポートされています。
-
category
の選択音声/動画ファイルの内容のカテゴリー、
meeting
またはlecture
を選択します。このパラメータを適切に設定すると、要約の品質が向上します。 -
meeting
/lecture
内容の入力meeting
やlecture
の内容、例えばテーマ(例:"新製品の開発")を入力します。 内容を適切に設定すると、書き起こしの品質が向上します。
- コンピューター
- Docker
このリポジトリはCC BY-NC-SA 4.0ライセンスの下でライセンスされています。詳細はLICENSEをご覧ください。