Skip to content

Latest commit

 

History

History
49 lines (28 loc) · 1.7 KB

README.md

File metadata and controls

49 lines (28 loc) · 1.7 KB

julius4seg

Julius Japanese Dictation-kitをPythonから叩いている風にするためのスクリプト.

grammer-kitとsegmentation-kitを足して2で割ったような立ち位置.

Usage

Cloneして使う方

see: https://github.com/yamachu/julius4seg/blob/master/sample/README.md

Dockerで使う方

see: https://hub.docker.com/r/yamachu/julius4seg

$ docker pull yamachu/julius4seg:latest

segmentationしたい方

コマンド例

$ docker run --rm -v `pwd`/sample:/tmp yamachu/julius4seg sp-segment /tmp/sample_voice.wav /tmp/sample_kana.txt /tmp/seg.txt

第一引数に sp-segment を入れて、その後に続く引数はsamplerun_segment.py と同様

ファイル入力前提で作られているので、ローカルのディレクトリをマウントして、そのファイルを指定するようにして下さい。

silenceを除去したい方

コマンド例

$ docker run --rm -v `pwd`/sample:/tmp yamachu/julius4seg sp-remove /tmp/sample_voice.wav /tmp/seg.txt /tmp/out.wav

第一引数に sp-remove を入れて、その後に続く引数はsamplerun_remover.py と同様

注意事項

このスクリプトを実行するのに依存しているDictation-kitはgit lfsがインストールされていないと音響モデルも一緒にクローンできないため注意.

Juliusの標準的なサポートフォーマットである16kHz, 16bit, monoの音声を対象としている.

macOSX, Python3.6で動作を確認.