idx language code "zh" gets expanded to "zho", not recognized by tesseract #78

Seegras · 2020-05-27T13:11:31Z

I actually opened an issue there too: tesseract-ocr/tesseract#2995

$ grep id: subs-chi.idx
id: zh, index: 0
$ vobsub2srt subs-chi
Error opening data file /usr/share/tesseract-ocr/4.00/tessdata/zho.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'zho'
Tesseract couldn't load any languages!
Failed to initialize tesseract (OCR).

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

idx language code "zh" gets expanded to "zho", not recognized by tesseract #78

idx language code "zh" gets expanded to "zho", not recognized by tesseract #78

Seegras commented May 27, 2020

idx language code "zh" gets expanded to "zho", not recognized by tesseract #78

idx language code "zh" gets expanded to "zho", not recognized by tesseract #78

Comments

Seegras commented May 27, 2020