介绍

基于动态规划，对四库全书数据进行的文字定位。

配置

pip install numpy==1.17.3
pip install cv2==3.4.3.18

运行

python main.py

💾首次使用：LOAD = False
🚨随后若中途出现问题需要从新运行时，需先运行get_processed_books_name.py以避免重复处理。随后将LOAD置为True
🚨运行速度较慢，且对结果置信度的要求较高。

说明

模型对每张图片会按列切割和按单字切割。
📌列根据书名存到对应的文件夹中。每本书中切出的列都存在同一文件夹中。命名方式为：书名-对应的文字
📌单字根据书名存到对应的文件夹中。每本书中所有的字都存在同一文件夹中。命名方式为：书名-字-序号
📌具体切割的结果（用红线在原始图片中标出）会保留在 Res 文件夹中。

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
COL/愛日齋叢鈔卷一		COL/愛日齋叢鈔卷一
Res		Res
Test/愛日齋叢鈔卷一		Test/愛日齋叢鈔卷一
单字/愛日齋叢鈔卷一		单字/愛日齋叢鈔卷一
Cutter_Eraser.py		Cutter_Eraser.py
Img2CharactersImg.py		Img2CharactersImg.py
Information.py		Information.py
MakeData.py		MakeData.py
README.md		README.md
TextProcessor.py		TextProcessor.py
get_processed_books_name.py		get_processed_books_name.py
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

介绍

配置

运行

说明

About

Releases

Packages

Languages

WeiYi95/TAD_DP

Folders and files

Latest commit

History

Repository files navigation

介绍

配置

运行

说明

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages