Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

書誌レポジトリの取り込み #3

Open
nanbuwks opened this issue Aug 13, 2016 · 1 comment
Open

書誌レポジトリの取り込み #3

nanbuwks opened this issue Aug 13, 2016 · 1 comment

Comments

@nanbuwks
Copy link
Collaborator

現在はローカルに「解析概論」のデータを保持していますが、これを別の書誌レポジトリを参照して動くようにしていきたい。

  • スキャンデータは重いのでテキストデータのみ持ってくる?
  • 書誌レポジトリ構造(システム構成図から)

書誌キー名 ex,) KaisekiGairon 書籍名とは必ずしも一緒ではない。UTF-8。
ページ番号 ・・スキャンファイルNoであり、元書誌にふられたページ番号とは異なる。遊び紙などにもNoが振られ、適宜削除するので連番保証は無い。 
ページ番号1 ページ番号を4桁ゼロパティング処理
書誌フォルダ名:(書誌キー名)
書誌データフォルダ名:(書誌キー名)

(書誌フォルダ名)
  +/(書誌データフォルダ名)
+/ocr
+/large_jpg
+/review

画像ファイル名: (章No)/(ページ番号1).jpg
OCRテキスト: (章No)/(ページ番号1).txt
Markdown原稿:( ページ番号1).md
pdf: (書誌キー名).pdf

@nanbuwks
Copy link
Collaborator Author

「底本の新規登録」でこの動作を行う?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant