extractors-pdfminer

Clowder extractor for pdf files. This extractor uses the pdfminer.six library to extract textual information from pdf files.

Build extractor image

Run docker build . -t hub.ncsa.illinois.edu/clowder/extractor-pdfminer:<version> to build docker image
If you ran into error [Errno 28] No space left on device:, try below:
- Free more spaces by running docker system prune --all
- Increase the Disk image size. You can find the configuration in Docker Desktop

Login first: docker login hub.ncsa.illinois.edu
Run docker image push hub.ncsa.illinois.edu/clowder/extractor-pdfminer:<version>

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
extractor_info.json		extractor_info.json
pdfminer_extractor.py		pdfminer_extractor.py
requirements.txt		requirements.txt