Este script ayuda a la limpieza de código en archivos HTML generados a partir un documento PDF con programas como:
- Adobe Acrobat Pro
- Adobe InDesign
- ABBYY PDF Transformer
Dando como resultado un HTML con las etiquetas aceptadas por SciELO.
Descargar cygwin.exe, al terminar la descarga solo basta con ejecutar el archivo y este instalará los archivo necesarios en la unidad "C:" de nuestro sistema operativo (Windows)
Descargar y extraer el contenido del archivo CleanHTML.zip
Realizar una copia del repositorio git clone [email protected]:swarzesherz/CleanHTML.git
Mantenerlo actualizado git pull origin master
Windows
- Crear una carpeta llamada "body" (todo en minúsculas) dentro de la carpeta de instalación (CleanHTML)
- Crear una carpeta llamada "body" (todo en minúsculas) dentro de la carpeta de instalación (CleanHTML)
- Ejecutar el archivo "CleanHTML.cmd" que se encuentra en la carpeta de instalación
OSX
- Dar clic secundario en el archivo "CleanHTMLOSX.sh" y seleccionar obtener información
- En la opción "Abrir con:" seleccionamos de la lista "Otro..." y asignamos Aplicaciones -> Utilidades -> Terminal. (Si no permite seleccionarla hay que activar la opcion "Habilitar: Todas")
- Crear una carpeta llamada "body" (todo en minúsculas) dentro de la carpeta de instalación (CleanHTML)
- Crear una carpeta llamada "body" (todo en minúsculas) dentro de la carpeta de instalación (CleanHTML)
- Ejecutar el archivo "CleanHTMLOSX.sh" que se encuentra en la carpeta de instalación
NOTA: Los dos primeros puntos sólo se realizan una vez en caso de que el archivo no tenga como aplicación predeterminada una terminal