Skip to content

Latest commit

 

History

History
34 lines (18 loc) · 11.5 KB

README.md

File metadata and controls

34 lines (18 loc) · 11.5 KB

LWC_TEI2024

LEAF-Writer Commons Workshop at TEI2024 Conference

07/Oct/2024: 2:00pm - 5:00pm

This half-day in-person workshop introduces textual scholars and practitioners to the LEAF Commons suite of tools, a set of web-based, easy-to-use tools that support text encoding, named entity recognition, web annotation, text analysis and publication without users having to learn complex encoding languages, and supports the easy movement from one interoperable tool to the other depending on users' needs. These freely available tools support digital scholarly workflows for the collaborative production and publication of scholarly and documentary texts, editions, and collections on the web, without the need for software installation, while promoting best practices for text encoding, annotation, and metadata standards. The LEAF Commons suite enables the use of individual tools for specific purposes, as well as supporting an end-to-end workflow beginning with outputs of optical character or handwritten text recognition systems, transcriptions, or born-digital texts and ends with publication on the web, allowing it to serve a wide range of research and pedagogical uses.

LEAF stands for the Linked Editing Academic Framework, a collaborative software suite that provides both a comprehensive virtual research environment but also a set of 'Commons' modular tools for text editing and publication. The LEAF Commons tools constitute an accessible, low-barrier, no-cost infrastructure for the production of online texts, editions, or collections, whether for teaching or for undertaking research and collaboration on a sustainable basis. The Commons makes LEAF tools freely available in the browser, enabling collaboration and publication through Github, in addition to local storage. Promoting the reuse of data in keeping with the FAIR (Findable, Accessible, Interoperable, and Reusable) data principles, LEAF uses open-source software, open-access platforms, and open international standards for best practices in text-encoding (TEI-XML ) and web annotation (RDF). LEAF Commons offers communities of researchers, teachers, and students the opportunity to take part in digital knowledge production and open collaboration. The workshop will end with an open discussion about pursuing such forms of open knowledge production and collaboration.

The LEAF Commons tools introduced will include:

LEAF-Writer: an open-source, open-access Extensible Markup Language (XML) editor that runs in a web browser and offers scholars and their students a rich textual editing experience without the need to download, install, and configure proprietary software, pay ongoing subscription fees, or learn complex coding languages. This user-friendly editing environment incorporates Text Encoding Initiatives (TEI) and Resource Description Framework (RDF) standards, meaning that texts edited in LEAF-Writer are interoperable with other texts produced by the scholarly editing community and with other materials produced for the Semantic Web . It also incorporates Named Entity Recognition and reconciliation with, or linking to, linked open data identifiers through the incorporation of the NERVE tool. LEAF-Writer is particularly valuable for pedagogical purposes, allowing instructors to teach students best practices for encoding texts without also having to teach students how to code. LEAF-Writer is designed to help bridge the gap by providing access to all who want to engage in new and important forms of textual production, analysis, and discovery.

DToC: (the Dynamic Table of Contexts) provides an online interactive reading and publication environment for digital scholarly texts where the two conventional overviews provided in print editions - the table of contents and the index - have been dynamically merged to provide an interactive online e- reading experience that leverages the power of XML markup. Users can build a DToC edition from one or more TEI-XML files, then curate and label the underlying elements and attributes in order to understand where named entities, topics, and concepts can be traced within the edition. Editions can be stored using URLs and shared with readers as published or teaching texts.

LEAF-TE: (The LEAF Turning Engine) is a web interface that enables users to easily and automatically transform documents between formats. It converts HTR/OCR output (from various sources including Trankribus) to TEI-XML for importing into LEAF-Writer or other editors.) It converts TEI-XML to HTML, Markdown, and plain text for exporting to web publishing and text analysis environments , including the Dynamic Table of Contexts.

NERVE: (the Named Entity Relationship and Vetting Environment) is an application that performs Named Entity Recognition (NER) on machine-readable texts, allowing users to identify candidate entities in a document, review, and correct the results. NERVE suggests relevant Uniform Resource Identifiers (URIs) for entities, so users can reconcile data to an authority such as Wikidata or the Virtual International Authority File to provide the basis for Linked Open Data (LOD) Web Annotations. Users can export their reconciled data in TEI-XML or HTML formats to an online repository or to their desktop. NERVE will be able to be used from within LEAF-Writer, or as a stand-alone tool and will be demonstrated during the workshop.


Este taller presencial de medio día introduce a académicos y profesionales de la edición textual al conjunto de aplicaciones LEAF Commons, una serie de herramientas en línea, fáciles de usar, que ayudan a la codificación de texto, el reconocimiento de entidades nombradas, la anotación web, el análisis de texto y la publicación sin que los usuarios tengan que aprender lenguajes de codificación complejos, y facilitan el pasaje de una herramienta interoperable a otra según las necesidades de los usuarios. Estas herramientas de libre acceso brindan apoyo para la producción y publicación colaborativas de textos académicos y documentales, ediciones y colecciones en la web, sin la necesidad de instalación de software, al tiempo que promueven las mejores prácticas para la codificación de texto, la anotación y los estándares de metadatos. El conjunto de aplicaciones LEAF Commons permite el uso de herramientas individuales para propósitos específicos, y permite crear un flujo de trabajo completo, que comienza con resultados de sistemas de reconocimiento de texto óptico o manuscrito, transcripciones o textos digitales y termina con la publicación en la web, lo que permite atender una amplia gama de usos de investigación y pedagógicos.

LEAF significa Linked Editing Academic Framework, un conjunto de software colaborativo que proporciona tanto un entorno de investigación virtual integral como un conjunto de herramientas modulares 'Commons' para la edición y publicación de textos. Las herramientas LEAF Commons constituyen una infraestructura accesible, de fácil uso y sin costo, para la producción de textos en línea, ediciones o colecciones, ya sea para la enseñanza o para la investigación y colaboración en forma sostenible. Las herramientas LEAF están a disposición de forma gratuita en el navegador a través de Commons, lo que permite la colaboración y publicación a través de Github, además del almacenamiento local. Promoviendo la reutilización de datos de acuerdo con los principios de datos FAIR (Encontrables, Accesibles, Interoperables y Reutilizables), LEAF utiliza software de código abierto, plataformas de acceso abierto y estándares internacionales abiertos para las mejores prácticas en codificación de texto (TEI-XML) y anotación web (RDF). LEAF Commons ofrece a comunidades de investigadores, profesores y estudiantes la oportunidad de participar en la producción de conocimiento digital y la colaboración abierta. El taller concluirá con una discusión sobre la búsqueda de tales formas de producción de conocimiento y colaboración abierta.

Las herramientas LEAF Commons presentadas incluirán:

LEAF-Writer: un editor de XML de código abierto y de acceso abierto que se ejecuta en un navegador web y ofrece a académicos y estudiantes una experiencia de edición textual rica sin la necesidad de descargar, instalar y configurar software propietario, pagar tarifas de suscripción continuas o aprender lenguajes de codificación complejos. Este entorno de edición fácil de usar incorpora iniciativas de codificación de texto (TEI) y estándares de Marco de Descripción de Recursos (RDF), lo que significa que los textos editados en LEAF-Writer son interoperables con otros textos producidos por la comunidad de edición académica y con otros materiales producidos para la Web Semántica. También incorpora el Reconocimiento de Entidades Nombradas y la relación con, o el enlace a, identificadores de datos abiertos vinculados a través de la incorporación de la herramienta NERVE. LEAF-Writer es particularmente valioso para fines pedagógicos, ya que permite a los instructores enseñar a los estudiantes las mejores prácticas para la codificación de textos sin tener que enseñar también a los estudiantes a codificar. LEAF-Writer está diseñado para ayudar a cerrar la brecha proporcionando acceso a todos los que deseen participar en formas nuevas e importantes de producción, análisis y descubrimiento de textos.

DToC: (Tabla de Contenidos Dinámica) proporciona un entorno de lectura y publicación interactivo en línea para textos académicos digitales donde los dos resúmenes convencionales proporcionados en ediciones impresas: la tabla de contenidos y el índice, se han fusionado dinámicamente para proporcionar una experiencia de lectura en línea interactiva que aprovecha el poder del marcado XML. Los usuarios pueden construir una edición DToC a partir de uno o más archivos TEI-XML, luego curar y etiquetar los elementos y atributos subyacentes para comprender dónde se pueden rastrear las entidades nombradas, los temas y los conceptos dentro de la edición. Las ediciones se pueden almacenar utilizando URL y compartir con los lectores como textos publicados o de enseñanza.

LEAF-TE: (El Motor de Conversión LEAF) es una interfaz web que permite a los usuarios transformar fácil y automáticamente documentos entre formatos. Convierte la salida HTR/OCR (de varias fuentes, incluido Trankribus) a TEI-XML para importarla a LEAF-Writer u otros editores. Convierte TEI-XML a HTML, Markdown y texto sin formato para exportar a entornos de publicación web y análisis de texto, incluida la Tabla de Contenidos Dinámica.

NERVE: (Entorno de Relaciones y Validación de Entidades Nombradas) es una aplicación que realiza el Reconocimiento de Entidades Nombradas (NER) en textos digitales, lo que permite a los usuarios identificar posibles entidades en un documento, revisar y corregir los resultados. NERVE sugiere Identificadores Uniformes de Recursos (URI) relevantes para las entidades, por lo que los usuarios pueden vincular datos con una autoridad como Wikidata o el Archivo de Autoridad Internacional Virtual para proporcionar la base para las Anotaciones Web de Datos Abiertos Enlazados. Los usuarios pueden exportar sus datos conciliados en formatos TEI-XML o HTML a un repositorio en línea o a su escritorio. NERVE se puede utilizar desde dentro de LEAF-Writer o como una herramienta independiente.