Skip to content

Mentoria tomada en la Diplomatura en Ciencia de Datos, centrado principalmente en la Detección Automática de Plagio utilizando métodos de aprendizaje no supervisado y PLN

Notifications You must be signed in to change notification settings

lcarda/Diplo_Plagio

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Diplo_Plagio

Este repositorio contiene ejercicios resueltos de la Mentoria: Detección Automática de Plagio de la diplomatura en Ciencia de Datos de la Facultad de Matemática, Astronomia, Física y Computación de la Universidad Nacional de Córdoba.

Tematica de la mentoria:

A partir de la aplicación de técnicas de aprendizaje automático y procesamiento del lenguaje natural, el objetivo de la mentoria fue analizar textos con el fin de determinar si estos se podían clasificar como posibles casos de plagio. La detección automática de plagio estudia tres enfoques: detección de plagio intrínseco, detección de plagio explícito y detección de plagio translingüe. Este trabajo se centra en el primero de estos casos nombrados. Se parte de la hipótesis de que todo individuo es capaz de plasmar sus ideas mediante el lenguaje escrito de manera única, es decir, era poco probable que dos personas expresen sus ideas del mismo modo. En otras palabras, cada persona tiene una forma de escribir que la diferencia del resto, entonces, si un documento de texto presentaba alguna variación significativa en un fragmento, dicha sección podía ser considerada como un potencial caso de plagio.

Se trabajo con documentos de textos, de acceso libre, provistos por la competencia internacional de plagio. El corpus con el que se trabajo se denomina PAN-PC-2011. Para evaluar los algoritmos desarrollados se utilizo un script codificado por dicha competencia. A esta propuesta de Detección Automática de Plagio se le suman ciertas etapas que forman parte de la Ciencia y Minería de Datos.

Mentor: Pablo Ramos

Integrantes del proyecto: Lucas Cardacci

Agustina Maini

Agustín Osiecki

Emilse Ferreyra

About

Mentoria tomada en la Diplomatura en Ciencia de Datos, centrado principalmente en la Detección Automática de Plagio utilizando métodos de aprendizaje no supervisado y PLN

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published