(hackathon en traitement automatique des langues)
avec la conférence TALN/PFIA 2019
Restitution et conclusion : Amphi F à 16h15 (Université Toulouse 1 Capitole )
Tâches : analyses du grand débat / chatbots juridiques
Site web : http://hackatal.github.io/2019
Dates : 1 et 2 juillet 2019, salle J4 (RDC tout au bout)
Lieu : Université Toulouse 1 Capitole
Inscription : https://forms.gle/eNo8rogN2fWE3xedA (gratuite pr les étudiants / doctorants avant le 9 juin)
Fil twitter : https://twitter.com/hashtag/HackaTAL2019
Slack : cliquez ici !
Dans le cadre de la conférence TALN 2019 au sein de la plateforme PFIA, nous organisons la 4ème édition du hackathon en traitement automatique des langues, le HackaTAL 2019. L’objectif est de réunir les communautés scientifiques TAL, IA, et très largement au delà, autour de défis à relever pour questionner, interroger, modéliser, prototyper, coder, expérimenter, développer, tester, évaluer, échanger, etc. par équipes, dans une ambiance dynamique et sympathique :)
Les tâches proposées portent cette année sur deux thématiques (détails ci-dessous) :
- analyses des contributions au grand débat national
- conception de chatbots pour le domaine juridique
L’événement aura lieu cette année avec PFIA (https://www.irit.fr/pfia2019), à l’université Toulouse 1 Capitole, les 1 et 2 juillet 2019. Il est très largement ouvert à tous : juniors et séniors, informaticiens, linguistes, politologues, juristes, sociologues, etc. et ne nécessite aucune préparation particulière ni de compétences spécifiques... toute personne intéressée est bienvenue pour apporter sa contribution aux travaux collaboratifs (par équipes) que nous réaliserons sur ces deux jours !
1. Analyses du grand débat national
Le « grand débat national » instauré par le gouvernement début 2019 s’est matérialisée par la mise en place de dispositifs contributifs (sites, réunions, cahiers de doléances), par lesquels les citoyens peuvent donner leurs avis en réponse à des questions, et/ou selon des thématiques. L’ouverture des données produites a donné lieu à la constitution d’un corpus volumineux, sur lequel des analyses peuvent être conduites, en particulier par utilisation d’outils de traitement de la langue ou d’analyse du discours. Les tâches sont très ouvertes, nous proposons en particulier une orientation sur la génération et la nature argumentative des contributions.
Tâches
- Quantifier, analyser et visualiser les contributions au grand débat national
- Proposer des analyses sémantiques ou discursives des contributions
- Repérer et extraire des arguments structurés dans les contributions du grand débat
- Générer une synthèse à partir d’un ensemble de contributions
Ressources
- Jeu de données
- Autres sites contributifs (à compléter)
- Vrai Débat : https://le-vrai-debat.fr
- Entendre la France : https://www.entendrelafrance.fr
- API GraphQL: https://granddebat.fr/developer
- Analyses existantes
- Observatoire des débats (GIS Démocratie et Participation, ICPC, CEVIPOF) https://observdebats.hypotheses.org
- Cartographies : Cartolabe (INRIA, Paris-Saclay, CNRS) https://cartolabe-dev.lri.fr/map/debatt et Politoscope (CNRS) https://politoscope.org/le-politoscope
- Annotations collaboratives du grand débat : https://grandeannotation.fr et https://github.com/fm89/granddebat
- Projet Grande Lecture (bulles de filtre) : cartes de 100 contributions par circonscription http://www.grande-lecture.fr
- Witted http://gdn.witted.tech
- Democratie.app https://www.democratie.app
- Grand Débat et TAL (Vincent Claveau) http://people.irisa.fr/Vincent.Claveau/GrandDebat et (Damien Nouvel) http://damien.nouvels.net/fr/debats2019
- Gilets Jaunes (LERASS) https://www.lerass.com/wp-content/uploads/2019/02/GJ-V3.pdf
2. Chatbots juridiques
Depuis quelques années, la mise en place d’agents conversationnels (chatbots) par de nombreuses entreprises est une tendance de fond (et déjà sujet du HackaTAL en 2016, https://hackatal.github.io/2016). En parallèle, les outils numériques et technologiques sont toujours plus utilisés dans le domaine juridique (LegalTech).
Ces deux évolutions technologiques permettent aujourd’hui d’envisager le développement d’agents répondant à des questions sur des problématiques juridiques. Les tâches proposées visent le prototypage, voire la mise en place (démos) de telles infrastructures de dialogue à partir de ressources, soit pour des problématiques liées à la vie courante des citoyens (recherche d’informations juridiques) ou dans un contexte de besoin de droit des innovateurs numériques, comme les participants d'un hackathon.
En l'état, comme l'a démontré le premier baromètre sur l'accès au droit du Conseil National des Barreaux, l'émergence de la Legaltech n'a pas encore réellement permis de répondre de renforcer l'accès au droit et à la justice des français. Le dernier écrivain public vient de prendre sa retraite, il est temps d'utiliser la technologie et les TAL pour fournir un assistant juridique virtuel pour les droits quotidiens des français.
Tâches
- À partir d'un jeu de données de questions / réponses dans le domaine du droit du travail
- Construire un arbre décisionnel permettant de mieux cerner la problématique utilisateur
- Apporter automatiquement des ressources à un chatbot interagissant avec un utilisateur pour lui apporter une réponse ou le rediriger vers une source d'information utile à son cas d'usage
- Créer un chatbot interactif sur une thématique du droit déterminée à partir de cas d'usage personnalisés sur des besoins de la vie quotidienne (droit de la famille, logement, parents isolés, situation de handicap, etc.)
- Détermination du besoin en droit en langage naturel et juridiquement "clair"
- Apporter un premier niveau de réponse à partir de réponses programmées à l'avance
- Fournir des propositions de références (liens) vers des textes de loi pertinents
- Générer un modèle de courrier pour saisir l'administration avec les coordonnées du guichet administratif compétent
Ressources
- Pour le HackaTAL
- Fournies par Droits Quotidiens:
- 5000 questions posées en droit de la famille et travail à DQ : format XL
- 1000 Questions/réponses en droit de la famille et travail : export format Json - Listes des 150 legal techs présentes en France et leur champ d’activités
- Forum multiple de discussion
- Extrait juritravail
- http://helium.lab.parisdescartes.fr:2257/chatbotsjuridiques/
- Corpus juridique (JuriTravail Iris)
- La FAQ de service-public
- Les fiches pratiques ( plusieurs milliers et notamment thématique logement/famille)
- Le lexique des mots clés de la Justice
- Fournies par Droits Quotidiens:
- Autre
- Droits quotidiens : les fiches en langage juridique clair de https://www.droitsquotidiens.fr/fr et https://www.droitsquotidiens.be/fr
- Droit du numérique : http://www.adij.fr/code-activites-du-numerique-contributions
- Module de création d’assistant juridique (Seraphin.legal) https://www.legaltech.store/categoriesproduits/legal-bots
- Technologies du réseau Legal Tech Lawyer disponibles pendant le hackathon https://www.legaltech.store
- Données et contenus juridiques https://www.data.gouv.fr
Deux prix seront décernés, un pour chaque défi : YSEOP pour les analyses du grand débat et Droits Quotidiens pour les chatbots juridiques. Ce seront des paniers de spécialités toulousaines solides, offerts aux meilleures équipes selon un vote des participants et des organisateurs.
Lundi 1er juillet
- 13h-14h : accueil et café (PFIA)
- 14h-15h : introduction, présentation du hackathon
- 15h-17h : développements en équipes
- 17h-18h : Présentations
- Thomas François @UCLouvain
- Hugues de Mazancourt @YSEOP
- Camille Pradel @Synapse
- Didier Ketels @DroitsQuotidiens
- 18h-20h : cocktail (PFIA)
- 20h-00h : soirée dev chez Synapse (7 boulevard de la Gare, 31500 Toulouse)
Mardi 2 juillet
- 09h-12h : accueil, café (PFIA), développements en équipes
- 12h-14h : déjeuner et café (PFIA)
- 14h-16h : développements en équipes
- 16h-17h : présentation des résultats par équipe
- 17h-18h : vote, remise des prix, conclusion
BYOD (amenez votre ordinateur)
Pas de critères pour participer, le hackathon est ouvert à tous !
Aucune préparation requise des participants
Logiciels et données en ligne : https://github.com/HackaTAL/2019
Julien Aligon (IRIT)
Manon Cassier (AGORA)
Kevin Deturck (Viseo / ERTIM)
Nicolas Dugué (LIUM)
Maud Gilet (Seraphin.legal)
Loïc Grobol (Lattice)
Didier Ketels (Droits Quotidiens)
Hugues de Mazancourt (YSEOP)
Emilie Merdy (Synapse)
Damien Nouvel (ERTIM)
Camille Pradel (Synapse)
Thomas Saint-Aubin (Seraphin.legal)
Raphaël Troncy (EURECOM)
Guillaume Wisniewski (LIMSI)