Skip to content
gboye edited this page Jan 25, 2023 · 16 revisions

SWIM/PMF

Échantillonnage du lexique

  1. Lexique (ParadigmGeneration/MGC-LexiqueComplet-Verbes3-CoformesLexemes.ipynb)
  • Formes fléchies phonologiques (BDLex)
  • Fréquences de formes (Lexique3)
  • Fréquences ajustées par association entre Fréquence de lexème et Fréquence de cases => Verbes3.pkl
  1. Échantillonnage (SampleManagement/TirageEchantillon-Lexique3.ipynb)
  • Interpolation de fréquences
  • Tirages aléatoires de formes
    • tirage progressif
    • fréquences internes à l'échantillon
  1. Paradigmes

Génération automatique de paradigmes

Entrées

  1. PredSPE (ParadigmGeneration/MGC01-AnalyzeSample1-ContextFree.ipynb => XXX-Regles.pkl)
  1. Lexique
  • dictionnaire de formes

Sortie

  • Paradigme généré (dictionnaire de formes)
  • pour chaque lexème en entrée :
    • graphe orienté
      • lien entre entrée et sortie pondéré par le coefficient de distribution de la classeCF
    • graphe non-orienté
      • lien entre deux points si le graphe orienté a un lien dans chaque sens
      • poids moyen entre les deux liens orientés
    • extraction des cliques de formes
      • sélection des cliques fidèles au formes d'entrée
      • sélection des plus grandes cliques
      • sélection de la clique avec le score maximal parmi les plus grandes
    • écriture d'un dictionnaire de formes pour le lexème
  • écriture d'un CSV de l'ensemble des paradigmes remplis