Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Coquilles tuto Elastic #446

Open
jpramil opened this issue Nov 2, 2023 · 2 comments
Open

Coquilles tuto Elastic #446

jpramil opened this issue Nov 2, 2023 · 2 comments

Comments

@jpramil
Copy link
Contributor

jpramil commented Nov 2, 2023

Probables pb de copié-collé :

"Un index est une collection de documents dans lesquels on souhaite chercher, préalablement ingérés dans un moteur de recherche les documents sont les établissements. L’indexation consiste à pré-réaliser les traitements des termes des documents pour gagner en efficacité lors de la phase de recherche. L’indexation est faite une fois pour de nombreuses recherches potentielles, pour lesquelles la rapidité de réponse peut être cruciale. Après avoir indexé une base, on effectuera des requêtes qui sont des recherches d’un document dans la base indexé (équivalent de notre web) à partir de termes de recherche normalisés."

@jpramil
Copy link
Contributor Author

jpramil commented Nov 2, 2023

Non affichage des df lors des premiers preprocess :
"
A l’issue de la question 1, le jeu de données ciqual devrait ressembler à celui-ci:
Après avoir mis en majuscule, on se retrouve avec le jeu de données suivant:
Après retrait des stop-words, nos libellés prennent la forme suivante :
La regex pour éliminer les caractères de ponctuation permet ainsi d’obtenir:
Enfin, à l’issue de la question 5, le DataFrame obtenu est le suivant:
Ces étapes de nettoyage ont ainsi permis de concentrer l’information dans les noms de produits sur ce qui l’identifie vraiment.
"

@jpramil
Copy link
Contributor Author

jpramil commented Nov 2, 2023

Fichier schema.json disparu (pour le mapping)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant