Skip to content

Commit

Permalink
chores: update stop words / remove 'normes'
Browse files Browse the repository at this point in the history
  • Loading branch information
polomarcus committed Jul 2, 2024
1 parent 5aa0d80 commit f99bb74
Show file tree
Hide file tree
Showing 2 changed files with 15 additions and 21 deletions.
8 changes: 0 additions & 8 deletions quotaclimat/data_processing/mediatree/keyword/keyword.py
Original file line number Diff line number Diff line change
Expand Up @@ -2904,10 +2904,6 @@
"keyword": "norme",
"category": "General"
},
{
"keyword": "norme",
"category": "General"
},
{
"keyword": "nucléaire",
"category": "Energie"
Expand Down Expand Up @@ -3564,10 +3560,6 @@
"keyword": "mesure environnementale",
"category": "General"
},
{
"keyword": "norme",
"category": "General"
},
{
"keyword": "nous adapter à un futur incertain",
"category": "General"
Expand Down
28 changes: 15 additions & 13 deletions quotaclimat/data_processing/mediatree/keyword/stop_words.py
Original file line number Diff line number Diff line change
@@ -1,20 +1,22 @@
# Based on advertising
STOP_WORDS = [
"bonus écologique",
"groupe verlaine isolation thermique",
"haute isolation thermique fabriqué en france",
"ou covoiturage tous les moyens sont bon",
"blablacar et recevez cent euros de prime covoiturage",
"conditions sébastien point fr covoiturage",
"sur dacia point fr covoiturage",
"dacia point fr un covoiturage",
"engie peut vous aider par exemple avec des panneaux solaires",
"panneaux solaires pour produire votre énergie",
"panneaux solaires groupe",
"avec le leader du photovoltaïque",
"en train d"
"bonus écologique"
,"groupe verlaine isolation thermique"
,"haute isolation thermique fabriqué en france"
,"ou covoiturage tous les moyens sont bon"
,"blablacar et recevez cent euros de prime covoiturage"
,"conditions sébastien point fr covoiturage"
,"sur dacia point fr covoiturage"
,"dacia point fr un covoiturage"
,"engie peut vous aider par exemple avec des panneaux solaires"
,"panneaux solaires pour produire votre énergie"
,"panneaux solaires groupe"
,"verlaine installateur de panneaux photovoltaïques"
,"avec le leader du photovoltaïque"
,"en train d"
,"huile de coude est aussi une énergie renouvelable"
,"huile de coude était aussi une énergie renouvelable"
,'huile de coude étaient aussi une énergie renouvelable'
,"climatique c' est pour ça que je suis au crédit coopératif"
,"le mouvement de la rénovation énergétique"
,"installateur de pompe à chaleur air"
Expand Down

1 comment on commit f99bb74

@github-actions
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Coverage

Coverage Report
FileStmtsMissCoverMissing
postgres
   insert_data.py44784%36–38, 57–59, 64
   insert_existing_data_example.py19384%25–27
postgres/schemas
   models.py1461093%120–127, 139–140, 198–199, 213–214
quotaclimat/data_ingestion
   scrap_sitemap.py1341787%27–28, 33–34, 66–71, 95–97, 138–140, 202, 223–228
quotaclimat/data_ingestion/ingest_db
   ingest_sitemap_in_db.py553733%21–42, 45–58, 62–73
quotaclimat/data_ingestion/scrap_html
   scrap_description_article.py36392%19–20, 32
quotaclimat/data_processing/mediatree
   api_import.py20412738%43–47, 52–67, 71–74, 80, 83–122, 128–143, 147–148, 161–173, 177–183, 196–207, 210–214, 220, 255–256, 260, 264–298, 301–303
   channel_program.py1365162%30–32, 43–45, 59, 95, 104, 142–183
   config.py15287%7, 16
   detect_keywords.py213896%169–172, 216, 271–273
   update_pg_keywords.py523729%14–97, 120–121, 144–170, 176
   utils.py642266%26–50, 53, 62, 78–79
quotaclimat/utils
   healthcheck_config.py291452%22–24, 27–38
   logger.py241154%22–24, 28–37
   sentry.py10280%21–22
TOTAL120735171% 

Tests Skipped Failures Errors Time
81 0 💤 0 ❌ 0 🔥 1m 33s ⏱️

Please sign in to comment.