maj fossil_reserves_OPEC #22

Lohofora · 2024-12-12T17:43:27Z

. Ajout du code de nettoyage de la base OPEC

les données OPEC ne sont pas disponibles en API, il faut aller chercher les données annuellement mises à jour ici : https://publications.opec.org/asb

. Ajout du Csv avec les nouvelles données pour Oil

vercel · 2024-12-12T17:43:32Z

The latest updates on your projects. Learn more about Vercel for Git ↗︎

Name	Status	Preview	Comments	Updated (UTC)
front	✅ Ready (Inspect)	Visit Preview	💬 Add feedback	Dec 26, 2024 11:39am

data-preparation/src/data_processing/FOSSIL_RESERVES_bp_fossil_with_zones_prod_2023.py

tvienne · 2024-12-14T14:52:11Z

Bravo et merci @Lohofora pour cette pull request ! Et tout particulièrement pour la compréhension des classes et la ré-utilisation des classes CountryTranslatorFrenchToEnglish &co. J'ai fait des retours sur la PR. On est très proches de pouvoir la passer congrats 👏

sebastienbourgeois

Nice job, ton code est facile à lire, bravo ! Je t'ai laissé quelques commentaires dans la PR

sebastienbourgeois · 2024-12-14T15:35:36Z

data-preparation/src/data_processing/FOSSIL_RESERVES_bp_fossil_with_zones_prod_2023.py

+# Charger données OPEC -> pas API disponible
+# site source Maj annuelle : https://publications.opec.org/asb
+
+class BpFossilProvenReservesCleaner:


Comme pour le nom du fichier, je remplacerais Bp par Opec dans le nom de la classe pour éviter toute confusion dans le futur

Oui tu as raison, j'avais pas capté que Bp faisait ref au nom de l'ancienne source, merci :)

sebastienbourgeois · 2024-12-14T15:50:03Z

data-preparation/src/data_processing/FOSSIL_RESERVES_bp_fossil_with_zones_prod_2023.py

+    def rename_column(self, df) :
+        return df.rename(columns={'Unnamed: 0': 'country'})
+
+    def drop_unnecessary_lines(self, df) :


Est-ce que tu pourrais ajouter une docstring pour cette fonction pour expliquer quelles lignes sont inutiles ? A première vue, on se débarrasse des continents et groupements de pays, mais avec df.loc[:"Total World", :] j'ai l'impression qu'on garde toutes les lignes jusqu'à "Total World". Du coup, si c'est bien le cas, pourquoi on ne garde pas les lignes qui suivent ?

Ce sont soit des lignes vides ou des notes de bas de page pas utiles à notre traitement, j'ajoute la précision dans la fonction

sebastienbourgeois · 2024-12-14T15:51:46Z

data-preparation/src/data_processing/FOSSIL_RESERVES_bp_fossil_with_zones_prod_2023.py

Maintenant que la source a changé, je renommerais le fichier pour éviter toute confusion dans le futur, du style FOSSIL_RESERVES_opec_fossil_with_zones_prod_2023. Je renommerais aussi le fichier csv dans server/data mais j'ai peur que ça impacte le front. Peut-être que pour le moment il vaudrait mieux ajouter un commentaire dans ce fichier pour préciser qu'il permet de générer FOSSIL_RESERVES_bp_fossil_with_zones_prod.csv.

J'ai commenté le fichier py mais pas modifié le nom du csv pour éviter les bugs avec le front, merci :)

…ce Opec

sebastienbourgeois

J'ai ajouté quelques commentaires de plus sur drop_unnecessary_lines, pour le reste ça me paraît bon :)

sebastienbourgeois · 2024-12-18T16:01:44Z

data-preparation/src/data_processing/FOSSIL_RESERVES_opec_fossil_with_zones_prod_2023.py

+    def rename_column(self, df) :
+        return df.rename(columns={'Unnamed: 0': 'country'})
+
+    def drop_unnecessary_lines(self, df) :


J'ajouterais aussi un commentaire pour dire où se trouve ces lignes vides et les notes de bas de page. Et dans la docstring, j'expliquerais aussi pourquoi on exclut certains continents et certains groupements de pays, car sur le site on peut filtrer sur ce type de zones géographiques. Ça nous évitera aussi de nous reposer la question dans quelques mois :)

Ça donnerait quelque chose comme ça :

Suggested change

def drop_unnecessary_lines(self, df) :

def drop_unnecessary_lines(self, df) :

"""

Drop continents, country groups and footnotes that are not necessary for data processing

We exclude certain continents and country groups because ...

"""

df.set_index('country', inplace=True)

# After "Total World", we have empty lines or footnotes

df = df.loc[:"Total World", :]

C'est plus clair tu as raison merci

sebastienbourgeois · 2024-12-18T16:03:19Z

data-preparation/src/data_processing/FOSSIL_RESERVES_opec_fossil_with_zones_prod_2023.py

+        """
+        df.set_index('country', inplace=True)
+        df = df.loc[:"Total World", :]
+        df.drop(['Africa ', 'Latin America', 'Other Asia', 'Other Eurasia', 'Middle East ', 'OECD Europe', 'OECD Asia Pacific', 'OECD Americas', 'Others', 'Other Europe', 'Total World'], axis = 0, inplace = True)


Je viens de m'en rendre compte mais il y a des espaces dans 'Africa ' et 'Middle East ', est-ce que c'est ce qu'il y a dans les données ?

Tu as raison c'est une erreur

maj fossil_reserves_OPEC

080900f

vercel bot deployed to Preview December 12, 2024 17:45 View deployment

tvienne reviewed Dec 14, 2024

View reviewed changes

data-preparation/src/data_processing/FOSSIL_RESERVES_bp_fossil_with_zones_prod_2023.py Outdated Show resolved Hide resolved

sebastienbourgeois reviewed Dec 14, 2024

View reviewed changes

ajout nom pays dans dico général + modif. nom doc. pour préciser sour…

36f716b

…ce Opec

vercel bot deployed to Preview December 16, 2024 09:22 View deployment

sebastienbourgeois reviewed Dec 18, 2024

View reviewed changes

suppression espaces nom zone

8f882f3

vercel bot deployed to Preview December 26, 2024 11:39 View deployment

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

maj fossil_reserves_OPEC #22

maj fossil_reserves_OPEC #22

Lohofora commented Dec 12, 2024

vercel bot commented Dec 12, 2024 •

edited

Loading

tvienne commented Dec 14, 2024

sebastienbourgeois left a comment

sebastienbourgeois Dec 14, 2024

Lohofora Dec 16, 2024

sebastienbourgeois Dec 14, 2024

Lohofora Dec 16, 2024

sebastienbourgeois Dec 14, 2024

Lohofora Dec 16, 2024

sebastienbourgeois left a comment •

edited

Loading

sebastienbourgeois Dec 18, 2024

Lohofora Dec 26, 2024

sebastienbourgeois Dec 18, 2024

Lohofora Dec 26, 2024

maj fossil_reserves_OPEC #22

Are you sure you want to change the base?

maj fossil_reserves_OPEC #22

Conversation

Lohofora commented Dec 12, 2024

vercel bot commented Dec 12, 2024 • edited Loading

tvienne commented Dec 14, 2024

sebastienbourgeois left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

sebastienbourgeois left a comment • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

vercel bot commented Dec 12, 2024 •

edited

Loading

sebastienbourgeois left a comment •

edited

Loading