Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Redundante und aufwändige Datenstrukturen bei GeoDaten-Erhebungen #10

Open
JohannSfk opened this issue May 24, 2023 · 2 comments
Open
Labels
enhancement New feature or request help wanted Extra attention is needed

Comments

@JohannSfk
Copy link

JohannSfk commented May 24, 2023

Ich möchte folgenden Punkt zu bedenken geben:

In der Praxis zeigt sich jetzt schon, dass die Datenauswahl und -menge nicht bedarfsgerecht ist, also ´zu viel´ ist, und dass wir
dadurch einen viel zu großen und potenziell inkonsistenten Pflegeaufwand für GeoDaten erwarten dürfen:

Das Excel-Template für GeoDaten enthält Auswahlfelder.
Die jeweiligen Auswahloptionen sind zum einen nicht passend zu den Prozessen oder Bezeichnungen bei den Consultants;
Diese wirft Rückfragen auf und erzeigt inkonsistente Methadaten.

zum Anderen:
Es werden hier Daten abgefragt, die eigentlich im Datenmodell des PMT zu Hause sind!
So hängt z.B. der "Projektstatus" von der Logik her am Projekt und damit an der InPro-Nummer im PMT, ein Status bei den GeoDaten ist redundant und gefährlich, da Wildwuchs und falsche Daten entstehen!!!
Zudem muss der Status bei jeder der sechs (!) Status-Optionen immer wieder aktualisiert werden.
Ich frage mich, ob die Pflege der vorgegebenen Datenmenge mit den Pflegeschleifen durchhaltbar ist.

Besser wäre es, die Spalten nochmals auf Dopplungen zu untersuchen und auch die Auswahl-Optionen abzuschaffen oder stark einzuschränken. Schließlich können / müssen daten wie der Projektstatus aus dem PMT / GeoApp dazu gespielt werden!

@fretchen
Copy link
Collaborator

fretchen commented May 31, 2023

Two major questions:

  1. Any specific suggestions on things that could be simplified ?
  2. And what are notations that are unusual for the consultants ? Feel free to send them the link to the issue here such that they can give their suggestions directly. This is a completely open discussion here.

I also had a quick discussion with on of those LLMs to transform the excel file into a (json) data format. The resulting format was:

{
    "id": int,
    "name": str,
    "description": str,
    "geometry": {
        "type": str,
        "coordinates": [
            [float, float],
            [float, float],
            ...
        ]
    },
    "properties": {
        "key": str,
        "value": str
    }
}

I like this quite a bit as it is very flexible and does not make too many assumptions about the properties,. Each one might or might not be optional.

Again key feedback is @Maja4Dev and @Jo-Schie .

@fretchen fretchen added enhancement New feature or request help wanted Extra attention is needed labels Jun 1, 2023
@Maja4Dev
Copy link
Collaborator

Maja4Dev commented Jul 3, 2023

Ich möchte folgenden Punkt zu bedenken geben:

In der Praxis zeigt sich jetzt schon, dass die Datenauswahl und -menge nicht bedarfsgerecht ist, also ´zu viel´ ist, und dass wir dadurch einen viel zu großen und potenziell inkonsistenten Pflegeaufwand für GeoDaten erwarten dürfen:

Das Excel-Template für GeoDaten enthält Auswahlfelder. Die jeweiligen Auswahloptionen sind zum einen nicht passend zu den Prozessen oder Bezeichnungen bei den Consultants; Diese wirft Rückfragen auf und erzeigt inkonsistente Methadaten.

zum Anderen: Es werden hier Daten abgefragt, die eigentlich im Datenmodell des PMT zu Hause sind! So hängt z.B. der "Projektstatus" von der Logik her am Projekt und damit an der InPro-Nummer im PMT, ein Status bei den GeoDaten ist redundant und gefährlich, da Wildwuchs und falsche Daten entstehen!!! Zudem muss der Status bei jeder der sechs (!) Status-Optionen immer wieder aktualisiert werden. Ich frage mich, ob die Pflege der vorgegebenen Datenmenge mit den Pflegeschleifen durchhaltbar ist.

Besser wäre es, die Spalten nochmals auf Dopplungen zu untersuchen und auch die Auswahl-Optionen abzuschaffen oder stark einzuschränken. Schließlich können / müssen daten wie der Projektstatus aus dem PMT / GeoApp dazu gespielt werden!

Das derzeit zur Nutzung veröffentlichte Excel-Template enthält die Datenfelder, die für die KfW relevant sind, nicht unbedingt für den Consultant. Andernfalls hätten wir ja auch keine Chance, die Daten verschiedener Projekte miteinander zu vergleichen und zu aggregieren, was das Hauptziel des Geodatenmodells ist.

Die Eingabe von Daten, die im PMT bereits verfügbar sein sollten, ist nur solange erforderlich, solange die GeoApp (die ja eine Schnittstelle zum PMT haben soll), noch nicht gelauncht ist. Mit Launch der GeoApp müssen diese Daten nicht mehr gesammelt werden, sondern sie werden dann direkt aus dem PMT gezogen. Diese Daten werden nur temporär auf Nachfrage zahlreicher anderer Kolleg/innen gesammelt, die diese jetzt für ihre Arbeit benötigen. Es ergibt sich also kein Konsistenzproblem.

Wenn Consultants Fragen zu den Datenfeldern haben, verweist sie bitte auf die von uns veröffentlichten Guidelines. Weitere Fragen könnt Ihr gerne an uns weiterleiten, wir erweitern damit dann sukzessive die FAQ.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request help wanted Extra attention is needed
Projects
None yet
Development

No branches or pull requests

3 participants