Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Lehrerkürzel sind nicht immer Kürzel, werden aber so dargestellt #305

Open
lorax42 opened this issue Aug 4, 2024 · 5 comments
Open

Lehrerkürzel sind nicht immer Kürzel, werden aber so dargestellt #305

lorax42 opened this issue Aug 4, 2024 · 5 comments
Labels
bug Something isn't working plan loader

Comments

@lorax42
Copy link

lorax42 commented Aug 4, 2024

In der Infobox wird das Wort 'Die' jedesmal als Lehrerkürzel verlinkt, da ein Lehrer halt dieses Kürzel hat.
Screenshot from 2024-08-04 15-58-46

@Belissimo-T Belissimo-T added bug Something isn't working plan loader labels Aug 4, 2024
@lorax42
Copy link
Author

lorax42 commented Aug 4, 2024

Vielleicht könnte man die Sätze analysieren und das 'Die' nicht markieren, wenn es ein Artikel ist. Beziehungsweise auch einfach am Satzanfang, wobei man sehen müsste, wie viele false positives das erzeugt.

@lorax42
Copy link
Author

lorax42 commented Aug 4, 2024

for (size_t i = 0; i < info.size(); i++){
    if (info[i] == '.'){
        if (info[i+1] == ' '){
            // then don't highlight following 'Die' ...
        }
    }
}

Halt in Python, aber ging jetzt so für mich schneller

@ArtrenH
Copy link
Collaborator

ArtrenH commented Aug 4, 2024

Aber es kann ja auch sowas wie
"Heute irgendein Event. Die ist verantwortlich" in der Info stehen und das meint dann halt das Kürzel und das irgendwas mit dem Lehrer los ist.
Also eigentlich müsste man da jedes Mal ein AI Language Model fragen, ob das ein Kürzel oder ein Wort ist.

@lorax42
Copy link
Author

lorax42 commented Aug 5, 2024

Ja, hatte ich auch schon überlegt, aber das wäre ziemlich umständig. Ich glaube, dass das vielleicht selten genug vorkommt, dass man ein Auge zudrücken kann. Im Durchschnitt würde es halt wahrscheinlich trotzdem akkurater sein.

@lorax42
Copy link
Author

lorax42 commented Aug 5, 2024

Man bräuchte nicht mal ein großes AI Modell. Also kein LLM oder so. Vielleicht wäre es klein genug lokal laufen zu lassen, damit durch den API-Key, den man z.B. für Chat-GPT brauch, keine Kosten entstehen. Sowas gibt's bestimmt kostenlos. Als FOSS oder zumindest open weights (wie LLAMA nur für Satzanalyse).

"Open source" typically refers to software with a specific licensing model, while "open weights" refers to releasing the weights and network architecture of AI models for public use without necessarily providing the full source code.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working plan loader
Projects
None yet
Development

No branches or pull requests

3 participants