-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Lehrerkürzel sind nicht immer Kürzel, werden aber so dargestellt #305
Comments
Vielleicht könnte man die Sätze analysieren und das 'Die' nicht markieren, wenn es ein Artikel ist. Beziehungsweise auch einfach am Satzanfang, wobei man sehen müsste, wie viele false positives das erzeugt. |
for (size_t i = 0; i < info.size(); i++){
if (info[i] == '.'){
if (info[i+1] == ' '){
// then don't highlight following 'Die' ...
}
}
} Halt in Python, aber ging jetzt so für mich schneller |
Aber es kann ja auch sowas wie |
Ja, hatte ich auch schon überlegt, aber das wäre ziemlich umständig. Ich glaube, dass das vielleicht selten genug vorkommt, dass man ein Auge zudrücken kann. Im Durchschnitt würde es halt wahrscheinlich trotzdem akkurater sein. |
Man bräuchte nicht mal ein großes AI Modell. Also kein LLM oder so. Vielleicht wäre es klein genug lokal laufen zu lassen, damit durch den API-Key, den man z.B. für Chat-GPT brauch, keine Kosten entstehen. Sowas gibt's bestimmt kostenlos. Als FOSS oder zumindest open weights (wie LLAMA nur für Satzanalyse).
|
In der Infobox wird das Wort 'Die' jedesmal als Lehrerkürzel verlinkt, da ein Lehrer halt dieses Kürzel hat.
The text was updated successfully, but these errors were encountered: