Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[INGO] Nur sinnstiftenden Text extrahieren #2832

Open
SteRoe opened this issue Feb 8, 2025 · 1 comment
Open

[INGO] Nur sinnstiftenden Text extrahieren #2832

SteRoe opened this issue Feb 8, 2025 · 1 comment
Labels
enhancement New feature or request ingo
Milestone

Comments

@SteRoe
Copy link

SteRoe commented Feb 8, 2025

Welches Problem soll durch die Erweiterung / Verbesserung gelöst werden?
Wenn ich Ingo über das Kontextmenü ein PDF zusammenfassen lasse, werden alle Kopf-/Fußzeilen, Seitennummern etc. mit zu Ingo transferiert. Das verwirrt Ingo ziemlich sicher, weil der sinnstiftende Text mittendrin unterbrochen wird. Es sollte nur der Fließtext des Dokuments extrahiert werden.

Beschreibe die gewünschte Lösung
Wie das zu lösen ist, dafür habe ich leider keine Idee, weil es m.E. kein geeignetes Merkmal gibt, Kopf-/Fußzeile, Seitennummer im PDF sauber zu identifizieren.

@SteRoe SteRoe added the enhancement New feature or request label Feb 8, 2025
@j-dimension j-dimension added this to the backlog milestone Feb 9, 2025
@j-dimension
Copy link
Member

Das verwirrt Ingo ziemlich sicher, weil der sinnstiftende Text mittendrin unterbrochen wird.

Ist das denn tatsächlich der Fall? Ich habe den Eindruck dass das ganz gut (nicht) interpretiert wird. Gibt es ein Beispieldokument, wo man das nachvollziehen kann?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request ingo
Projects
None yet
Development

No branches or pull requests

2 participants