Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Opschonen foutieve lemmas in mblem.lex traingsdata #67

Open
kosloot opened this issue Feb 28, 2019 · 0 comments
Open

Opschonen foutieve lemmas in mblem.lex traingsdata #67

kosloot opened this issue Feb 28, 2019 · 0 comments
Assignees

Comments

@kosloot
Copy link
Collaborator

kosloot commented Feb 28, 2019

In mblem.lex staan erg veel verdachte lemma's
Bijvoorbeeld wezen voor het WW zijn:

1 wezen wees N(soort,mv,basis)
2 wezen wezen N(soort,ev,basis,onz,stan)
3 wezen wezen WW(inf,nom,zonder,zonder-n)
4 wezen wezen WW(inf,prenom,zonder)
5 wezen wezen WW(inf,vrij,zonder)
6 wezen wezen WW(pv,tgw,mv)
7 wezen wijzen WW(pv,verl,mv)
8 wezen zijn WW(inf,nom,zonder,zonder-n)
9 wezen zijn WW(inf,vrij,zonder)

3,4,5 en 6 lijken me allemaal fout.
De lemma's zijn volgens mij 'wees' voor N (1 en 2) of 'zijn' (8 en 9) of 'wijzen' (7)

Ook voor allerlei andere vormen van 'wezen' gaat dit mis, lijkt me:

wezend	wezen	WW(od,prenom,zonder)
wezend	wezen	WW(od,vrij,zonder)
wezende	wezen	WW(od,nom,met-e,zonder-n)
wezende	wezen	WW(od,prenom,met-e)

Pijnlijk is dat hier de vormen met 'zijn' geheel niet voorkomen.

Ik denk dat we de data moeten opschonen. relatief simpel in dit geval.
Maar ook aanvullen, wat meer tricky is.

suggesties welkom

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

4 participants