Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Vynechání importu parcel #11

Open
washeck opened this issue Feb 4, 2013 · 3 comments
Open

Vynechání importu parcel #11

washeck opened this issue Feb 4, 2013 · 3 comments

Comments

@washeck
Copy link
Contributor

washeck commented Feb 4, 2013

Snažím se vytvořit db s adresními body a výše (tj. ulice, části obcí, atd.) za celou ČR, ale narážím na velikost výsledné db i dlouhý čas importu. Přitom většina importovaných dat je zbytečná (parcely a jejich bonitní díly, způsob ochrany pozemku). Zkusil jsem v DataConvertor nahradit
convertorParcely.convert(reader);
za
XMLUtils.skipCurrentElement(reader);
a import se výrazně zrychlil (vždy nad prázdnou db):

BEZ PARCEL

Processing file data\20121231_OB_505528_UKSH.xml.gz
File processed in 687 ms
Processing file data\20121231_OB_530395_UKSH.xml.gz
File processed in 438 ms
Processing file data\20121231_OB_530417_UKSH.xml.gz
File processed in 656 ms
Total duration: 2203 ms

S PARCELAMI

Processing file data\20121231_OB_505528_UKSH.xml.gz
File processed in 2922 ms
Processing file data\20121231_OB_530395_UKSH.xml.gz
File processed in 1797 ms
Processing file data\20121231_OB_530417_UKSH.xml.gz
File processed in 2171 ms
Total duration: 7343 ms

Šlo by přidat přepínač, který by zařídil vynechání parcel?

P.S.: Nejraději bych vyhodil i stavební objekty, čímž by se db zmenšila zásadním způsobem, ale bez stavebního objektu nelze rozlišit číslo popisné od čísla evidenčního, což je pro adresy zásadní.

@fordfrog
Copy link
Owner

fordfrog commented Feb 4, 2013

možná by se mohl přidat přepínač --skip-object nebo s nějakým podobným názvem, kde by byly čárkou oddělené objekty, které se mají přeskočit (tj. na základě podmínky místo parsování volat XMLUtils.skipCurrentElement(reader)), např --skip-objects parcela,stavobj. pak by bylo na každém, jaké objekty si naimportuje.

@washeck
Copy link
Contributor Author

washeck commented Feb 7, 2013

Jo, to zní dobře. Byl bys ochotný to udělat? Přeci jenom v Javě běžně nědělám, takže mi to trvá déle, a ten hack je zatím pro moje účely stačí :)

@xificurk
Copy link
Contributor

Jo, za to bych se taky přimlouval... taky používám jen malou část dat z celkového objemu.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants