Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

(data) scraping #119

Open
stelf opened this issue Feb 26, 2025 · 6 comments
Open

(data) scraping #119

stelf opened this issue Feb 26, 2025 · 6 comments

Comments

@stelf
Copy link
Owner

stelf commented Feb 26, 2025

to scrape
drag or pull a hard or sharp implement across (a surface or object) so as to remove dirt or other matter.

scraping
the action or sound of something scraping or being scraped.

a scraping
a small amount of something that has been obtained by scraping it from a surface.
plural noun: scrapings

това според гугъл... от тая работа излиза, че превеждаме като "изчегъртване" / надраскване или може би има съкратен жаргон - чегъртене, определено некнижовна дума.

можем да кажем "събиране на данни", ама това е gather и не отразява факта, че ги събираш от мрежата. и в смисъла на информацията - никакъв слой, дори 0.0001 от повърхността, каквато данните нямат, не се отнема при scraping-а. за това не става и шкурене, жулене и подобните, които ще свържете с някаква грапава повърхност, която отнема от дърво горния слой например. плюс, че шкурене според БАН не е книжовна. шкурка също.

за това предлагам:

изравяне на данни - в четвъртия според БАН смисъл на глагола изравям
събиране на данни
добиване на данни
бране на данни

последното, ще кажете, е тотално далече от scraping, но смея да твърдя много ясно и описателно на български. например - "пускам една програма да ми бере достъпните данни от всякакви сайтове" - е нещо, което може и на петгодишно дете да обясните. мога и да продължа "scraper или берач наричаме програма, която като пчела опрашва сайтовете, преписвайки от тях по автоматизиран начин данни"

чудя се наистина, дали има конкретна дума за действието, когато някой броди по улиците и събира неща от земята например...

@dragnev-dev
Copy link

dragnev-dev commented Feb 26, 2025

ама това е gather и не отразява факта, че ги събираш от мрежата. и в смисъла на информацията - никакъв слой, дори 0.0001 от повърхността, каквато данните нямат, не се отнема при scraping-а. за това не става и шкурене, жулене и подобните, които ще свържете с някаква грапава повърхност, която отнема от дърво горния слой например

Може би лирическо отклонение, тук техническия смисъл не е ли, че от „опаковката“, например един HTML с цялото оформление на сайта, накрая остъргваш, стържеш само полезния товар – същинското бране на данни?

П.С. Коментарът ми е бил излишен като цяло, изчегъртвам си го писал. Иначе за gather – дето бране, там и черпене

@stelf
Copy link
Owner Author

stelf commented Feb 26, 2025

остъргваш, стържеш само полезния товар
глозгам

:P

@vlood
Copy link
Contributor

vlood commented Feb 27, 2025

Без значение глаголът, който ще се използва, считам за смислено да се уточни, че става въпрос за автоматизирано събиране/бране/жънене на данни. Щото scraping при всички положения е скрипт или програма, която на някакви принципи и критерии минава и върши делата, които иначе биха отнели доста повече време и усилия на човека.

@stelf
Copy link
Owner Author

stelf commented Feb 28, 2025

ето още предложения тогава в духа на другия смисъл

  • брулене
  • грухане

📦 -> 🎉

@vlood
Copy link
Contributor

vlood commented Feb 28, 2025

"Брулене на данни" е нещо, което определено бих използвал и за което ще бъда разбран правилно, въпреки комичното звучене :D

@stelf
Copy link
Owner Author

stelf commented Feb 28, 2025

"Брулене на данни" е нещо, което определено бих използвал и за което ще бъда разбран правилно, въпреки комичното звучене :D

то и scraping звучи комично... не виждам драма.

ходя бруля данни по нета
душа ми от риене на скрап
е вече клета

напълно разбиераемо .)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants