-
BeautifulSoup을 활용한 네이버 뉴스 크롤링
-
안티크롤링 해결 및 기사내용 전처리 추가
-
CSV(utf-8) 형태로 수집된 파일 도출
- 제목 및 기사의 원본 수집
python main.py
- 정제된 제목 및 기사 수집
python main.py --clean
BeautifulSoup을 활용한 네이버 뉴스 크롤링
안티크롤링 해결 및 기사내용 전처리 추가
CSV(utf-8) 형태로 수집된 파일 도출
python main.py
python main.py --clean