- 머신러닝 알고리즘을 활용하여 신규 악성 URL 탐지 성능을 향상시키고, 실시간으로 악성 URL을 정확하게 판별하는 시스템을 구축
- 사용자에게 안전한 인터넷 환경을 제공하고, 스미싱, 피싱 등 사이버 범죄 예방에 기여
- 데이터 수집: Kaggle, Openphish, URLhaus 등에서 악성 URL과 정상 URL 데이터를 수집하여 학습 데이터셋 구축
- 특징 추출: URL의 길이, WHOIS 정보, TTL 주기 등 다양한 특징을 기반으로 악성 URL을 탐지할 수 있는 특성 분석
- 머신러닝 모델 학습: Decision Tree, Random Forest, LightGBM 등 다양한 머신러닝 알고리즘을 사용하여 모델 학습 및 최적화
- 웹 통합: Django 프로젝트에서 URL을 입력받아 모델을 통해 악성 여부를 실시간으로 판별하는 시스템 구축
- URL 판별: 사용자가 입력한 URL을 기반으로 URL 길이, 도메인 정보, TTL 주기 등 다양한 특징을 추출하고, 이를 통해 악성 여부를 실시간으로 판별