Skip to content

Latest commit

 

History

History
28 lines (20 loc) · 2.03 KB

README.md

File metadata and controls

28 lines (20 loc) · 2.03 KB

sms ham spam

Анализатор текста с использованием машинного обучения

Этот код представляет собой пример анализатора текста для определения спама в сообщениях с использованием метода опорных векторов (SVM) и векторизации TF-IDF.

Подготовка данных

  1. Загрузите необходимые библиотеки и корпус стоп-слов.
  2. Очистите текст от пунктуации, приведите к нижнему регистру и проведите стемминг.
  3. Разделите данные на обучающий и тестовый наборы.

Векторизация текста

  1. Примените TF-IDF для векторизации текста.

Обучение модели

  1. Обучите модель SVM с линейным ядром.

Оценка модели

  1. Получите прогнозы для тестового набора.
  2. Выведите матрицу ошибок, отчет о классификации и точность модели.

Веб-интерфейс для анализа текста

  1. Используйте библиотеку ipywidgets для создания интерфейса.
  2. Создайте функцию analyze_text, которая принимает текст, векторизует его и делает прогноз с помощью обученной модели.
  3. Создайте кнопки для запуска анализа и очистки ввода.
  4. Отобразите текстовое поле для ввода, кнопки и текстовое поле для вывода результата.

Этот код позволяет вам интерактивно проверять сообщения на наличие спама, используя обученную модель SVM.