https://habr.com/ru/post/689520/
- Добавить свои значения переменных в файл
config.py
:
1.1 Параметры из my.telegram.org
api_id = <Твой api_id int>
api_hash = <Твой api_hash str>
1.2 Бот из @BotFather
bot_token = <Токен твоего бота str>
1.3 id канала, куда будут сливаться все новости
gazp_chat_id = <Id твоего канала c минусом в начале int>
- Запустить телеграм парсер
telegram_parser.py
, чтобы пройти аутентификацию в telethon и получить свои файлы сессииbot.session
иgazp.session
телеграм каналы
RSS каналы
новостные сайты
Фильтр по умолчанию настроен на газпром, газ и всё с этим связанное (хотя иногда проскакивают и другие новости).
Добавить/убавить свои каналы или поменять фильтры для новостей можно в файле main.py
Каждый парсер написан таким образом, чтобы его можно было запустить отдельно от остальных. Это значительно упрощает процесс добавления новых источников, их лучше проверять отдельно, чтобы убедиться в работоспособности. Например, feedparser может не прочитать RSS канал и тогда его придется парсить вручную.
telegram_parser.py
- парсер телеграм каналовrss_parser.py
- парсер RSS каналовbcs_parser.py
- кастомный парсер сайта www.bcs-express.rumain.py
- запускает все парсеры сразу, либо можно запустить в докере черезdocker-compose.yml