В настоящее время процесс поиска научных статей представляет собой долгий и неудобный процесс, забирающий у ученых ценное время, которое они могли бы использовать для исследований. Но наша команда предлагает современное решение этой проблемы. Мы соединили силы языковой модели с преимуществами векторных баз данных, создав инструмент, который позволяет ученым быстро, удобно и эффективно находить необходимую информацию, сокращая время поиска научных статей на порядки. Наше решение не только увеличивает производительность исследователей, но и способствует развитию научного сообщества, ускоряя процесс научного открытия и инноваций. Данное решение легко развёртывается как на сайте, так и в качестве телеграм бота, как это продемонстрировано нами в данном репозитории. В основу проекта легли спаршенные нами базы научных медицинских работ Cochrane и PubMed, в виду чего бот на данный момент может помочь с поиском медицинских научных статей. Помимо помощи с поиском статей бот способен дать осмысленный совет по здоровью, например, каких врачей следует посетить при указанной болезни.
- GigaChatPro - LLM поверх которой наложен RAG
- Qdrant - векторная БД для хранения RAG
- Streamlit - веб приложение
- AIOGram - библиотека для построения телеграм-бота
- research - тестирование агентов
- services - подключение векторной БД и эмбэдингов к проекту
- tgbot - Телеграм бот, позволяющий общаться с сервером прямо из мессенджера
git clone [email protected]:erdenirf/DeepHackAgents_2024_Pubmed.git
- скачиваем репозиторийpython -m venv venv
- ставим виртуальную среду, затем активируем черезvenv/Scripts/activate
для Linux либоvenv/Scripts/activate
для Windowspip install -r requirements.txt
- устанавливаем зависимости- Вставьте свой API ключ в переменную .env в константу GIGACHAT_API_CREDENTIALS при надобности
python -m streamlit run main.py
- запускаем приложение