-
Notifications
You must be signed in to change notification settings - Fork 25
Plans
Ilya Gusev edited this page Aug 5, 2020
·
1 revision
Бюджет: 300$
План:
- Втащить фреймворк для DL - Илья - 15 мая
- HTTP-сервер. - Вадик - 20 мая Требования:
- 17 RPS
- запрос на добавление и на удаление
- max-cache
- хранить проиндексированные данные на диске в рабочей директории приложения
- HTTP 1.1 с Keep-Alive
- либа со статической линковкой или пакет для Debian
- параллельно будет отправляться до 100 запросов.
- Выделить аннотирование одного документа - Вадик - 20 мая
- Задача определения языка: проверка качества, исправление в узбекских текстах - Ваня - 19 мая
- Новая инструкция для not news и категорий, запустить разметку 5.1) сделать доразметку по порогу - Илья - 17 мая
- Переобучить классификатор категорий, возможно XLMRoberta, mBART - Даня - 21 мая 6.1) Английская разметка кластеризации 6.2) Измерить метрики эмбеддеров по разметке пар и половинок: 6.2.1) Laser 6.2.2) CNN Summary 6.2.3) Old 6.3) Not-CNN Summary: 6.3.1) Laser pretraining 6.4) Summary embedder допилки: 6.4.1) Больше данных: Lenta, train данные контеста, английские датасеты 6.4.2) Multitask model 6.4.3) NER
- Кластеризация:
- BIRCH - Даня - ?? мая
- разметка на парах для кластеризации - Даня - 19 мая
- кластеризация в фоне - Илья, Вадик - 21 мая
- Ранжирование хвоста - Ваня - 21 мая
- Улучшение выбора заголовков - Ваня - 21 мая
- Пересчитать PageRank - Ярик - 21 мая
- Разметка региональности (или глобальные счётчики), улучшение ранжирования сюжетов - Ярик - 21 мая
- Спереть идеи у других людей - Илья - 14 мая
- https://github.com/nick-baliesnyi/tgnews, https://contest.com/data-clustering/entry1228
- https://github.com/roman-rybalko/telegram-data-clustering-contest
- https://github.com/MarcoBuster/data-clustering-contest
- https://github.com/sudevschiz/tgnews
- https://github.com/crazyleg/telegram_data_clustering_2019, https://contest.com/data-clustering/entry1144
- https://github.com/77ph/tgnews
- https://github.com/Stepka/telegram_clustering_contest, https://contest.com/data-clustering/entry1172
- https://github.com/akash-joshi/telegram-cluster
- https://github.com/dremovd/telegram-clustering Из полезного: https://github.com/panda-official/metric
- Дашборд с метриками - Илья
- Связанные