-
Notifications
You must be signed in to change notification settings - Fork 25
Russian pairs annotation guideline
В данном задании Вам предстоит определить, относится ли пара новостей к одному сюжету.
Сюжетом мы называем набор новостей об одном и том же событии. При этом понятие "события" максимально узкое: это что-то, что случилось в определённое время, с определёнными людьми и определённым образом. Но об этом событии пишут разные источники, и именно такие описания мы хотим объединять в сюжет.
Чтобы ознакомиться со всем сюжетом, как правило, достаточно одной статьи из него. Чтобы ознакомиться с темой целиком, как правило, необходимо изучить несколько сюжетов.
Простой критерий того, что новости относятся к одному событию: можно заменить заголовок одной новости на заголовок другой (и наоборот), и Вы не должны заметить разницу. То есть заголовок первой новости хорошо подходит к тексту второй, и наоборот.
Пара новостей относятся к одному событию, когда у них совпадают
- Время события (и близко время написания)
- Числа: такие как курс акций компании или число жерт
- Места: например, место проведения мероприятия или место ДТП
Пара новостей НЕ относятся к одному событию, когда в них:
- Несовпадающие факты: время или место события, значимо отличающие числа жертв, и т.д.
- Содержится описание события в одной из новостей и комментарий этого события некоторой личностью в другой.
Интерфейс выглядит следующим образом:
Акции Uber Technologies Inc. подешевели на 8,7%, до $25,58, на торгах на Нью-Йоркской фондовой бирже (NYSE). Как пишет агентство Bloomberg, исторический минимум... |
Цена за одну акцию компании достигла $25,58. Акции Uber Technologies на Нью-Йоркской фондовой бирже подешевели до рекордного минимума... |
Вам даны заголовки пары статей, их первые несколько строк, а также ссылка, по которой можно перейти, чтобы увидеть оригинальную статью. В оригинальной статье можно получить дополнительную информацию: например, дату публикации, некоторые числа, предоставленные журналистами. По этой информации необходимо сделать вывод о соответствии представленных статей одному сюжету.
1. Новости “В Москве вводится обязательное ношение масок и перчаток” и “Москвичей будут штрафовать за отсутствие масок и перчаток” относятся к одному сюжету.
А новости “Москвичей будут штрафовать за отсутствие масок и перчаток” и “В Московской области отложили штрафы за отсутствие масок” - к разным сюжетам.
2. Новости “Трамп прокомментировал версию о намеренном создании коронавируса Китаем” и “Президент США заявил, что не верит в преднамеренное распространение Китаем коронавируса” относятся к одному сюжету.
А новости “Трамп: Китай сделал ужасную вещь с коронавирусом, но нечаянно” и “В Германии назвали обвинения США против Китая отвлечением внимания от ошибок” - к разным сюжетам.
3. Новости “В Турции рассказали, когда смогут принимать российских туристов” и “Из России в Турцию: возобновление международных рейсов возможно в середине июля” относятся к одному сюжету.
А новости “Политолог объяснил, почему Турция не откажется от системы «всё включено»” и “Турция рассчитывает на российских туристов с июля” - к разным сюжетам.
4. Новости “СМИ: власти Москвы обсуждают меры введения режима жесткого карантина” и “Кремль отверг обсуждение властями закрытия Москвы на карантин” относятся к разным сюжетам, потому что вторая новость содержит информацию, которая противоречит первой.
5. Новости “Астронавт НАСА Меир готовится в пятницу выйти в открытый космос с Кук” и “Дуэт женщин-астронавтов во второй раз в истории вышел в открытый космос с борта МКС” относятся к разным сюжетам, потому что вторая новость содержит информацию о продолжении сюжета, анонсированного в первой.
6. Новости “Сборная России готовится к матчу с Шотландией в полном составе” и “Сборная России разгромила Шотландию в отборочном матче Евро-2020” относятся к разным сюжетам по аналогичным причинам.