Хорошо, если так. И точно хорошо, что написали подробный ответ.
> Мы признаём, что вчера Яндекс.Новости отставали от картины дня. Скорее всего, дело в том, что алгоритм кластеризации, который склеивает новости в сюжеты, а сюжеты — в темы, не всегда мог объединять в одну тему, например, сообщения о задержаниях во Владивостоке и об аресте Навального в Москве. Иными словами, временами агрегатор мог рассматривать одну большую, сложную и географически обширную тему про протесты как несколько разных тем, что, в свою очередь, могло повлиять на качество работы сервиса. Точно так же алгоритм срабатывает, когда есть много новостей про ДТП с разными людьми в разных городах. Он полагает, что это разные события, и не объединяет их в общий сюжет.
Пока неточная работа алгоритма кластеризации — всего лишь гипотеза; мы по-прежнему разбираемся, как 26 марта сообщения в Яндекс.Новостях собирались в сюжеты и в темы. Если ошибки и правда были, мы будем на них учиться. Однако ситуация в целом непростая — мы агрегатор, и искусственно поднимать ту или иную тему в условиях молчания крупных СМИ, очевидно, не можем.
> Мы признаём, что вчера Яндекс.Новости отставали от картины дня. Скорее всего, дело в том, что алгоритм кластеризации, который склеивает новости в сюжеты, а сюжеты — в темы, не всегда мог объединять в одну тему, например, сообщения о задержаниях во Владивостоке и об аресте Навального в Москве. Иными словами, временами агрегатор мог рассматривать одну большую, сложную и географически обширную тему про протесты как несколько разных тем, что, в свою очередь, могло повлиять на качество работы сервиса. Точно так же алгоритм срабатывает, когда есть много новостей про ДТП с разными людьми в разных городах. Он полагает, что это разные события, и не объединяет их в общий сюжет.
Пока неточная работа алгоритма кластеризации — всего лишь гипотеза; мы по-прежнему разбираемся, как 26 марта сообщения в Яндекс.Новостях собирались в сюжеты и в темы. Если ошибки и правда были, мы будем на них учиться. Однако ситуация в целом непростая — мы агрегатор, и искусственно поднимать ту или иную тему в условиях молчания крупных СМИ, очевидно, не можем.
Well, if so. And it’s good that they wrote a detailed answer.
> We recognize that yesterday Yandex.News lagged behind the picture of the day. Most likely, the fact is that the clustering algorithm, which glues news into stories, and stories into topics, could not always combine into one topic, for example, reports of detentions in Vladivostok and the arrest of Navalny in Moscow. In other words, at times the aggregator could consider one large, complex and geographically extensive topic of protests as somewhat different topics, which, in turn, could affect the quality of the service. In the same way, the algorithm works when there is a lot of news about accidents with different people in different cities. He believes that these are different events, and does not integrate them into a common plot.
So far, the inaccurate operation of the clustering algorithm is just a hypothesis; we continue to understand how on March 26 messages in Yandex.News gathered in plots and topics. If there were any mistakes, we will learn from them. However, the situation as a whole is not simple - we are an aggregator, and obviously we cannot artificially raise a topic in the context of silence of large media.
> We recognize that yesterday Yandex.News lagged behind the picture of the day. Most likely, the fact is that the clustering algorithm, which glues news into stories, and stories into topics, could not always combine into one topic, for example, reports of detentions in Vladivostok and the arrest of Navalny in Moscow. In other words, at times the aggregator could consider one large, complex and geographically extensive topic of protests as somewhat different topics, which, in turn, could affect the quality of the service. In the same way, the algorithm works when there is a lot of news about accidents with different people in different cities. He believes that these are different events, and does not integrate them into a common plot.
So far, the inaccurate operation of the clustering algorithm is just a hypothesis; we continue to understand how on March 26 messages in Yandex.News gathered in plots and topics. If there were any mistakes, we will learn from them. However, the situation as a whole is not simple - we are an aggregator, and obviously we cannot artificially raise a topic in the context of silence of large media.
У записи 12 лайков,
0 репостов,
723 просмотров.
0 репостов,
723 просмотров.
Эту запись оставил(а) на своей стене Андрей Новосельский