По вчерашней встрече с ВК, немного подгорает. Врятли...

По вчерашней встрече с ВК, немного подгорает.

Врятли у меня дойдут руки до статьи или публичного "линча", поэтому напишу тут.

В общем в рамках мероприятия [club185184600|Рекламная пауза] было выступление [id5944|Андрея Законова] про умную ленту, вкратце:

- "стоп слова" - миф
- ранжирование по форматам - миф
- качать ядро - миф

Если не слушать детали выступления, а посмотреть слайды или выжимку, то можно понять что именно так всё и есть.

Так-то оно может и так, но на практике совсем иначе. По пунктам:

1. "Нет стоп слов".
Ранжированием постов занимается умная лента, и она принимает решение, исходя из контекста, например, вложенности (текст + медиа) - нет ли в посте запрещенки. Под запрещенкой может быть призыв к накрутке показателей сайта.

Так вот, когда говорят что "стоп слов" нет - подразумевают что нет слова или фразы, которые однозначно принимаются как сигнал к понижению ранжирования.

На практике же, и на наших тестах и на тестах тех, кто пробовал повторить занижение охвата - хватало и одного слова, который был совершенно вне контекста накрутки, чтоб срезать охваты в разы.

Т.е. в теории - да, стоп слова нет, но ИИ и умная лента и все алгоритмы ранжирования постоянно учатся. С переменными успехами или провалами.

Вывод один - при возможности всё таки избегать слов, фраз или оборотов, которые хоть как-то могут намекнуть на призыв к действию. В противном случае - ваш пост может стать причиной того, что алгоритм доучится на частной ситуации, а вы получите меньше охвата.

2. "У форматов нет приоритета".
В теории или на длинной дистанции - это верно. Нет форматов, которые "бустятся" постоянно, да, факт.

Но при этом время от времени, вне зависимости от других факторов - какие-то форматы "взлетают" по охватам. Я предполагаю что это нужно для того чтоб насильно дообучить ИИ и получить данные по действиям пользователей на определенный формат.

Я понимаю что когда в такие моменты мы (админы сообществ) используем это чтоб дополучить охватов - ВК от этого не в восторге.

Кроме того, я всё таки уверен что если формат показывает не очень хорошие для удержания пользователя в соц сети - его будут вручную понижать. Мы для этого проводили замеры в течении года и видим как один формат на несколько месяцев набирал охвата на старте меньше чем другие посты.

Я не против того чтоб какие-то форматы зарезались, но я бы очень хотел про это заранее знать :) Мы же знаем что репосты или посты со ссылками меньше в вк показываются - но всё равно их используем время от времени.

3. "нет смысла качать ядро для того чтоб были охваты"
Тут я просто промолчу и пересмотрю запись отдельно. как-нибудь.
=====

В целом, лично моё мнение - касательно работы умной ленты и алгоритмов ранжирования ребятам из ВК не хватает ... евангелиста что ли.

То есть нет единого места, куда можно прийти спросить или прочитать что именно сейчас происходит.

ТП ВК говорит одно, в статьях ВК другое, на выступлениях в Хакатое или других профильных мероприятиях от ВК - третье.

В таких условиях, работая с привлечением подписчиков в сообщество мы (админы) находимся в подвешенном состоянии и понимаем что завтра правила могут поменяться и наличие подписки никак не гарантирует охвата по ним, а значит есть соблазн сделать что-то чтоб домонетизировать базу прямо сейчас. Например перелить в инсту, залесть в личку спамом или подкрутить лайки под постом.

PS
Прикрепил видео с одного из мероприятий, где от ВК немного было про работу ИИ.

Кейс1 из видео про то, как ИИ "сам" обучается:
есть алгоритм, который по видео и тексту определяет 18+ контент. так получилось что в порно попал хентай, а хентай похож на аниме. поэтому аниме попал в категорию порно. и все паблики, которые пишут про аниме выпали из поиска :)

Кейс2 из видео:
Т.к. много кто пользует порно спам для вывода трафика из ВК, то контент, который часто для этого пользуется - аналогично, попадает в категорию "порно" и убирается из поиска. По этой причине, например, если написать пост, в котором будет слово "азиатка" - он пропадет из поиска :)

Примеры, которые я написал на видео с 18 минуты 25 секунды.

То есть есть ньюансы :) И ВК дообучается, далеко не всегда автоматически - и сообщения в тех поддержку могут помочь.

Вот я считаю - что доносить надо именно вот так, а не просто есть стоп слова или их нет :)

К сожалению понимаю что есть ньюансы и раскрывая больше тайн про алгоритмы - есть соблазн их обходить :)
At yesterday's meeting with VK, it’s a little burned out.

Vryatli my hands will reach an article or a public "lynch", so I will write here.

In general, in the framework of the event [club185184600 | commercial break] there was a speech [id5944 | Andrey Zakonov] about smart tape, in short:
 
- "stop words" is a myth
- ranking by formats - myth
- download core - myth

If you don’t listen to the details of the performance, but look at the slides or squeeze, you can understand that this is exactly how it is.

That may be so, but in practice it is completely different. The points:

1. "No stop words."
A smart tape is involved in ranking the posts, and it makes a decision based on the context, for example, nesting (text + media) - whether the post is prohibited. Under the prohibition may be a call to cheat site indicators.

So, when they say that there is no “stop word” - they mean that there is no word or phrase that is clearly accepted as a signal to lower the ranking.

In practice, on our tests and on the tests of those who tried to repeat the understatement of coverage, one word was enough, which was completely out of context of the markup, to cut off the coverage at times.

Those. in theory - yes, there is no stop word, but AI and smart tape and all ranking algorithms are constantly learning. With varying successes or failures.

There is only one conclusion: if possible, all the same, avoid words, phrases, or phrases that can at least somehow hint at a call to action. Otherwise, your post may cause the algorithm to finish learning in a particular situation, and you will get less coverage.

2. "Formats have no priority."
In theory or in the long run - this is true. There are no formats that constantly "boost", yes, a fact.

But at the same time, from time to time, regardless of other factors, some formats “take off” in coverage. I assume that this is necessary in order to forcibly retrain the AI ​​and obtain data on user actions in a specific format.

I understand that when at such moments we (community admins) use this to get coverage - VK is not happy about this.

In addition, I'm still sure that if the format does not show very good ones for keeping the user in the social network, they will manually lower it. To do this, we took measurements throughout the year and see how one format for several months gained less coverage at the start than other posts.

I don’t mind that some formats are slaughtered, but I would really like to know about this in advance :) We know that reposts or posts with links less in VK are shown - but still use them from time to time.

3. "it makes no sense to swing the core in order to be covered"
Then I just keep silent and review the recording separately. somehow.
=====

In general, my personal opinion is that the VK guys do not have enough about the work of the smart feed and ranking algorithms ... an evangelist or something.

That is, there is no single place where you can come to ask or read what is happening right now.

The VK VK says one thing, in the VK articles another thing, at the speeches in Hakatoy or other relevant events from the VK - the third.

In such conditions, when we work with attracting subscribers to the community, we (admins) are in limbo and understand that tomorrow the rules can change and having a subscription does not guarantee coverage for them, which means that there is a temptation to do something to domonize the database right now. For example, upload to instu, add spam to your PM or tweak likes under the post.

PS
Attached a video from one of the events, where from VK there was a little about the work of AI.

Case1 from the video about how AI "learns":
There is an algorithm that determines 18+ content from the video and text. it so happened that hentai got into porn, and hentai is like an anime. therefore anime fell into the category of porn. and all the pubs that write about anime fell out of the search :)

Case2 from the video:
Because many people use porn spam to display traffic from VK, the content that is often used for this purpose - similarly, falls into the category of "porn" and is removed from the search. For this reason, for example, if you write a post that contains the word "Asian" - it will disappear from the search :)

Examples that I wrote on the video from 18 minutes 25 seconds.

That is, there are nuances :) And VC is retraining, not always automatically - and messages in those support can help.

So I think - that it is necessary to convey this way, and not just have a stop word or not :)

Unfortunately, I understand that there are nuances and revealing more secrets about algorithms - there is a temptation to circumvent them :)
У записи 93 лайков,
2 репостов,
2819 просмотров.
Эту запись оставил(а) на своей стене Феликс Зинатуллин

Понравилось следующим людям