А вот вам еще одно мини-исследование! Я хотел...

А вот вам еще одно мини-исследование!

Я хотел посмотреть чье многословие хоть как-то окупается в ВК. Для этого я решил посчитать для всех друзей-друзей корреляцию количества слов в предложениях с лайками за эти посты. Т.е. насколько люди больше оценивают, когда человек пишет больше слов в постах.

И тут есть ряд хитростей, которые заставили меня ввести правило для отбора:

1. Отбираются для оценки посты больше 20 слов, но меньше 2000
2. У человека из последних 200 постов не менее 50 должны соответствовать минимальной длине
3. Медианная длина поста должна быть не менее 40 слов
4. Медианное количество лайков не менее 5
5. По крайней мере 5% постов должно быть с длиной более 100 слов.

В общем, это люди, которые пишут и иногда пишут длинные посты.

Друзей-друзей у меня 300 тысяч, поэтому я обработал ровно 10% от всего числа за 12 часов. (но сейчас на неделю поставлю комп считать дальше и уйду к другому)

Вышло примерно вот что.

Средняя корреляция длинны поста и количества лайков - 0.13. Распределение корреляций на гистограмме внизу.

Вопреки мнению, что корреляция у большинства должна быть отрицательной, отрицательная корреляция, в основном, у СММщиков и других странных людей, которые где-то увидели, что надо генерировать контент. К несчастью, никто им не рассказал, что контент это не бессмысленные посты, забитые эмоджи.

Но бывают не странные исключения. Например, высокодуховные модели, которые решили, что могут не только выкладывать полуголые фото, но еще и писать задумчивые тексты. Понятно, что тексты эти никому не нужны(ну или почти никому). Тоже самое с фотографами этих моделей.

В положительной области политики, общественные деятели, некоторые музыканты(но не все), путешественники и некоторые страницы стартапов. В общем, люди с интересной жизнью или жизненной позицией.

Составил немного топ10 сверху и топ7 снизу. Но учтите, что это были только 10% от общего числа, поэтому ждите обновлений... Когда оно там досчитает.

Лучшие(из случайных 30 тысяч):

[id2151606|0,862] Музыкант
[id339711695|0,803] Веганство/Либер
[id159225798|0,775] Говнопродажи
[id16148679|0,739] Путешествия (писал у себя и лайкали, потом ушел в блог и перестали, отсюда корреляция)
[id74686847|0,731] Луста(певица)
[id1939367|0,69] Социальщина/Дети
[id371259711|0,685] Садулаев/Политика
[id96422|0,672] Проект Фрутсы
[id143094996|0,672] Путешествия/Велопитер
[id2039524|0,663] Мастерская «Образование»

Те, кому стоит перестать писать, потому что их подписчики явно это не ценят...

218390 (-0,483) Обычный человек. Фото, да. Текст - нет.
33697229 (-0,47) ГовноСММ
2421654 (-0,455) Псих-тренинг
23954098 (-0,444) Фотограф
2821783 (-0,345) Модель (высокодуховная)
14303336 (-0,322) муз. Группа 3110
8790164 (-0,321) Задумчивая дама, которая хочет писать умно, но...
And here's another mini-study!

I wanted to see whose verbosity somehow pays off in the VC. For this, I decided to calculate for all friends-friends a correlation of the number of words in sentences with likes for these posts. Those. how much do people appreciate more when a person writes more words in posts.

And there are a number of tricks that made me introduce a rule for selection:

1. Selected for the evaluation of posts more than 20 words, but less than 2000
2. In a person of the last 200 posts, at least 50 must correspond to the minimum length.
3. The median length of a post must be at least 40 words.
4. The median number of likes is at least 5
5. At least 5% of posts should be longer than 100 words.

In general, these are people who write and sometimes write long posts.

I have 300,000 friends and friends, so I processed exactly 10% of the total number in 12 hours. (but now for a week I will put the computer to count on and go to another)

It turned out about this.

The average correlation of post length and the number of likes is 0.13. The distribution of correlations in the histogram below.

Contrary to the opinion that the correlation in the majority should be negative, the negative correlation is mainly in SMMs and other strange people who saw somewhere that it is necessary to generate content. Unfortunately, no one told them that the content is not meaningless posts, scored Emoji.

But there are no strange exceptions. For example, highly spiritual models who decided that they can not only upload half-naked photos, but also write thoughtful texts. It is clear that no one needs these texts (or almost no one). Same with the photographers of these models.

In the positive field of politics, public figures, some musicians (but not all), travelers and some pages of startups. In general, people with an interesting life or attitude.

Made a little top 10 top and top 7 below. But keep in mind that these were only 10% of the total number, so wait for updates ... When it is calculated there.

Best (from random 30 thousand):

[id2151606 | 0,862] Musician
[id339711695 | 0,803] Veganism / Liber
[id159225798 | 0.775] Gobliners
[id16148679 | 0,739] Travel (wrote at home and liked, then went to the blog and stopped, hence the correlation)
[id74686847 | 0,731] Lusta (singer)
[id1939367 | 0,69] Socialism / Children
[id371259711 | 0,685] Sadulayev / Politics
[id96422 | 0,672] Project Frutsy
[id143094996 | 0,672] Traveling / Bicycling
[id2039524 | 0.663] Workshop "Education"
 
Those who should stop writing, because their subscribers obviously do not appreciate it ...
 
218390 (-0.483) An ordinary person. Photo, yes. Text is not.
33697229 (-0.47) GovnoSMM
2421654 (-0,455) Psychic training
23954098 (-0,444) Photographer
2821783 (-0.345) Model (highly spiritual)
14303336 (-0.322) mus. Group 3110
8790164 (-0.321) A pensive lady who wants to write cleverly, but ...
У записи 18 лайков,
0 репостов,
1088 просмотров.
Эту запись оставил(а) на своей стене Александр Беспалов

Понравилось следующим людям