Немножко статистики. Пару лет назад я увидел статью...

Немножко статистики.

Пару лет назад я увидел статью (теперь, к сожалению, не могу её найти), где среднее число друзей в <другой соцсети> сравнивалось с типичной численностью населения в средневековых городах Европы. Ну и автор говорил - вот, все сходится, в городах, где все друг друга знали, число людей обусловлено нормальным кругом общения человека. Тогда приводилось число порядка 180.

[id17|Беспалов] по моей просьбе посчитал своим мегаприложением, сколько друзей у его друзей и сколько у моих. Я из этих данных построил пару графиков. Объединять наших друзей я не стал, ибо пересечение слишком велико, посчитал отдельно, но в целом картина оказалась одинаковая.

Итак, на графиках - по оси Y - число людей, имеющих число друзей, отложенное по оси X. Шаг взят экспериментально, для Беспаловских друзей, которых почти в три раза меньше, чем моих, взят интервал в 20 друзей. То есть в точке X=10 стоит количество человек, у которых от 0 до 20 друзей, в точке X=30 - количество человек, у которых от 21 до 40 друзей и т.д. Для моих друзей я построил два графика - с шагом 20 (таким же, как для Беспалова) и с шагом 10 - то есть в точке X=5 - число людей у которых число друзей от 0 до 10, в точке X=15 - от 11 до 20 и т.д. Равенство центральных значений говорит о достаточности шага в 20 друзей.

Потом я приблизил эти распределения Гауссом и Релеем (Релеем только потому, что он с виду больше всего похож, физической подоплеки под этим нету, можно было обойтись и Гауссом, тем более, что центральные значения получились очень близкими), чтобы точнее определить центральное значение, которое сильно отличается от среднего в данном случае, даже после отбрасывания людей с феноменально большим количеством друзей.

В целом, получаем очень похожие на указанные в той статье значения. (центральное значение распределения 220 для Беспаловских друзей, 200 для моих). То есть люди и правда несильно ушли от тех времен.
Средние же наших выборок и того ближе друг к другу (318 и 321)

Здесь надо бы сделать какой-то очень глубокий самостоятельный вывод, но значения получились очень ожидаемые. И даже если сравнить среднее число друзей (не выбрасывая при этом публичных персон с большим их количеством), то получится значение, равное среднему числу друзей у американских пользователей <одной известной соцсети> - 370 против 362. (данные по ссылке)

Аппроксимация распределений и построение графиков выполнены в программе [club1872310|MagicPlot]
A bit of statistics.

A couple of years ago I saw an article (now, unfortunately, I cannot find it), where the average number of friends in <another social network> was compared with the typical population in the medieval cities of Europe. Well, the author said - here, everything converges, in cities where everyone knew each other, the number of people is due to the normal range of human communication. Then a number of about 180 was given.

[id17 | Bespalov] at my request, I considered it a mega-app how many friends are his friends and how many are mine. I built a couple of graphs from this data. I did not unite our friends, because the intersection is too large, I considered it separately, but on the whole the picture was the same.

So, on the graphs - along the Y axis - the number of people having the number of friends, plotted along the X axis. The step is taken experimentally, for Bespalov friends, which are almost three times less than mine, an interval of 20 friends is taken. That is, at the point X = 10 there is the number of people who have from 0 to 20 friends, at the point X = 30 - the number of people who have from 21 to 40 friends, etc. For my friends, I plotted two graphs — in increments of 20 (the same as for Bespalov) and in increments of 10 — that is, at X = 5 — the number of people who have a number of friends from 0 to 10, at X = 15 — from 11 to 20, etc. Equality of central values ​​indicates the sufficiency of a step of 20 friends.

Then I approximated these distributions by Gauss and Rayleigh (the Rayleigh just because it looks the most similar, there is no physical basis for this, Gauss could be dispensed with, especially since the central values ​​turned out to be very close). which is very different from the average in this case, even after dropping people with a phenomenally large number of friends.

In general, we get very similar to the values ​​indicated in that article. (the central value of the distribution is 220 for Bespalovian friends, 200 for mine). That is, people and the truth is slightly gone from those times.
The averages of our samples are even closer to each other (318 and 321)

Here it would be necessary to draw some very deep independent conclusion, but the values ​​turned out to be very expected. And even if we compare the average number of friends (without throwing out public figures with a large number of them), then we get a value equal to the average number of friends among American users of <one known social network> - 370 against 362. (referring data)

The approximation of distributions and plotting are performed in the program [club1872310 | MagicPlot]
У записи 8 лайков,
2 репостов.
Эту запись оставил(а) на своей стене Андрей Городецкий

Понравилось следующим людям