Повторю-ка я здесь. Я получил распределение количества групп...

Повторю-ка я здесь.

Я получил распределение количества групп у участников какой-то группы... Отсортированный по убыванию. Максимальное число в этом распределении (очевидно) - количество участников самой группы относительно которой все смотрится.

Для понятности, что там нарисовано.

"то есть из 60 тысяч в группе "ланы дель рей" 20 тысяч состоят в "Подростки", 10 т. в " Сарказм" - 10731
и т.д."

И получил, что эта зависимость хорошо приближется

(
на картинке изображено
зеленый - оригинал.
синий - приближение
Оx - индекс группы
Оy - количество людей в группе
)

такой формулой.

f(x) = 1-900000*(1/(x-1455983));

Т.е. в общем виде.

f(x) = 1-A*(1/(x-B));

В - это всего количество найденных групп, что, опять-таки, очевидно.

Но есть два вопроса.

1. Что такое A и чем оно определяется (то есть понято чем. Максимальным количеством людей. Но тогда коэффициент распадается на два, потому что количество людей - 60 000. И откуда второй не ясно. )?
2. Почему это гиперболическая зависимость, а не экспоненциальная (хотя тоже понятно почему, потому что подъем ограничен количеством потенциально возможных совпадений людей по группам, но, блин, почему если что-то ограничено, сразу 1/x??? )?
I'll repeat here.

I got the distribution of the number of groups from members of a group ... Sorted in descending order. The maximum number in this distribution (obviously) is the number of participants in the group for which everything looks.

For clarity, what is drawn there.

"That is, 60 thousand in the group" Lana del Rey "20 thousand are in" Teens ", 10 tons. In" Sarcasm "- 10731
 etc."

And I got that this relationship is well approaching

(
the picture shows
green - the original.
blue - approximation
Оx - group index
Oy - the number of people in a group
)

such a formula.

f (x) = 1-900000 * (1 / (x-1455983));

Those. in general.

f (x) = 1-A * (1 / (x-B));

B is the total number of groups found, which, again, is obvious.

But there are two questions.

1. What is A and how is it determined (that is, understood by what. Maximum number of people. But then the coefficient falls into two, because the number of people is 60,000. And where the second is not clear.)?
2. Why is it hyperbolic dependence, not exponential (although it is also clear why, because the ascent is limited by the number of potentially possible coincidences of people in groups, but, damn, why if something is limited, immediately 1 / x ???)?
У записи 2 лайков,
0 репостов.
Эту запись оставил(а) на своей стене Александр Беспалов

Понравилось следующим людям