"Парадокс дружбы".
Если взять любого пользователя "В контакте" и случайным образом выбрать любого из его друзей, то с вероятностью 80% у друга будет больше «френдов». Людей, которые плохо знакомы с математической статистикой, очень огорчает тот факт, что почти все френды более «успешны» в общении, чем они сами. Но здесь нет причины для депрессии: так и должно быть, в соответствии с наукой и здравым смыслом.
Парадокс дружбы — одна из форм «парадокса инспекции» (Inspection Paradox), который встречается буквально повсюду и частенько вводит в заблуждение обывателей.
Суть парадокса дружбы в том, что пользователи с большим количеством френдов чаще попадают в статистическую выборку. Например, по данным Stanford Large Network Dataset Collection на выборке из 4000 человек у среднего пользователя Facebook — 42 друга, а у каждого из этих френдов, в среднем, 91 друг.
То же самое наблюдается в других областях исследования.
Например, парадокс размера класса. Предположим, что мы опрашиваем студентов, сколько человек учится у них в группе, а потом выводим среднее арифметическое из их ответов — и получаем 56 человек. Но администрация университета говорит, что среднее количество студентов в группе — 31. Как ни странно, никто не врёт, и оба значения справедливы. Просто во время опроса больше шансов попасть в выборку имеют студенты из больших групп, потому что их на самом деле больше. Если у нас две группы 10 и 100 человек, то 100 из 110 опрошенных назовут размер своей группы в 100 человек, и только 10 человек назовут размер группы 10. Средний размер группы, по такому опросу, составит 92 студента.
Казалось бы, банальная ошибка, но она является источников недопонимания во многих реальных ситуациях. Например, при анализе пассажиропотока в общественном транспорте. Профессор информатики Аллен Дауни (Allen Downey) для статьи в журнале Американского статистического общества приводит пример среднего промежутка времени между электропоездами Red Line в Бостоне. Он записал время прибытия 70 электричек между 17:00 и 18:00.
Минимальный интервал между поездами составил 3 минуты, максимальный — 15 минут. По фактическим данным средний промежуток между поездами составляет 7,8 минуты, то есть среднее время ожидания поезда должно быть около 3,9 минуты. Но опрос пассажиров показывает, что среднее время ожидания на самом деле составило 4,4 минуты, а интервал между поездами — 8,8 минуты, то есть на 15% больше.
Причина в том, что при большей задержке поезда в его ожидании скапливается больше пассажиров, а прибывшие с коротким интервалом поезда идут менее заполненными. Соответственно, большинство пассажиров жалуются на давку в вагоне и долгое время ожидания поезда, тогда как по данным компании среднее время и загруженность вагонов соответствует норме.
Такая же проблема с авиарейсами. Большинство пассажиров говорят о полных салонах самолётов, в то время как авиакомпании жалуются на потерю прибыли, потому что так много рейсов летят почти пустыми. И те, и те правы.
«Парадокс инспекции» наблюдается, например, в забегах на длинные дистанции или при поездках на автомобиле по трассе. В каждом из этих случаев участник движения обгоняет «слишком медленных», а его обгоняют «слишком быстрые». Создаётся субъективное впечатление, что все участники движения делятся на слишком медленных или слишком быстрых, а средних нет.
Последний пример Аллена Дауни родился после прочтения книги «Оранжевый — хит сезона», мемуаров Пайпер Керман (Piper Kerman), которая провела 13 месяцев в федеральной тюрьме. В одном из фрагментов книги она выражает удивление большой продолжительностью сроков, которые отбывают заключённые. Очевидно, девушка не знакома с законами математической статистики. А ведь в соответствии с парадоксом инспекции, если попасть в тюрьму в случайный момент времени и выбрать случайного заключённого, то с большой долей вероятности он приговорён к длительному сроку заключения. Это вовсе не свидетельство негуманной тюремной системы США, а простой вывод из парадокса инспекции.
По официальным данным U.S. Sentencing Commission, средний срок составляет 121 месяц, а «субъективный средний срок» при опросе заключённых — 183 месяца.
Даже при опросе окружающих заключённых в течение тринадцати месяцев, как показывает расчёт, полученный средний результат не сильно отличается от первоначального однократного опроса.
Более-менее объективную цифру можно получить при опросе в течение 600 и более месяцев.
©
Если взять любого пользователя "В контакте" и случайным образом выбрать любого из его друзей, то с вероятностью 80% у друга будет больше «френдов». Людей, которые плохо знакомы с математической статистикой, очень огорчает тот факт, что почти все френды более «успешны» в общении, чем они сами. Но здесь нет причины для депрессии: так и должно быть, в соответствии с наукой и здравым смыслом.
Парадокс дружбы — одна из форм «парадокса инспекции» (Inspection Paradox), который встречается буквально повсюду и частенько вводит в заблуждение обывателей.
Суть парадокса дружбы в том, что пользователи с большим количеством френдов чаще попадают в статистическую выборку. Например, по данным Stanford Large Network Dataset Collection на выборке из 4000 человек у среднего пользователя Facebook — 42 друга, а у каждого из этих френдов, в среднем, 91 друг.
То же самое наблюдается в других областях исследования.
Например, парадокс размера класса. Предположим, что мы опрашиваем студентов, сколько человек учится у них в группе, а потом выводим среднее арифметическое из их ответов — и получаем 56 человек. Но администрация университета говорит, что среднее количество студентов в группе — 31. Как ни странно, никто не врёт, и оба значения справедливы. Просто во время опроса больше шансов попасть в выборку имеют студенты из больших групп, потому что их на самом деле больше. Если у нас две группы 10 и 100 человек, то 100 из 110 опрошенных назовут размер своей группы в 100 человек, и только 10 человек назовут размер группы 10. Средний размер группы, по такому опросу, составит 92 студента.
Казалось бы, банальная ошибка, но она является источников недопонимания во многих реальных ситуациях. Например, при анализе пассажиропотока в общественном транспорте. Профессор информатики Аллен Дауни (Allen Downey) для статьи в журнале Американского статистического общества приводит пример среднего промежутка времени между электропоездами Red Line в Бостоне. Он записал время прибытия 70 электричек между 17:00 и 18:00.
Минимальный интервал между поездами составил 3 минуты, максимальный — 15 минут. По фактическим данным средний промежуток между поездами составляет 7,8 минуты, то есть среднее время ожидания поезда должно быть около 3,9 минуты. Но опрос пассажиров показывает, что среднее время ожидания на самом деле составило 4,4 минуты, а интервал между поездами — 8,8 минуты, то есть на 15% больше.
Причина в том, что при большей задержке поезда в его ожидании скапливается больше пассажиров, а прибывшие с коротким интервалом поезда идут менее заполненными. Соответственно, большинство пассажиров жалуются на давку в вагоне и долгое время ожидания поезда, тогда как по данным компании среднее время и загруженность вагонов соответствует норме.
Такая же проблема с авиарейсами. Большинство пассажиров говорят о полных салонах самолётов, в то время как авиакомпании жалуются на потерю прибыли, потому что так много рейсов летят почти пустыми. И те, и те правы.
«Парадокс инспекции» наблюдается, например, в забегах на длинные дистанции или при поездках на автомобиле по трассе. В каждом из этих случаев участник движения обгоняет «слишком медленных», а его обгоняют «слишком быстрые». Создаётся субъективное впечатление, что все участники движения делятся на слишком медленных или слишком быстрых, а средних нет.
Последний пример Аллена Дауни родился после прочтения книги «Оранжевый — хит сезона», мемуаров Пайпер Керман (Piper Kerman), которая провела 13 месяцев в федеральной тюрьме. В одном из фрагментов книги она выражает удивление большой продолжительностью сроков, которые отбывают заключённые. Очевидно, девушка не знакома с законами математической статистики. А ведь в соответствии с парадоксом инспекции, если попасть в тюрьму в случайный момент времени и выбрать случайного заключённого, то с большой долей вероятности он приговорён к длительному сроку заключения. Это вовсе не свидетельство негуманной тюремной системы США, а простой вывод из парадокса инспекции.
По официальным данным U.S. Sentencing Commission, средний срок составляет 121 месяц, а «субъективный средний срок» при опросе заключённых — 183 месяца.
Даже при опросе окружающих заключённых в течение тринадцати месяцев, как показывает расчёт, полученный средний результат не сильно отличается от первоначального однократного опроса.
Более-менее объективную цифру можно получить при опросе в течение 600 и более месяцев.
©
"The paradox of friendship".
If you take any "VKontakte" user and randomly select any of his friends, then with a probability of 80% the friend will have more "friends". People who are new to mathematical statistics are very upset by the fact that almost all friends are more "successful" in communication than themselves. But there is no reason for depression: it should be, in accordance with science and common sense.
The paradox of friendship is one of the forms of the Inspection Paradox, which is found literally everywhere and often misleads ordinary people.
The essence of the friendship paradox is that users with a large number of friends are more likely to be included in the statistical sample. For example, according to the Stanford Large Network Dataset Collection on a sample of 4,000 people, the average Facebook user has 42 friends, and each of these friends has an average of 91 friends.
The same is observed in other areas of research.
For example, the class size paradox. Suppose we ask students how many people study in their group, and then we deduce the arithmetic mean from their answers - and we get 56 people. But the university administration says that the average number of students in a group is 31. Oddly enough, no one is lying, and both values are fair. It is just that during the survey, students from large groups are more likely to be included in the sample, because there are actually more of them. If we have two groups of 10 and 100 people, then 100 out of 110 respondents will name their group size as 100 people, and only 10 people will name the group size 10. The average group size, according to such a survey, will be 92 students.
It would seem a common mistake, but it is a source of misunderstanding in many real-life situations. For example, when analyzing passenger traffic in public transport. Computer science professor Allen Downey gives an example of the average time between Red Line trains in Boston for an article in the American Statistical Society. He recorded the arrival times of 70 trains between 5:00 pm and 6:00 pm.
The minimum interval between trains was 3 minutes, the maximum - 15 minutes. According to the actual data, the average interval between trains is 7.8 minutes, that is, the average waiting time for a train should be about 3.9 minutes. But a poll of passengers shows that the average waiting time was actually 4.4 minutes, and the interval between trains was 8.8 minutes, that is, 15% more.
The reason is that when the train is more delayed, more passengers accumulate in anticipation, and trains arriving with a short interval are less crowded. Accordingly, the majority of passengers complain about the crowding in the carriage and the long waiting time for the train, while according to the company, the average time and load of the carriages is within the norm.
The same problem with flights. Most passengers talk about full aircraft cabins, while airlines complain about lost profits because so many flights are nearly empty. Both are right.
The "inspection paradox" occurs, for example, in long-distance races or when driving a car on the track. In each of these cases the participant of the movement overtakes the "too slow", and he is overtaken by the "too fast" A subjective impression is created that all participants in the movement are divided into too slow or too fast, and not averages.
Allen Downey's latest example came from reading Orange Is the New Black, a memoir by Piper Kerman who spent 13 months in federal prison. In one of the fragments of the book, she expresses surprise at the lengthy sentences that prisoners serve. Obviously, the girl is not familiar with the laws of mathematical statistics. But in accordance with the paradox of inspection, if you go to jail at a random moment in time and choose a random prisoner, then with a high degree of probability he will be sentenced to a long term of imprisonment. This is not at all evidence of the inhuman US prison system, but a simple conclusion from the paradox of inspection.
According to the official data of the U.S. Sentencing Commission, the average term is 121 months, and the “subjective average” time when interviewing prisoners is 183 months.
Even when interviewing the surrounding prisoners for thirteen months, the calculation shows that the average result obtained does not differ much from the initial one-time interview.
A more or less objective figure can be obtained from a survey for 600 months or more.
©
If you take any "VKontakte" user and randomly select any of his friends, then with a probability of 80% the friend will have more "friends". People who are new to mathematical statistics are very upset by the fact that almost all friends are more "successful" in communication than themselves. But there is no reason for depression: it should be, in accordance with science and common sense.
The paradox of friendship is one of the forms of the Inspection Paradox, which is found literally everywhere and often misleads ordinary people.
The essence of the friendship paradox is that users with a large number of friends are more likely to be included in the statistical sample. For example, according to the Stanford Large Network Dataset Collection on a sample of 4,000 people, the average Facebook user has 42 friends, and each of these friends has an average of 91 friends.
The same is observed in other areas of research.
For example, the class size paradox. Suppose we ask students how many people study in their group, and then we deduce the arithmetic mean from their answers - and we get 56 people. But the university administration says that the average number of students in a group is 31. Oddly enough, no one is lying, and both values are fair. It is just that during the survey, students from large groups are more likely to be included in the sample, because there are actually more of them. If we have two groups of 10 and 100 people, then 100 out of 110 respondents will name their group size as 100 people, and only 10 people will name the group size 10. The average group size, according to such a survey, will be 92 students.
It would seem a common mistake, but it is a source of misunderstanding in many real-life situations. For example, when analyzing passenger traffic in public transport. Computer science professor Allen Downey gives an example of the average time between Red Line trains in Boston for an article in the American Statistical Society. He recorded the arrival times of 70 trains between 5:00 pm and 6:00 pm.
The minimum interval between trains was 3 minutes, the maximum - 15 minutes. According to the actual data, the average interval between trains is 7.8 minutes, that is, the average waiting time for a train should be about 3.9 minutes. But a poll of passengers shows that the average waiting time was actually 4.4 minutes, and the interval between trains was 8.8 minutes, that is, 15% more.
The reason is that when the train is more delayed, more passengers accumulate in anticipation, and trains arriving with a short interval are less crowded. Accordingly, the majority of passengers complain about the crowding in the carriage and the long waiting time for the train, while according to the company, the average time and load of the carriages is within the norm.
The same problem with flights. Most passengers talk about full aircraft cabins, while airlines complain about lost profits because so many flights are nearly empty. Both are right.
The "inspection paradox" occurs, for example, in long-distance races or when driving a car on the track. In each of these cases the participant of the movement overtakes the "too slow", and he is overtaken by the "too fast" A subjective impression is created that all participants in the movement are divided into too slow or too fast, and not averages.
Allen Downey's latest example came from reading Orange Is the New Black, a memoir by Piper Kerman who spent 13 months in federal prison. In one of the fragments of the book, she expresses surprise at the lengthy sentences that prisoners serve. Obviously, the girl is not familiar with the laws of mathematical statistics. But in accordance with the paradox of inspection, if you go to jail at a random moment in time and choose a random prisoner, then with a high degree of probability he will be sentenced to a long term of imprisonment. This is not at all evidence of the inhuman US prison system, but a simple conclusion from the paradox of inspection.
According to the official data of the U.S. Sentencing Commission, the average term is 121 months, and the “subjective average” time when interviewing prisoners is 183 months.
Even when interviewing the surrounding prisoners for thirteen months, the calculation shows that the average result obtained does not differ much from the initial one-time interview.
A more or less objective figure can be obtained from a survey for 600 months or more.
©
У записи 9 лайков,
0 репостов.
0 репостов.
Эту запись оставил(а) на своей стене Станислав Вагурин