Несколько дней мне не давала покоя табличка заражений...

Несколько дней мне не давала покоя табличка заражений по странам из официального отчета ВОЗ. Как так вышло, что в стране со 146 млн населения на 11 марта всего 7 случаев, а в Норвегии с их 5 млн населения 277? Что-то не сходилось. Вчера терпение лопнуло, и я всю ночь руками вносил данные в табличку чтобы проверить одну гипотезу. Во-первых, везде публикуют абсолютные числа, а интересно знать количество заражений на душу населения. Большая разница между 20 заражениями в Китае и на Мальте. Я вбил в табличку население каждой страны, но это первый шаг, дальше я вбил для каждой страны ВВП на душу населения. Думаю вы понимаете в чем заключается гипотеза. Я хотел скоррелировать уровень благополучия и зараженность населения. Проверить что в странах с высоким ВВП вирус выявляется чаще.

Я закинул данные статистикам и они мне построили распределение и проверили его коэффициент корреляции (0.6 по Кендаллу, 0.8 по Спирмену). Мы выкинули оттуда два очевидных выброса: Италию (очень большое число заражений) и Люксембург (очень высокий ВВП). Также из выборки я исключил страны с очень маленьким населением как нерепрезентативные: Монако, Лихтенштейн, Ватикан, Андорру, Сан Марино и Исландию. Получилось прямо очень хорошо и наглядно.

Чем беднее страна, тем меньше в ней выявляется кейсов на душу населения. Интерпретацию этой диаграммы я оставляю вам. Наверняка дело в том что у граждан России, Украины и Белоруссии очень сильный иммунитет ????????

Исходники данных:
https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200311-sitrep-51-covid-19.pdf
https://docs.google.com/spreadsheets/d/1nUny3LRZKxxaC0Q8XGIAaBlgd8kZAQysvLX0E93-Ens/edit?usp=sharing
For several days I was haunted by a country infection sign from the WHO official report. How did it happen that in a country with 146 million people as of March 11 there were only 7 cases, while in Norway there were 277 of them with 5 million people? Something didn't fit. Yesterday, my patience snapped, and I spent the whole night putting my data into a tablet to test one hypothesis. Firstly, absolute numbers are published everywhere, but it is interesting to know the number of infections per capita. The big difference is between 20 infections in China and Malta. I drove the population of each country into a tablet, but this is the first step, then I drove per capita GDP for each country. I think you understand what the hypothesis is. I wanted to correlate the level of well-being and infection of the population. Check that in countries with high GDP, the virus is detected more often.

I threw the data to the statistics and they built a distribution for me and checked its correlation coefficient (0.6 according to Kendall, 0.8 according to Spearman). We threw out two obvious emissions from there: Italy (a very large number of infections) and Luxembourg (a very high GDP). I also excluded countries with a very small population from the sample as unrepresentative: Monaco, Liechtenstein, Vatican, Andorra, San Marino and Iceland. It turned out right very well and clearly.

The poorer the country, the less cases per capita are revealed in it. I leave this interpretation to you. Surely the fact is that the citizens of Russia, Ukraine and Belarus have very strong immunity ????????

Data sources:
https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200311-sitrep-51-covid-19.pdf
https://docs.google.com/spreadsheets/d/1nUny3LRZKxxaC0Q8XGIAaBlgd8kZAQysvLX0E93-Ens/edit?usp=sharing
У записи 93 лайков,
2 репостов,
4719 просмотров.
Эту запись оставил(а) на своей стене Андрей Мима

Понравилось следующим людям