Господа кодеры с личными сайтами, у меня есть - Запись на стене пользователя Никита Калинин в Вконтакте. Комментарии и лайки к записи.

Никита Калинин

Господа кодеры с личными сайтами, у меня есть социологическая гипотеза, которую было бы забавно проверить. Все мы знаем, что последовательности из 0 и 1 равновероятны в стандартном математическом смысле, но интуитивно кажется что 00000 менее вероятна чем 01011. Это вроде известный факт, но я не знаю как его объясняют, а искать в литературе мне лень.

С другой стороны, имея минимальные программерские навыки, можно
это проверить посредством crowdsourcing. Представим, индивид заходит по ссылке на страничку, и ему там предлагают упорядочить десять последовательности из 0 и 1 по возрастанию “случайности”. Разным людям показывают разные последовательности, все результаты сохраняются. Потом эти данные чистятся от мусора и разными статистическими методами ищутся закономерности.

Моя гипотеза такая: надо считать число повторений подпаттернов, и они дают веса. Например, в 1101 нет повторяющихся подслов, а в 1111 есть три экземпляра 11 и два экземпляра 111. Поэтому 1111 менее вероятна, мы считаем повторения маловероятными, а хаос — более вероятным. Это всё равно какая-нибудь модификация Колмогоровской сложности, но мне интересно. Такой есть вопрос из области естествознания. Кто хочет взяться?

Messrs. Coders with personal sites, I have a sociological hypothesis that would be fun to check. We all know that sequences from 0 and 1 are equally probable in the standard mathematical sense, but intuitively it seems that 00000 is less likely than 01011. This is a known fact, but I don’t know how to explain it, but I’m too lazy to look in the literature.

On the other hand, with minimal programming skills, you can
check it out by crowdsourcing. Suppose an individual comes by reference to a page, and there they are offered to order ten sequences from 0 and 1 in ascending “randomness”. Different people show different sequences, all results are saved. Then this data is cleared of garbage and regularities are searched for by various statistical methods.

My hypothesis is this: you must count the number of repetitions of subpatterns, and they give weight. For example, in 1101 there are no recurring subwords, and in 1111 there are three instances of 11 and two instances of 111. Therefore, 1111 is less likely, we consider repetition as unlikely, and chaos as more likely. It is still some modification of Kolmogorov complexity, but I find it interesting. This is a question from the field of science. Who wants to take?

У записи 2 лайков,
0 репостов.

Эту запись оставил(а) на своей стене Никита Калинин