Просто кусочек переписки из рабочего чата Одноклассников. ----...

Просто кусочек переписки из рабочего чата Одноклассников.
----
[07.10.15, 12:28:04] Mikhail Bezoyan: есть ли среди нас гуру теорвера? есть вопросец

[07.10.15, 12:29:59] Leonid Talalaev: Думаю тут каждый второй считает себя гуру, пока вопрос не задашь:)

[07.10.15, 12:37:04] Mikhail Bezoyan: вопрос тупой: хочу класть объект в кэш только на N промах, но не хочу хранить кол-во промахов. Нужна такая функция плотности распределения вероятности добавления объекта в кэш, чтобы матожидание номера промаха на который объект попадет в кэш было примерно равно N. Время пошло )

[07.10.15, 12:38:31] Dmitriy Y. Bugaichenko: Равномерное распределение [0,1] + лимит < 1/N

[07.10.15, 12:39:28] Mikhail Bezoyan: что за лимит?

[07.10.15, 12:39:31] Dmitriy Y. Bugaichenko: Но можешь немного покурить https://ru.wikipedia.org/wiki/Распределение_Бернулли

[07.10.15, 12:40:01] Dmitriy Y. Bugaichenko: Не паришь мозг и делаешь rnd.nextDouble() < 1.0 / n

[07.10.15, 12:40:24] Mikhail Bezoyan: если я заюзаю равномерное для N = 2 то вероятностью что пападет в кэш с 2ух попыток будет 1/2 + 1/4 не? Может это и правильно, конечно

[07.10.15, 12:41:12] Dmitriy Y. Bugaichenko: Тебе же матожидание количества попыток после которой попадет нужно. На самом деле тебе и так и так эмпирически подбирать N. Т.е. просто нужен некий регулятор. И тут главное не усложнять

[07.10.15, 12:43:01] Mikhail Bezoyan: а есть доказательство что матожидание будет N?

[07.10.15, 12:43:04] Leonid Talalaev: можно без рандома, заводишь глобальный счетчик промахов и кладешь только тогда, когда он кратен N

[07.10.15, 12:43:07] Mikhail Bezoyan: )

[07.10.15, 12:43:11] Vyacheslav Baranov: есть еще вариант counting bloom filter. Поточнее будет

[07.10.15, 12:44:21] Dmitriy Y. Bugaichenko: Хочешь доказательств — кури распределение Бернулли. Но здесь KISS гораздо важнее

[07.10.15, 12:46:16] Shevchuk Aleksey: Миша, а слабо сделать вариант со счетчиками + предложенные вероятоностные варианты и на эксперименте проверить какой подход будет работать точнее?)

[07.10.15, 12:47:35] Dmitriy Y. Bugaichenko: Можно сделать юнит тестик простой и сэмулировать

[07.10.15, 12:48:11] Mikhail Bezoyan: еще предложи доклад сделать на эту тему )

[07.10.15, 12:49:03] Dezhin Ilya: статью написать :)

[07.10.15, 12:49:03] Vyacheslav Baranov: On 07/10/15, at 12:46, Aleksey Shevchuk wrote:
> Миша, а слабо сделать вариант со счетчиками + предложенные вероятоностные варианты и на эксперименте провреить какой подход будет работать точнее?)

Тут даже выбор ф-ции точности может вызвать неделю флуда

[07.10.15, 12:50:26] Oleg Larionov: ну на самом деле получается, что если ты на каждый гет выбираешь, класть или не класть, причем класть с вероятностью p, то матожидание получается p*sum_k=0^\inf((k+1)*(1-p)^k)

[07.10.15, 12:51:47] Oleg Larionov: и тут ты можешь поиграться с параметром p и получить нужное матожидание того, с какого раза значение попадет в кеш. даже сумма ряда есть = 1/p^2

[07.10.15, 12:58:15] Oleg Larionov: в итоге получается N=1/p, где N это матожидание. И получается то же самое, что тебе сказал Дима

[07.10.15, 13:00:11] Mikhail Bezoyan: ну вот и доказательство видимо )

[07.10.15, 13:02:52] Dmitriy Y. Bugaichenko: Олег Ларионов признается главным гуром теорвера (y)
Just a piece of correspondence from the work chat Odnoklassniki.
----
[10/07/15 12:28:04 AM Mikhail Bezoyan: are there any gurus of theorver among us? there is a question

[10/07/15, 12:29:59] Leonid Talalaev: I think every second here considers himself a guru until you ask a question :)

[10/07/15 12:37:04] Mikhail Bezoyan: stupid question: I want to put an object in the cache only for N error, but I don't want to store the number of errors We need such a probability distribution function of the probability of adding an object to the cache so that the expected number of a slip to which the object enters the cache is approximately equal to N. Time has gone)

[07.10.15, 12:38:31] Dmitriy Y. Bugaichenko: Uniform distribution [0,1] + limit <1 / N

[10/07/15 12:39:28] Mikhail Bezoyan: what is the limit?

[07.10.15, 12:39:31] Dmitriy Y. Bugaichenko: But you can smoke a little https://ru.wikipedia.org/wiki/ Distribution_Bernulli

[07.10.15, 12:40:01] Dmitriy Y. Bugaichenko: Do ​​not float the brain and do rnd.nextDouble () <1.0 / n

[07.10.15, 12:40:24] Mikhail Bezoyan: if I zayuzayu uniform for N = 2 then the probability that the papade in the cache with 2 attempts will be 1/2 + 1/4 not? Maybe that's right, of course.

[10/07/15 12:41:12 AM] Dmitriy Y. Bugaichenko: You also need to wait for the number of attempts after which you need to. In fact, it is both empirical for you to choose N. Ie. just need some kind of regulator. And the main thing is not to complicate

[07.10.15, 12:43:01] Mikhail Bezoyan: is there evidence that the expectation will be N?

[10/07/15, 12:43:04 PM] Leonid Talalaev: without a random house, you can start a global counter of misses and put it only when it is a multiple of N

[10/07/15 12:43:07 PM] Mikhail Bezoyan :)

[10/07/15 12:43:11 AM] Vyacheslav Baranov: there is another option of counting bloom filter. It will be more accurate

[10/07/15, 12:44:21] Dmitriy Y. Bugaichenko: If you want evidence, smoke the Bernoulli distribution. But here KISS is much more important.

[10/07/15, 12:46:16 PM] Shevchuk Aleksey: Misha, but weakly make a variant with counters + the proposed probabilistic variants and check what approach will work more precisely on the experiment?)

[10/07/15 12:47:35 AM] Dmitriy Y. Bugaichenko: You can make a unit testik simple and emulate

[07.10.15, 12:48:11] Mikhail Bezoyan: still suggest making a report on this topic)

[07.10.15, 12:49:03] Dezhin Ilya: write an article :)

[07.10.15, 12:49:03] Vyacheslav Baranov: On 07/10/15, at 12:46, Aleksey Shevchuk wrote:
> Misha, and weakly make a variant with counters + proposed probabilistic options and experiment to check which approach will work more precisely?)

Here, even the choice of f-tion accuracy can cause a week of flooding.

[10/07/15, 12:50:26 PM] Oleg Larionov: well, in fact, it turns out that if you choose for each het, put or not put, and put with probability p, then the expectation is p * sum_k = 0 ^ \ inf ((k + 1) * (1-p) ^ k)

[10/07/15, 12:51:47 PM] Oleg Larionov: and here you can play around with the p parameter and get the right expectation of how often the value gets into the cache. even the sum of the series is = 1 / p ^ 2

[07.10.15, 12:58:15] Oleg Larionov: the result is N = 1 / p, where N is the expectation. And it turns out the same thing that Dima told you

[07.10.15, 13:00:11] Mikhail Bezoyan: well, that's probably the proof)

[10/07/15, 1:02:52 PM] Dmitriy Y. Bugaichenko: Oleg Larionov is recognized as the main gur of theorist
У записи 9 лайков,
1 репостов.
Эту запись оставил(а) на своей стене Алексей Федоров

Понравилось следующим людям