Филатов: Не так давно я писал про американскую...

Филатов:

Не так давно я писал про американскую программу «Palantir», которая решает комплексные задачи по объединению различных полицейских баз данных, их анализу и прогностике появления тех или иных криминальных событий в конкретных районах и у конкретных людей.

И вот 5 дней назад Медуза порадовала великолепным обзором подобных программ в РФ. А у нас все не менее круто. Разработками таких систем у нас занимается целый Научный центр при АП РФ.

Это системы:
- «ПСКОВ» - Поисковая система категории особой важности, способная извлекать даже данные из анонимной сети Tor,
- «Шерлок», система способная деанонимизировать практически любого человека всего по нескольким параметрам его персональных данных,
- Посейдон – система мониторинга протестной активности,
- Медиамонитор, анализирующий социальные сети по весьма специфическим запросам.

Кому интересна эта тема, рекомендую почитать источник в Медузе, это займет у вас минут 30.
Демонстрацию системы «Шерлок» я лично видел на одной приватной встрече руководителей служб безопасности нескольких крупнейших компаний РФ зимой прошлого года. И она меня сильно впечатлила: поэтому то, что написала Медуза – правда.

Интересно, что вместе с вот этими инициативами все складывается в весьма масштабную систему:

1) Осенью этого года Московское правительство в проведет конкурс на подключение 105 тыс. камер наблюдения к системе распознавания лиц. Если проект будет реализован, в городе появится одна из крупнейших в мире система слежения. По данным издания, в конкурсе могут принять участие три компании — «Центр речевых технологий» и VisionLabs, доли в которых принадлежат Сбербанку, и NTechLab, совладельцем которой является Ростех. Подробнее здесь.

2) Никаких обезличенных данных на самом деле не существует и определить и найти человека даже по малой части его данных – довольно простая штука.

Вот, к примеру, в опубликованной журналом Nature Communications статье утверждается, что знания персональных данных совсем не обязательно, чтобы понять, о ком именно в базе данных идет речь. Собрав всего три показателя, например, почтовый индекс, дату рождения и пол, можно сузить поиск до очень небольшого круга лиц. А при наличии 15 показателей, собранных из баз данных с социально-демографическими характеристиками людей, опросов и медицинских баз, можно точно определить конкретного человека.

Хотя это и так очевидно всем, кто работает в интернете ????

Тем временем у нас никаких ученых, исследователей или общественных активистов на высокие заседания, где вершится судьба данных на десятилетия вперед, никто не зовет. Тихо, спокойно и без лишнего внимания Ассоциация больших данных, в которую входят Сбербанк, Газпромбанк, «Яндекс», Mail.Ru Group, «Ростелеком», «Мегафон», сама решает, как им с ними поступить. А именно: разрешить использовать данные без согласия в целях, которые им покажутся важными. Дескать, получить согласие десятков миллионов клиентов, абонентов и пользователей интернет-ресурсов просто невозможно. Да и использоваться будут не персональные, а «обезличенные данные».

3) Настойчивые предложения депутатов ввести идентификацию e-mail всех пользователей. Это уже, конечно, зашквар. Идея, - чтобы государство гарантированно знало, что данным почтовый ящик принадлежит именно вам и имело к нему щелочку для подсматривания и чтения вашей переписки.

4) Налоговиками создается база со всеми данными граждан — от ФИО до родственных связей. Одна из целей — улучшить собираемость налогов.
В общем, в этой теме мы если не впереди планеты всей, то уж точно не отстаем. Вот только нужно определиться: это хорошо или плохо. Или, точнее для кого это хорошо, а для кого - плохо.

#технологии, #программы, #ИИ, #цифровойпрофайлинг, #персональныеданные, #криминалистика, #безопасность, #профайлинг,
Filatov:

Not so long ago, I wrote about the American program “Palantir”, which solves the complex tasks of combining various police databases, analyzing them and predicting the appearance of certain criminal events in specific areas and among specific people.

And 5 days ago, Medusa pleased with an excellent review of such programs in the Russian Federation. And here everything is no less cool. The development of such systems, we are engaged in a whole Scientific Center at the AP of the Russian Federation.

These are the systems:
- “PSKOV” - A search engine of a category of special importance, capable of extracting even data from the anonymous Tor network,
- “Sherlock”, a system capable of deanonymizing almost any person in just a few parameters of his personal data,
- Poseidon - a system for monitoring protest activity,
- A media monitor that analyzes social networks based on very specific requests.

To whom this topic is interesting, I recommend reading the source in Medusa, it will take you about 30 minutes.
I personally saw a demonstration of the Sherlock system at a private meeting of the heads of security services of several major Russian companies in the winter of last year. And she really impressed me: therefore, what Medusa wrote is true.

It is interesting that together with these initiatives, everything develops into a very large-scale system:

1) In the fall of this year, the Moscow government will hold a competition to connect 105 thousand surveillance cameras to the face recognition system. If the project is implemented, one of the world's largest tracking system will appear in the city. According to the publication, three companies can take part in the competition - “Speech Technology Center” and VisionLabs, in which Sberbank owns shares, and NTechLab, which is co-owned by Rostec. More details here.

2) No anonymized data actually exists and identifying and finding a person even by a small part of his data is a pretty simple thing.

For example, an article published by the journal Nature Communications claims that knowledge of personal data is not necessary to understand who it is in the database. Having collected only three indicators, for example, zip code, date of birth and gender, you can narrow the search to a very small circle of people. And if there are 15 indicators collected from databases with socio-demographic characteristics of people, surveys and medical databases, you can accurately determine a specific person.

Although this is so obvious to everyone who works on the Internet ????

In the meantime, we have no scientists, researchers or social activists at high meetings, where the fate of the data for decades to come, no one calls. Quietly, calmly and without too much attention, the Big Data Association, which includes Sberbank, Gazprombank, Yandex, Mail.Ru Group, Rostelecom, Megafon, decides for itself what to do with them. Namely: to allow the use of data without consent for purposes that they consider important. Say, getting the consent of tens of millions of customers, subscribers and users of Internet resources is simply impossible. And it will be used not personal, but “anonymized data”.

3) Persistent proposals of deputies to introduce the identification of e-mail of all users. This is, of course, a crack. The idea is that the state is guaranteed to know that this mailbox belongs to you and had a click to it to spy and read your correspondence.

4) The tax authorities create a database with all the data of citizens - from full name to family ties. One goal is to improve tax collection.
In general, in this topic, if we are not ahead of the rest, then we certainly are not behind. You just need to decide: is it good or bad. Or, more precisely, for whom it is good, and for whom it is bad.

#technologies, #programs, #I.
У записи 4 лайков,
1 репостов,
282 просмотров.
Эту запись оставил(а) на своей стене Анастасия Соломина

Понравилось следующим людям