article-img
Будущее  
25/05

Big data по-русски: на службе государства, рекламщиков и страховщиков

Share

Представьте: вы выбираете на сенсорном дисплее еду, быстро прокручиваете изображения гамбургеров, газировки и картошки. Дисплей не успевает обновлять информацию и выдает черный экран с логами программы. Но вместо сообщения об ошибке вы вдруг видите текст: “Мужчина, 21 год, русский, смотрел на чизбургеры 10 секунд, выбрал гамбургер”. 

image

-
-

Свидетелем такого сбоя недавно стал житель Осло. Оказалось, что специальная программа распознавала пол, возраст и расу человека, а также фиксировала время, в течение которого он смотрел на разные товары. Затем информацию анализировали маркетологи, чтобы эффективнее подобрать рекламу (например, мужчинам показывать ролики с мясом, а женщинам — с диетическими соками). 

Но данные собирают не только экраны и камеры в фастфудах. По сути, мы сами рассказываем о себе практически все, причем абсолютно осознанно. А делаем мы это, выкладывая в соцсети фотографии, выбирая телефоны в интернет-магазинах, вбивая в поисковике “митинг он вам не Димон”. Эти массивы информации называют Big Data, или большими данными.


Как собирают информацию

Из 146 миллионов россиян 98 миллионов зарегистрированы в различных социальных сетях. А о 35 миллионах можно получить персональную информацию из любых открытых источников: базы судебных приставов, реестров юридических лиц, налогоплательщиков, ГИБДД. Большое количество личных данных люди собственноручно указывают на сайтах по аренде недвижимости и продаже товаров (там есть телефоны, описания квартир, людей, их привычек, характеров и так далее).

image

-
-

Компания по анализу больших данных, которую основал Артур Хачуян, использует специальные программы-парсеры (“скачиватели”), которые автоматически собирают информацию о людях из социальных сетей и других открытых источников. 

Однако это не относится к Facebook и Instagram. У них нет специального интерфейса, через который программа смогла бы получить доступ к данным. Чтобы собрать фотографии, номера телефонов и адреса почты людей из этих соцсетей, “скачиватель” прикидывается человеком, который просматривает страницы других пользователей. 


Как используют личные данные

 

1. Распознавание лиц и поиск преступников 

Компания Артура Хачуяна разрабатывает систему для поиска людей и отслеживания воров, педофилов и убийц с помощью Big Data, но предоставляет ее только госорганам. При этом выявлять экстремистов, анализируя открытую информацию в интернете, по мнению основателя SocialDataHub, неэффективно:    


"Если вы строите модель анализа, например, экстремистских высказываний и пытаетесь найти каких-либо “левых или правых товарищей”, то первым в этой выборке будет Милонов. Вторым — Энтео или какой-нибудь еще фанатик.

В целом история с поиском публичных призывов к экстремистским действиям — глупость несусветная. Это не поможет делу, а только увеличит число людей, посаженных за репосты"


Технология распознавания лиц успешно используется в России последние несколько лет абсолютно в разных целях. Она позволяет, например, быстро анализировать страницы пользователей и выявлять связи между ними (кто с кем общается, где проводит много времени). 


2. Реклама

Большие данные широко используются для персонализированной рекламы. Эксперт по интернет-исследованиям Федор Вирин отметил: 


"Пользовательские данные для рекламы — не просто главный инструмент повышения эффективности, а, по сути, единственный. Он уже полностью поменял рекламу не только в онлайне, но и в офлайне"


Если у маркетологов, например, есть задача найти всех владельцев BMW в Москве, программы собирают фото и публикации горожан, проверяют, кто из них зарегистрирован в автомобильных пабликах и форумах, кто “напрямую” писал, что владеет BMW. После этого эксперты подбирают под них рекламу. Артур Хачуян пояснил: 


"Например, вы узнали, что некий Леша Иванов женат, пару лет назад у него родился ребенок, а на прошлой неделе он купил автомобиль. Когда он зайдет в ваш интернет-магазин, система автоматически предложит купить детское автомобильное кресло"


С помощью систем анализа Big Data можно, например, в кратчайшие сроки определить марки алкоголя, с которым фотографируются миллионы пользователей, чтобы сделать для них персонализированную рекламу. Впрочем, выборка не всегда будет точной: далеко не все постят фото горячительного. 


С распознаванием лиц в общепитах и магазинах тоже не все так просто. Сначала необходимо получить разрешения на съемку, сбор, анализ и передачу личных данных. Подобные технологии пытаются внедрять в некоторых супермаркетах, но широкого распространения, по словам Хачуяна, они не получили. 

Есть и другие способы узнать, что нравится посетителям. Например, некоторые магазины устанавливают в залах тепловые камеры, благодаря которым можно определить, у каких полок останавливались покупатели.  

image

-
-

3. Медицинское страхование

Допустим, некий Сергей платит за медицинскую страховку 50 тысяч рублей в год, а Федор — 500 тысяч. Думаете, первый умеет договариваться или просто дал нужному человеку взятку? Как бы не так. Просто благодаря большим данным сотрудники страховой компании знают, что Сергей бегает по утрам и соблюдает диету, а Федор пьет каждый день пиво, прыгает с парашютом и выкуривает по пять пачек в день. 

По словам Хачуяна, его компания помогает рассчитывать стоимость страховки: 


"Пользуясь стандартной медицинской статистикой, мы знаем, что, например, мужчины 40-45 лет — в группе риска по сердечным заболеваниям. Если мы находим информацию, что, человек курит и занимается экстремальным вождением, то стоимость его страховки вырастет"


4. Прогнозирование митингов и революций

С помощью Big Data можно прогнозировать революции и другие социальные потрясения, причем, по словам Хачуяна, с весьма высокой долей вероятности. Если люди собираются выйти на митинг, то это легко отследить даже обычным пользователям интернета. Возникает вопрос: почему не использовали технологии анализа Big Data для предотвращения “оранжевых революций” по всему миру?  

image

-
-

Российские госорганы уже давно используют большие данные для анализа текущей ситуации и прогнозирования будущего. Например, в этом году компания Хачуяна проводила для них исследование. Во время митинга “Он вам не Димон” она собирала публичные фотографии людей, распознавала лица и строила граф связей. Перед компанией поставили задачу: проанализировать, кто пришел на митинг, сколько там было школьников и так далее. 

А недавно, по словам Хачуяна, к нему обратились представители Центризбиркома с просьбой предсказать число людей, которые придут на следующие митинги. Хотя анализ больших данных позволяет выявлять множество закономерностей и тенденций в поведении людей, пока сложно судить, насколько точным будет этот прогноз. 

умеем отправлять интересные дайджесты на почту раз в неделю

введите чей-нибудь мэйл

Сайт использует IP адреса, cookie и данные геолокации Пользователей сайта, условия использования содержатся в Политике по защите персональных данных.

© 2018 This Is Media

Издание «ThisIsMedia» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций ( Роскомнадзор ) 20.07.2017 за номером ЭЛ №ФС77-70378
Учредитель: ООО "ОрденФеликса", Главный редактор: Суслопаров С. А.

Для лиц старше 18 лет