«Скоро разговор с роботом в call-центре будет эффективнее общения со специалистом банка»

07:00, 30.11.2017

Большое цифровое регулирование: как законодательство может отнестись к Big Data

Big Data или большие данные сами по себе — не новость, их используют органы статистики, социологи, компании с большими клиентскими базами. Однако алгоритмы и мощности для их обработки с использованием машинного обучения появились сравнительно недавно и продолжают изменяться и совершенствоваться. Как изменит ИИ и Big Data банковскую индустрию и как это может регулироваться государством, обсудили эксперты в ходе дискуссии, организованной Ассоциацией российских банков. Подробности — в репортаже «Реального времени».

Что такое Big Data?

Предмет обсуждения оказался непростым. Законодательство отстает от новых технологий, в нем еще нет однозначного определения искусственного интеллекта, больших данных, судебные прецеденты по теме также весьма скудны. В начале дискуссии президент Ассоциации российских банков, член-корреспондент РАН Гарегин Тосунян высказался об инициативе принятия закона, регламентирующего отношения людей и роботов:

«Мы еще до конца не понимаем проблему, но уже берем на себя смелость урегулировать эти отношения. Кто будет потребителем — роботы или люди, которых мы будем защищать от роботов?».

Академик РАН, заместитель директора Федерального исследовательского центра «Информатика и управление» РАН Константин Рудаков согласен с тем, что «само понятие «Большие данные» плохо формализовано». Эксперт предлагает считать данные «большими», исходя из задач и ресурсов для их обработки. Очевидно, считает академик, что сложить миллион чисел на листе бумаги для человека — уже работа с большими данными, тогда как компьютер справится с ней за несколько секунд.

По мнению Рудакова, большие данные, как правило, используются для решения очень простых задач, зачастую сводимых к вопросу на «да» или «нет». Поток данных эксперт назвал «катастрофическим» и призвал при их сборе и обработке руководствоваться «минимальным достаточным количеством» для решения конкретной задачи. «Данные — это сырье, которое к тому же быстро устаревает».

При этом сами данные часто находятся в открытом доступе и представляют невысокую коммерческую ценность. Гораздо больший вызов, по мнению Рудакова, и гораздо больший вопрос для потенциального регулирования и защиты — методы их обработки и задачи, для которых они обрабатываются: «Вы можете накачать из интернета терабайты, но ценность будет иметь то, что вы умеете делать с этими данными. И даже знание о том, что вы умеете что-то делать с данными, может быть ценнее, чем сами данные».

Гарегин Тосунян: «Мы еще до конца не понимаем проблему, но уже берем на себя смелость урегулировать эти отношения. Кто будет потребителем — роботы или люди, которых мы будем защищать от роботов?». Фото tsargrad.tv

Восстание ИИ — лукавство фантастов

Доктор физико-математических наук, руководитель лаборатории Федерального исследовательского центра «Информатика и управление» РАН Михаил Забежайло, рассуждая об искусственном интеллекте, предложил его рассматривать как ассистента, а не как систему для принятия решений. «Нести ответственность за эти решения все равно будет человек», — отметил эксперт.

Забежайло также указал на размытость формулировок обсуждаемого вопроса — то, что сейчас принято называть искусственным интеллектом, на самом деле — системы машинного обучения, поскольку не соответствуют определениям ИИ, сформулированным еще в середине прошлого века.

«Что регулировать? Мы из телевизора постоянно слышим заклинание, что грядет нашествие роботов, что искусственный интеллект всех погубит. С точки зрения профессионала, здесь есть некоторое лукавство. ИИ — это некое устройство, которое программирует человек, и пользователю эти программы полностью понятны и прозрачны. «Черный ящик» — недопустим», — объяснил Михаил Забежайло.

Большие персональные данные

В интернете содержится огромное количество персональных данных, доступ к которым никак не ограничен — соцсети. Банки уже научились использовать их, обрабатывая огромные массивы информации. По лайкам и репостам можно составить настолько детальный портрет клиента, что на этом основании банк может принять решение о выдаче или отказе в кредите. Например, Сбербанк анализирует заемщиков подобным методом, в совокупности с классической оценкой кредитоспособности.

Доктор юридических наук, президент IP CLUB, профессор Университета им. О.Е. Кутафина (МГЮА) Марина Рожкова предложила разграничить сами данные и их использование: «Когда мы говорим о больших данных, мы говорим не о сырых исходниках, а о том, как они будут использоваться. Именно это с точки зрения права представляет ценность».

Сфер использования данных немало: страхование, торговля, медицина. При этом юрист отметила, что одни и те же данные могут использоваться совершенно по-разному. «Если 2000 лет назад появлялась какая-то информация, то она использовалась только по прямому назначению. Сегодня мы можем получить большие данные, выворачивать их при помощи разных алгоритмов, совершенно для своих частных целей».

Рожкова рассказала о судебном прецеденте, когда данные соцсети «ВКонтакте» использовались Национальным бюро кредитных историй для создания кредитного портрета потенциального заемщика. Соцсеть считала, что располагает эксклюзивным правом на данные пользователей, и подала на НБКИ в суд. Дело закончилось мировым соглашением — не признавая иск, НБКИ заявило, что не будет распоряжаться данными в нарушение законодательства. При этом суд отметил, что все компании могут распоряжаться данными, которые находятся в открытом доступе.

Во время дискуссионной части Михаил Забежайло акцентировал внимание на том, что даже если признать право чьей-либо собственности на большие данные, защитить их будет крайне сложно и дорого. В отличие от методов и алгоритмов их анализа — этот вопрос еще следует изучить.

Заместитель генерального директора SAP СНГ Дмитрий Красюков отметил, что пока в дата-центрах образуются своего рода «пробки», поскольку мало кто понимает, что делать с Big Data. А объем информации растет и требует развития систем ИИ и машинного обучения. Однако весьма скоро, уверен Красюков, разговор с роботом в call-центре компании будет эффективнее разговора со специалистом.

Что регулировать?

Дискуссии о работе с информацией, защите персональных данных и проблемах Big Data только начинаются. Развитые системы машинного обучения уже могут извлекать из больших массивов нетривиальные решения. Пример: отказ в выдаче кредита из-за не понравившихся роботу репостов. Однако участники разговора в АРБ в целом солидарны в том, что сами большие данные бессмысленно пытаться защищать от кражи или использования третьими лицами. Регулированию, когда до него дойдут инертные правовые системы государств, будут подлежать, вероятно, методы обработки и задачи анализа самих данных.

Как будут урегулированы отношения человека и робота в правовом поле, участники дискуссии придумать не смогли. Однако с технически правильным искусственным интеллектом, по мнению Михаила Забежайло, и не будет проблем. По крайней мере до тех пор, пока система не принимает решения сама, а лишь дополняет интеллект специалиста.

Дмитрий Щипанов, фото автора

Технологии IT Экономика Банки