Новости раздела

Устройства Силиконовой долины: апгрейд поисковиков, предки Терминатора и персональные исполнители желаний

Мир гаджетов в центре мировых IT-технологий. Часть 3: эпоха больших данных и искусственного интеллекта

Джинны, исполняющие желания людей, становятся реальностью. Правда, круг их возможностей пока весьма ограничен, и выглядят они не как в восточной сказке. Протороботы будущего Терминатора или Wall-E появляются уже сейчас. А ответ практически на любой вопрос мы может узнать в Google или «Яндексе», которые заметно эволюционировали за последние годы. Колумнист «Реального времени» Александр Галкин, работающий в Силиконовой (Кремниевой) долине, в своей новой колонке продолжает начатую им тему об IT-новинках, которые мы можем увидеть в скором времени.

Эпоха больших данных смена парадигмы поиска

Количество информации в цифровом виде, так или иначе доступной нам, увеличивается в экспоненциальной прогрессии: карты почти всего земного шара доступны через Bing Maps или Google Maps, фото улиц, планы многих зданий и учреждений доступны в Google Street View или Bing StreetSide View. Google сумел отсканировать порядка 25 миллионов книг и предоставляет к ним частичный доступ в рамках проекта Google Books. Википедия содержит более 5 миллионов статей в английском разделе и 1,3 миллиона статей в русском разделе.

Информации становится все больше и больше, размер всех сайтов интернета постоянно увеличивается. Раньше пользователи искали в глобальной паутине ресурсы (документы, картинки, медиа-файлы), которые бы помогли им ответить на вопросы или решить стоящие перед ними задачи. Например, если нужно было узнать, в каком году умер Михаил Булгаков, то сначала нужно было найти страницу с биографией писателя, а потом на ней, пользуясь поиском текста на странице, уже искать информацию о его смерти. А вдруг найденная страница с биографией была неполной? В этом случае продвинутые юзеры использовали специальный язык запросов, чтобы найденная информация содержала и биографию писателя, и информацию о его смерти.

Появление Википедии как проекта значительно облегчило такой поиск. Если раньше нужно было просматривать несколько сайтов в поиске биографии, и некоторые биографии могли представлять из себя толстые книги, в которых не так просто сразу найти тот факт, что ты ищешь, то Википедия стала универсальным источником знаний по любому предмету, излагая их в тезисной, энциклопедической форме. Найдя нужную статью на этом ресурсе (если эта статья достаточно хорошего качества), можно быстро найти самые важные факты.

Однако постепенно наши потребности стали выше, информации стало больше, а мы стали ценить свое время. Поэтому сейчас пользователи поисковых систем все больше хотят получить от поиска не ссылку на страницу, где содержится нужная информация, а ответы на его вопросы. И действительно, попробуйте поискать в «Яндексе» «когда умер Булгаков» — кроме ссылок, «Яндекс» (как, впрочем, и другие поисковики) покажет вам сразу нужную дату. Это называется «ответ», то есть способность поисковой системы не просто понять запрос, но и предоставить нужную информацию в готовом виде. Современные поисковые системы сегодня способны ответить уже на довольно много вопросов — поэкспериментируйте на досуге.

Персонификация искусственного интеллекта (ИИ)

С того момента, как поиск информации эволюционировал в поиск ответов на вопросы, эволюционировали и сами системы поиска. Теперь их задачей стало не только найти информацию, но и по возможности структурировать ее так, чтобы суметь ответить на вопросы по ней. Подобно роботу-библиотекарю из произведений Айзека Азимова, который прочитал все книги и мог давать рекомендации, исходя из любых предпочтений пользователей.

Чтобы сделать искусственный интеллект ближе к рядовым пользователям, был использован трюк из фантастических произведений, где продвинутый интеллект в будущем представлен в виде человекоподобного образа.

Конечно, это не образ Терминатора или даже не Wall-E — хотя оба этих персонажа на порядки превосходят по своим возможностям современные версии ИИ. Одним из пионеров здесь была компания Apple, встроившая в свои телефоны «умного помощника-секретаря» Siri. С момента рождения Siri умела понимать довольно сложные команды, сформулированные на обычном английском языке, как, например, «напомни мне позвонить завтра мистеру Брайту по поводу засорившейся трубы» или «создай напоминание каждую среду в 3 часа», была способна искать информацию в интернете и отвечать на определенный круг вопросов («который час?», «кто сейчас президент США?», «стоимость акций Facebook?» и так далее) на английском языке.

Хотя Siri и требует для большей части своих функций постоянного соединения с интернетом (для более точного распознавания речи и анализа запроса), ряд простых команд доступны и без этого. Да и (относительно) безлимитный мобильный интернет, как я уже писал раньше, стал гораздо более доступен.

Вслед за Apple своего помощника представила и компания Microsoft — персонаж из популярной серии игр Halo для приставки Xbox, девушка по имени Cortana. Учитывая, что Microsoft уже имела перед собой пример Siri, в Cortana был сделан упор на более продвинутый интеллект. Cortana с самого начала использовала координаты в качестве базовых данных, позволяя пользователям, например, отдавать такие распоряжения: «когда я приду домой, напомни мне включить духовку» или «когда я снова буду в этом магазине, напомни мне купить мешки для мусора».

Cortana также с самого начала умела понимать и отслеживать контекст, так, например, после запроса «покажи мне список китайских ресторанов около меня» можно спросить «а какие из них открыты сейчас?», и Cortana отфильтрует из списка те рестораны, которые сейчас закрыты.

Это существенно расширило спектр возможных сценариев и положило начало гонке искусственных интеллектов, к которым, кроме Siri и Cortana, также примкнул безымянный интеллект от Google, называемый Google Now, а также, сравнительно недавно, Alexa от компании Amazon.

Если Siri доступна эксклюзивно только на телефонах от Apple, то другие помощники можно установить в виде приложений на любые мобильные системы. Кроме того, Cortana теперь встроена и в версию Windows для обычных компьютеров и умеет здесь искать информацию не только в Интернете, но и в файлах и документах пользователя.

Про-активность и персонализация упреждение желаний пользователя

Однако ответ на вопрос пользователя — это только начало. Настоящий «умный помощник» должен уметь не только отвечать на заданные вопросы, но и предвосхищать их. На языке техники это называется «про-активные возможности» (pro-active features).

Для того, чтобы уметь угадывать желания и потребности пользователя, необходимо знать о нем больше, чем просто его интернет-адрес (который нужен для отображения информации в браузере). Чем больше мы знаем о пользователе, тем больше у нас возможностей для прогнозирования того, что ему может понадобиться.

Самым простым источником информации является календарь пользователя, который обычно полностью синхронизован на мобильном устройстве, где и работают приложения-помощники. Так, все три крупных «интеллекта» (Cortana, Siri, Google Now) умеют автоматически извлекать информацию о встречах пользователя из мобильного календаря, включая место встречи и показывают предупреждение за 10-15 минут до того, как нужно выехать с учетом ситуации на дорогах.

Кроме того, они способны читать вашу почту (соблюдая при этом приватность, что в данном случае означает, что информация, полученная ИИ, не будет использована для какой-либо другой цели, например, показа более подходящей рекламы и так далее) и, найдя информацию о билетах на поезд, самолет или концерт, правильно показывать ее: скажем, при поиске рейса Сан-Франциско — Франкфурт будет показано не просто расписание рейсов, но и также указан отдельно тот рейс, электронный билет на который есть у вас в почтовом ящике. Аналогичным образом для писем, в которых содержится информация о трекинге почтовых сообщений, эта информация будет извлечена и показана при правильном поисковом запросе.

Про-активность — одна из самых технически сложных задач для ИИ, которая требует анализа большого количества данных для конкретного пользователя и хранения этой информации в таком виде, чтобы получить к ней доступ за миллисекунды, отведенные на поиск ответа на вопрос. Это выдвигает серьезные требования к времени доступа и, учитывая объем, требует довольно серьезных затрат — именно поэтому эта особенность стала возможной только относительно недавно.

К сожалению, размеров этой колонки не хватило, чтобы поведать об обещанном роботе-юристе, но я обязательно расскажу о нем в следующий раз.

Александр Галкин
Справка

Галкин Александр Владимирович — инженер-разработчик в компании Microsoft; администратор и бюрократ «Википедии» на языке эсперанто; полиглот.

  • Родился 26 февраля 1979 года в Казани.
  • В 1996 году окончил с золотой медалью казанскую гимназию №102.
  • В 2002 году с красным дипломом окончил педиатрический факультет Казанского государственного медицинского университета.
  • С 2002 по 2005 годы работал в Институте нейробиологии в Берлине.
  • В 2012 году окончил Технический университет Гамбурга.
  • С 2013 года работает в компании Microsoft инженером (Software Development Engineer) в подразделении поисковика Bing. Офис расположен в Sunnyvale, Калифорния.
  • Свободно владеет русским, татарским, английским, немецким, французским и эсперанто. Также разговаривает на итальянском и испанском языках.
  • Автор статей на различные темы на habrahabr.ru, geektimes.ru, pikabu.ru. Колумнист «Реального времени».

Новости партнеров