Новости раздела

Аркадий Волож, «Яндекс»: «Когда мы начинали «Алису», то думали, еще один эксперимент, «демонстрашка»...»

Компания научила искусственный интеллект по голосу покупать пиццу и ставить музыку с фильмами

На ежегодной конференции Yet another conference 2018 в Москве «Яндекс» презентовал свою первую умную колонку и новый сервис для оказания услуг — в обоих разработках «спряталась» «Алиса». Теперь она не только помогает найти информацию и болтает с человеком, но и может заказать пиццу, устроить на курсы изучения иностранных языков и включить фильмы и музыку, название которых даже не обязательно вспоминать — умная система по описанию все найдет сама. Корреспондент «Реального времени» по приглашению «Яндекса» посетила конференцию компании и одной из первых узнала о новых разработках.

«Полгода назад мы увидели, что у нас в руках чудо»

Основной темой конференции «Яндекса» Yet another conference 2018 стали возможности искусственного интеллекта, с которым так или иначе были связаны все представленные новые разработки компании. Сооснователь и руководитель «Яндекса» Аркадий Волож на сцене многотысячного московского стадиона больше походил на суперзвезду или американского бизнес-тренера, собравшего народ на своем выступлении. Но говорил он немного, выступая скорее в качестве модератора и поочередно давая слово своим сотрудникам.

Подводя разговор к презентации разработок компании, он начал рассуждать на тему того, как каждое прогрессивное новшество сначала воспринимается как чудо, но впоследствии становится обыденностью. Телефон, поисковые системы, онлайн-заказ такси, навигационные системы — изначально, по его словам, все эти разработки вызывали массу критики, но впоследствии люди даже перестали задумываться об их использовании — это стало обыденностью.

— Потом мы поняли, что у нас в кармане, вообще-то, пульт управления материальным миром. Нажимаешь на кнопку — и пум, у тебя появилась еда. Пум! — тебе привезли товар. Пум! — и полторы тонны железа и пластмассы подъезжают к подъезду. Техническое чудо! — на публику удивился спикер и начал подшучивать над теми, кто вечно недоволен качеством новых технологий: — Но не работает — я вызвал такси, и оно подъехало к другому подъезду. И вообще, меня не туда увезли. Прошло пять лет. Кто помнит, как мы голосовали? Где сейчас это все? — обратился к толпе глава «Яндекса».

Основной темой конференции «Яндекса» Yet another conference 2018 стали возможности искусственного интеллекта

Спустя несколько минут к Воложу присоединилась голосовой помощник «Алиса».

— Когда мы ее начинали, года два назад это было, то думали, что вот, еще один эксперимент, демонстрашка такая, искусственный интеллект. Мы покажем, как он работает с текстами, как прекрасно справляется с пониманием несложных кейсов. Прошло некоторое время, и полгода назад мы увидели, что у нас в руках чудо. Инженеры это поняли сразу — оно работает так, как никто от него не ожидал, — признался руководитель компании. И констатировал: чудо стало возможным.

— В общем, все прошло довольно гладко. Ее приняли хорошо. Это было для нас удивительно. Первый раз, когда процесс пошел не по плану, — произошло чудо, и оно не не работает, — пошутил Волож и предложил директору по технологиям «Яндекса» Михаилу Парахину рассказать, что же там, внутри у «Алисы».

Топ-менеджер компании начал с технологий, которые отвечают за распознавание голоса. Это происходит благодаря разработке SpeechKit, благодаря ей в середине прошлого года «Алиса» превзошла человека и начала распознавать непонятные ему слова. Например, речь маленьких детей. Это стало возможно благодаря тому, что разработчики голосового помощника собрали один миллиард готовых сообщений — это три года непрерывного звучания. За формирование ответа отвечает технология Turing. Она анализирует несколько параметров, учитывая предыдущую историю общения с человеком и всю имеющуюся о нем информацию. Ответ же произносится с помощью технологии Text to Speech — не сразу, но разработчики пришли от безэмоционального, роботизированного голоса к живому, человеческому. Сначала голос «Алисы» был собран из слов, потом из более чем миллиона фонем. Но в компании остались недовольны результатом, поэтому речь стали собирать из фонем с последующим прохождением по ним нейросетью.

Сначала голос «Алисы» был собран из слов, потом из более чем миллиона фонем. Но в компании остались недовольны результатом, поэтому речь стали собирать из фонем с последующим прохождением по ним нейросетью

«Алиса» научилась заказывать пиццу

Дальше в «Яндексе» задумались, как сделать «Алису» полезной. И сделали. Директор по искусственному интеллекту Михаил Биленко представил новую платформу компании — «Яндекс.Диалоги», которая стала доступна для скачивания с сегодняшнего дня. В новой платформе можно подключить бота, который становится аналогом голосового помощника «Алиса».

— Все люди, пользующиеся «Алисой», могут с вами поговорить. Бывают запросы, на которые не сможет ответить бот. И тогда необходим оператор. Через «Яндекс.Диалоги» вы сможете подключить и операторов, и ботов. Это первая гибридная платформа навыков, — рассказал Биленко.

Сейчас в платформе содержатся несколько тысяч навыков. С помощью голосовых команд там можно заказывать пиццу, учить иностранные языки и даже договориться о спортивной тренировке. Система постоянно учится и запоминает историю общения с человеком, поэтому впоследствии, например, она в первую очередь будет предлагать ту пиццу, которую обычно заказывал человек. Операторами могут являться любые компании — бот сам с ними связывается и, узнав предпочтения своего владельца, заказывает для него эти услуги или переводит на необходимый сайт, их оказывающий (например, для изучения языков он связывается с онлайн-школой Skyeng). Сейчас оплата требует подтверждения и производится с помощью банковских карт, данные которых сохранены в системах. Но в будущем саму процедуру планируют облегчить.
Еще одну новость «Яндекса» объявил глава Sony Mobile Russia Шиничи Танака. Он рассказал, что «Алису» интегрировали в их наушники. Такая опция будет доступна по всему миру после установки приложения «Яндекса». Голосовой помощник поможет при навигации за рулем, написании сообщений или с включением любимой музыки. Правда, так как система разговаривает только на русском, иностранцы ею воспользоваться не смогут.

«Яндекс» представил свою первую «железку»

Таким образом, теперь, помимо смартфонов и машин, «Алиса» поселилась и в наушниках. Впрочем, Аркадий Волож констатировал: и этого им мало. В результате того самого «мало» родилась еще одна разработка, которая вызвала, пожалуй, самый большой интерес на конференции.

— «Яндекс» — компания софтверная. Поэтому я с большим трепетом представляю первую «железку», сделанную в «Яндексе», — анонсировал Волож мультимедийную платформу со встроенной «Алисой» под названием «Яндекс.Станция».

Константин Круглов рассказал, что умная система подключена к «Яндекс.Музыке», в которой заложено более 35 млн композиций

Генеральный конструктор станции Константин Круглов рассказал, что умная система подключена к «Яндекс.Музыке», в которой заложено более 35 млн композиций. Она включается с помощью голоса — «Алису» можно попросить сделать погромче, потише, поставить на паузу или подобрать музыку под свое настроение. Технология распознает голос человека даже при громком звучании музыки. Кстати, на монополию использования своей разработки компания не претендует — в «Яндексе» уверяют, что они открыты к обсуждению и партнерству. Эту станцию также можно подключить к платформе «Диалоги», чтобы заказывать услуги через умную колонку. Пока каждую покупку нужно будет подтверждать через приложение — компаньон станции. В дальнейшем в разработку планируется внедрить функцию распознавания голоса, чтобы дети не смогли без ведома родителей совершать различные покупки.

Еще одна функция колонки — это ее подключение к ТВ без дополнительных приспособлений — пульт системе не нужен, поскольку она управляется голосом. К «Яндекс.Станции» подключены все крупнейшие онлайн-кинотеатры, и для включения фильма ей не понадобится даже точное название киноленты — по приблизительному описанию она найдет фильм сама. Или же у нее можно попросить поставить ужастик или комедию — умная система сама подберет что-нибудь подходящее. Громкость звука также регулируется голосом, а в процессе работы «Алиса» шутит и разговаривает с человеком. Кроме того, в настройках станции есть три режима работы, предусмотренные специально для детей, — семейный, умеренный и свободный. Таким образом, и аудио и видео будет фильтроваться в зависимости от настроек.

В планах у разработчиков — научить колонку включать аудиокниги и управлять телевизором для просмотра каналов. Думают в компании и над тем, как сделать так, чтобы несколько станций могли работать в связке.

Дизайн колонок разрабатывала калифорнийская студия, а производят их в китайском городе Шэньчжэне. Когда «Яндекс.Станция» станет доступна для пользователей, до конца не понятно, но в компании дали понять, что это произойдет в ближайшее время — в начале лета. Колонки будут продаваться в двух цветовых решениях и по достаточно приемлемой цене в 9 990 рублей. Впрочем, в крупных розничных и онлайн-сетях их найти не получится — новинка появится только в «Яндекс.Маркете». Каких продаж ждать от разработки, в «Яндексе» предположить пока не решились, но уточнили, что их производство выстроено гибким образом, поэтому в зависимости от спроса они смогут регулировать количество выпускаемых колонок.

«Мы не делимся данными никогда и ни с кем»

Разработчики колонки обещают, что она не будет шпионить за людьми. Подобный вопрос оказался весьма актуальным, ведь только недавно стало известно, что умная колонка Amazon записала разговор семейной пары и сама отправила его человеку из списка контактов.

— Дело в том, что сейчас, безусловно, есть фокус на предотвращение утечек пользовательских данных, и вообще чувствительность к этой сфере во всем мире возросла. Поэтому мы пошли на несколько технологических решений, чтобы предотвратить истории, похожие на «амазоновскую», — дал комментарий на пресс-конференции после основной сессии Михаил Парахин.

Он рассказал, что после нажатия кнопки Mute питание у колонки отключается и система «не слышит» людей.

Не без гордости Парахин напомнил и о том, что их компания делает все возможное для сохранения персональных данных.

— «Яндекс» этим знаменит — как вы знаете, мы не делимся данными никогда и ни с кем. Ни с нашими бизнес-партнерами, ни с нашими коллегами. Если есть решение суда — то, наверно, тогда делимся. В других случаях данные пользователей никогда не даем, — заверил журналистов спикер и даже рассказал, что у них в офисе везде висят плакаты с напоминанием: персональные данные нужно защищать!

Мария Горожанинова, фото и видео автора
ТехнологииITТелекоммуникации

Новости партнеров