Новости раздела

«Корпорации, понятно, против так называемых миноритарных языков. А государства?»

Колонка компьютерного лингвиста о том, почему марийскую раскладку клавиатуры не найти в госучреждениях

Сохранение и развитие языков народов России не исчерпывается преподаванием в школе. Каждый день мы пользуемся смартфонами и компьютерами, поэтому цифровое пространство — еще одно направление, где идет работа по обеспечению равных прав всех языков. Андрей Чемышев, сотрудник Марийского НИИ языка, литературы и истории им. В.М. Васильева, написал для «Реального времени» колонку, где рассказал о том, как языки борются за достойное место в цифровом мире, что уже сделано и что мешает двигаться дальше.

Миноритарные языки не нужны корпорациям

С проблемой цифрового неравенства я столкнулся лет 10—12 назад, когда пытался размещать контент на марийском языке в сети. Оказалось, что марийские буквы, отличные от букв русского алфавита, не отображаются в браузерах большинства пользователей. Тогда самой распространенной операционной системой (ОС) в нашей стране был Windows XP, который не поддерживал юникод — международный стандарт кодирования символов всех языков мира, принятый аж в 1991 году, но игнорируемый Майкрософтом (до появления Vista) и производителем шрифтов для ОС Windows фирмой MonoType.

Потом мне в Сети попалась презентация сотрудника одной известной IT-компании, где рассказывалось, что люди, разговаривающие на 17 языках, имеют доступ почти ко всем ресурсам земного шара — вот для них и с ними можно делать бизнес, а остальные, более 6 000 языков, для корпораций не имеют какого-либо значения, прибыль не приносят, и было бы лучше, если бы их не стало вообще.

Корпорации, понятно, против так называемых миноритарных языков. А государства? Если твой язык государственный или имеет официальный статус, то да — есть шанс сохраниться и выжить в цифровых джунглях.

Из Книги для чтения на луговом наречии черемисского языка. Казань, 1910 г.

Проект по переходу на свободное программное обеспечение не оправдал надежд

Тогда, 10 лет назад, в России было решено соскочить с майкрософтовской иглы. Какие были надежды! Была разработана и апробирована в трех регионах РФ в ходе проекта НП-18 линейка отечественного программного обеспечения для школ на основе свободного программного обеспечения (СПО). Проект был признан удачным и предполагалось его обязательное внедрение во всех российских школах. И особое внимание было уделено поддержке цифровой письменности на национальных языках.

Но проект почему-то закрывают, и правительство покупает временную (!), на 3 года, лицензию для школ у Microsoft, заплатив гигантскую сумму, исчисляемую миллиардами рублей.

Потом было решено создать Национальную программную платформу и перевести на отечественное СПО все российские бюджетные и государственные организации. Но и этот проект благополучно угробили. Чиновникам оказалось выгоднее покупать проприетарное ПО, нежели пользоваться свободным и бесплатным.

Вся эта чехарда с ПО негативно сказывалась на функционировании российских языков в IT и Сети.

Проблемы для всех языков одинаковые и решаются они комплексно и поэтапно созданием базового инструментария для любого языка

Народы сами вырабатывают стратегию информатизации

В 2011 году мы с товарищами провели в Йошкар-Оле с 25 по 27 апреля международную конференцию «Языки меньшинств в компьютерных технологиях: опыт, задачи и перспективы». Были представители из Якутска, Улан-Удэ, Элисты, Сыктывкара, Ижевска, Чебоксар, Казани, Санкт-Петербурга, Москвы, также компьютерные лингвисты из ряда европейских государств. Оказалось, что проблемы для всех языков одинаковые и решаются они комплексно и поэтапно созданием базового инструментария для любого языка, включающего в себя:

  1. общедоступные шрифты и раскладки клавиатуры;
  2. свободно распространяемые электронные словари;
  3. системы проверки правописания;
  4. машинные переводчики;
  5. поисковые системы, учитывающие семантику.

Также важно: создание и развитие языковых разделов Википедии; создание электронных учебников, электронных библиотек, национальных корпусов языков, систем дистанционного обучения, синтезаторов речи, анализаторов голоса; локализация ПО, мультимедийных продуктов, игр, мобильных приложений и т. д.

На конференции было рекомендовано регионам создать центры компетенции, которые взвалят на свои плечи все проблемы, касающиеся национальной информатизации. Первым откликнулся Сыктывкар: в декабре 2011 года была создана лаборатория FU-Lab, позднее Центр инновационных языковых технологий, который работает до настоящего времени.

«Можно разработать все необходимые продукты: раскладки клавиатуры, системы проверки правописания, электронные словари и др. И ничего не внедрить из офлайн-программ!» Фото wiki.fu-lab.ru

«Дорожные карты» не работают, пока нет государственной воли

Но есть еще одна проблема. Можно разработать все необходимые продукты: раскладки клавиатуры, системы проверки правописания, электронные словари и др. И ничего не внедрить из офлайн-программ! Кроме пользователей, которые скачают и установят продукты на свой домашний компьютер. Во всех регионах есть министерства/департаменты связи и информатизации. Пока эти ведомства не напишут методические рекомендации, изменения в должностные обязанности системных администраторов и не проведут с ними семинары-занятия, ни один сисадмин не даст ничего лишнего установить в обслуживаемый им компьютер.

Например, распоряжением главы Республики Марий Эл от 9 мая 2012 года №131-РГ предписано марийские символы набирать в юникоде. Раскладка создана, она общедоступна и в Сети. Но ни на одном из компьютеров республики, которые обслуживаются сисадминами, вы не увидите эту раскладку. Нарушается статья 15 Конституции Республики Марий Эл: граждане не могут воспользоваться своим конституционным правом на использование марийского языка в компьютерных технологиях. А что Департамент информатизации и связи Республики Марий Эл? А он не против, он — за! Только ничего не делает уже более 5 лет.

Ладно, с марийским-то языком мы как-то выживем. В этом году объединенный коллектив МарНИИЯЛИ, МарГУ и Республиканского центра марийской культуры начал создавать Национальный корпус марийского языка — это единая база текстов со специальной грамматической разметкой, куда войдет все, что издано на марийском языке. В планах — разработка электронных учебных пособий для изучения марийского языка.

Хуже всего обстоят дела у языков, где буквам национальных алфавитов не присвоены юникоды: вот им напрочь закрыт доступ в единое информационное пространство, и эти языки фактически обречены на вымирание. Мы об этом говорим с 2011 года, но слышать нас не хотят. Говорим не только о наличии проблем, а предлагаем комплекс мер для их решения. Мне не хочется приводить список регионов, куда мы писали все эти аналитические записки, дорожные карты и прочее: к сожалению, все эти добрые начинания остались только на бумаге.

Андрей Чемышев
ТехнологииITМедиаОбществоКультура

Новости партнеров