Поиск по сайту
Авторизация
Зачем нужна регистрация?
Логин:
Пароль:
Регистрация
Забыли свой пароль?
Подписка на рассылку
Для сотрудников ОИПИ
Типовые документы 

просим принять участие в опросезаполнить анкету

О впервые изданном у нас орфоэпическом словаре


О впервые изданном у нас орфоэпическом словаре 26.07.2017

Возможно, мы бы и сегодня не праздновали появление орфоэпического словаря белорусского языка, если бы в подготовку не включились технари — специалисты Лаборатории распознавания и синтеза речи Объединенного института проблем информатики. Лингвисты говорят, с их помощью удалось сэкономить до 15 человеко-лет.

Над первым орфоэпическим белорусским словарем работала команда из двух институтов Национальной академии наук. От института языкознания имени Якуба Коласа — доктор филологических наук Валентина Русак и кандидат филологических наук Вероника Мандик. От Объединенного института проблем информатики — кандидат технических наук Юрий Гецевич и магистр физико-математических наук Станислав Лысый.

«НН»: Что это за технические средства?

Валентина Русак: Машина генерирует транскрипцию 117 тысяч слов с точностью 98 процентов. Человек может сбиться, машина — нет. Но прежде чем ее научить, лингвистам пришлось очень много поработать.

Вероника Мандик: Ключевое слово — алгоритм. Мы брали буквенное сочетание, например «све», и дополняли алгоритм соответствующим правилом, по которому бы машина выдавала [с’в’э]. И так по каждой позиции. Для каждого буквенного сочетания, имевшего специфику в произношении, мы прописывали правила. Были неоднозначные позиции, которые надо было выверить и обоснованно утвердить. Это большой объем лингвистической работы. А дальше уже за дело взялись наши коллеги-информатики. Они вложили эти правила в программу и создали генератор, который преобразует орфографическую запись слова в его фонетическую транскрипцию.

Станислав Лысый: Нам удалось уложить все в несколько сотен правил. Правда, нелегко было вносить в них правки, так как, пока правишь одно правило в алгоритме, пять ломаешь. Лингвисты дают какое-то правило, смотришь на него и думаешь: ну вот же оно, сейчас я его поправлю. А по ходу выправляешь одну ошибку — создаешь пять других. В итоге все как бы улучшается, но чем более узкое правило, тем сложнее его добавлять.

О том, что это за генератор, как он появился и как работает, читайте вскоре на сайте «НН».

Валентина Русак: Помню, как первый раз зашла в Лабораторию распознавания и синтеза речи. Там все разговаривают по-белорусски! Я сразу поняла, что это та аудитория, та молодежь, которая будет представлять наш язык в мире.

И не ошиблась. Франция, Англия, Испания восхищены работами белорусских программистов-лингвистов. Отдел довольно большой, там работают 20 человек. Все высокообразованные люди, увлеченные белорусским языком и заинтересованные делать все ради его популяризации в мире.

Источник: NN.BY


Возврат к списку