Войти
background

Веб-портал башкирско-русского и русско-башкирского переводчика

Организация: Фонд по сохранению и развитию башкирского языка

Приоритетное направление проекта

Сохранение и развитие государственных языков Республики Башкортостан и языков народов Республики Башкортостан в сферах культуры, образования, науки, средств массовой информации
и молодежной политики, а также башкирского языка за пределами Республики Башкортостан:

Запрашиваемая сумма на проект

2 500 000 рублей.

Цель проекта

Разработка веб-портала башкирско-русского и русско-башкирского переводчика.

Краткое описание проекта

Проект направлен на создание башкирско-русского и русско-башкирского переводчика для населения в виде веб-сервиса.
Решение поставленных в рамках проекта задач: накопление параллельных обучающих корпусов данных, разработка методов искусственного расширения обучающих данных, внедрение структурно-функциональной модели морфем, а также создание программных средств обучения машинного переводчика на основе современных нейросетевых подходов - будет способствовать решению актуальных и значимых задач по сохранению, развитию и популяризации государственных языков в Республике Башкортостан, а также расширению присутствия башкирского языка в Интернет-пространстве. Кроме того, реализация проекта будет способствовать активному развитию информационных технологий в Республике Башкортостан и послужит паритетному функционированию государственных языков Республики Башкортостан.

Ожидаемые результаты проекта

По итогам реализации проекта будет создан веб-портал (сайт), который будет обладать функцией перевода текстов с русского на башкирский и с башкирского на русский язык. Ожидаемое число уникальных посетителей сайта в период реализации проекта составит 50 000 человек, в последующий период работы сайта среднее число посещаемости составит от 30 000 до 50 000 пользователей в месяц. Благодаря пользовательской активности веб-портал способен самообучаться и исходя из запросов пользователей предлагать более качественные переводы текстов.
Создание веб-портала перевода текстов приведет к существенному улучшению языковой ситуации в Республике Башкортостан, а также улучшению позиций башкирского языка в мире в целом.
Реализация данного проекта в последующие годы позволит существенно расширить сферы применения башкирского языка, употребления в современном информационном, образовательном и культурном пространстве, укрепит позиции и расширит социальные и культурные функции башкирского языка.

Информация о ходе реализации проекта

02 апреля 2021 00:00

Башҡорт телен һаҡлау һәм үҫтереү фонды башҡортса-русса, русса-башҡортса тәржемәсе веб-сайт проекты эшләй

Башҡортса-русса һәм русса-башҡортса тәржемәсеһенең башҡорт текстарын яңғыратыу функционалы менән веб-сайтын булдырыу Башҡортстан Республикаһы һәм Рәсәй Федерацияһы масштабында ғына түгел, сит ил масштабында ла башҡорт телен популярлаштырыуға, һаҡлап ҡалыуға һәм үҫтереүгә ярҙам итеүсе төп проекттарҙың береһе булып тора һәм әлеге ваҡытта был сервисҡа тиң аналог юҡ.

Проект Веб-сайт Тatsoft акционерҙар йәмғиәте менән берлектә эшләнелә һәм 2020 йылда Башҡортостан Республикаһының Граждандар йәмғиәтенә булышлыҡ итеү фонды үткәргән Башҡортостан Башлығы грантының еңеүсеһе тип табылды.

Веб- сайт ҡыҫҡаса "БашҡортСофт" тип атала: https://bashkortsoft.ru/
Тәржемәсе эсенә әлеге ваҡытта 500 000 параллель текст индерелгән. Матур, хатаһыҙ тәржемә өсөн 1000 000-ға яҡын текст кәрәк.
Әлеге ваҡытта БашФонд был бурыс өҫтөндә эш алып бара.

#БашФонд #ФСГОРБ
 
07 декабря 2020 00:00

БАШҠОРТ ТЕЛЕ: ЯҢЫ ҠАРАШ 2.0

12 декабря в 17:20 ч. в ивент-холле «Сердце» Арт-квадрата пройдет мероприятие «Башҡорт теленә яңы ҡараш. Новый взгляд на башкирский язык», в рамках которого будут представлены презентации проектов по популяризации башкирского языка. Мероприятие пройдет в оффлайн и онлайн форматах: в условиях пандемии короновируса невозможно собрать всех желающих на одной площадке. Непосредственное участие примут авторы и разработчики проектов, лидеры общественного мнения, а для широкой аудитории будет организована прямая трансляция в эфире телеканала БСТ и в социальных сетях.

В ходе мероприятия участникам расскажут о новом Веб-портале башкирско-русского и русско-башкирского переводчика, мобильных приложениях для изучения башкирского языка, о новых проектах бренда прогрессивно развивающейся молодёжи «Аҫылташ» и мн. др.

Организатором мероприятия является Фонд по сохранению и развитию башкирского языка. Специальный гость – молодой кураист Юлай Касимов.

#БашФонд
 
16 октября 2020 00:00

"Веб-портал башкирско-русского и русско-башкирского переводчика" Что сделано на данный момент?

"Веб-портал башкирско-русского и русско-башкирского переводчика"
 
Проект Фонда по сохранению и развитию башкирского языка "Веб-портал башкирско-русского и русско-башкирского переводчика" был высоко оценен экспертами  Фонда содействия гражданскому обществу РБ и стал победителем гранта главы Республики Башкортостан на сохранение и развитие государственных языков республики и языков народов Башкортостана.
 
В рамках проекта Фонд по сохранению и развитию башкирского языка заключил соглашение с АО «Tatsoft» на создание башкирско-русского и русско-башкирского переводчика  для населения в виде веб-сервиса. Ими уже разработан «Tatsoft» проект https://translate.tatar/, и по словам разработчиков, данный переводчик на сегодняшний день является лучшим русско-татарским переводчиком в мире.

Что сделано на данный момент?

1. Совместно с экспертами и волонтерами, занимающимися поддержкой развития башкирского языка, сформирован перечень основных источников для создания и пополнения корпуса параллельных текстов на башкирском языке.

2. Разработаны автоматические средства “выравнивания по документам”, позволяющие находить в архиве данных веб-сайтов пары новостей на русском и башкирском языке. Данная работа до этого осуществлялась вручную и требовала большого количества времени. Созданный алгоритм проводит преобразования башкирского текста на основе гибридных моделей перевода, а затем рассчитывает метрику схожести документов на башкирском и русском языках для поиска наиболее соответствующих друг другу документов.

3. Разработан комплекс программных средств для обработки текстов на башкирском языке. Комплекс включает множество модулей, необходимых для фильтрации текста, работы с различными форматами данных параллельного корпуса, унификации используемых символов, удаления дубликатов предложений. Было разработано автоматизированное рабочее место лингвиста, позволяющее ускорить ручную работу по редактированию текстов из энциклопедических источников. В состав комплекса также включен метод “выравнивания по сегментам”, позволяющий на основе пар русско-башкирских документов сформировать параллельный корпус, необходимый для обучения нейросетевой модели переводчика.

4. На основе собранных в 2020 году параллельных данных произведено обучение ансамбля из 8 нейросетей, демонстрирующего наилучшее качество распознавания. Продолжение работ по дальнейшему накоплению параллельных данных в 2021 году позволит значительно улучшить качество распознавания. Но уже на этом этапе проведенное тестирование показало высокое значение качества перевода для текущего объема обучающих данных.

#БашФонд #ФСГОРБ