Google Translate Кыргызча

Что такое Google Translate и как он работает?


Подробнее о Google Translate: http://translate.google.com/about/intl/ru_ALL/

Почему ещё нет Google Translate для кыргызского языка?

Отрывок из публичного ответа Джошуа (Joshua), старшего программиста команды Google Translate:
"""
Всем привет,

Почти каждый день от пользователей и потенциальных пользователей мы слышим вопросы о том, когда будет и будет ли поддержка какого-либо языка. Мы довольно таки горды, что уже сейчас мы поддерживаем 52 языка мира, но тем не менее до сих пор осталось много языков, которые мы бы очень хотели добавить для наших пользователей.

Мы постоянно и очень много работаем над повышением качества поддержки новых языков для того, чтобы мы могли их выпустить в публичное пользование, но к сожалению добавление нового языка является очень сложной задачей. Каждый язык, который мы поддерживаем требует огромного количества информации для тренирования алгоритмов и значительного количества работы со стороны разработки программного обеспечения для того чтобы сделать этот язык доступным для вас, наших пользователей.

Так что если мы ещё не поддерживаем ваш язык значит мы наверняка над этим уже работаем. Почти всегда задерживающим фактором является количество информации для "тренировки" алгоритмов. Нам нужно большое количество параллельных данных, то есть, большое количество документов или предложений, которые уже были переведены между новых языком и одним из языков, который мы уже поддерживаем.
"""

Как помочь появлению Google Translate на кыргызском языке?

Огромнейшее спасибо вам за интерес к этой теме и за активный патриотизм!
Появление этого продукта действительно может очень сильно помочь развитию Кыргызстана по многочисленным причинам.
B что более важно, большинство действий, которые могут помочь появлению Google Translate на самом деле намного больше поможет развитию самого языка в целом
и очень позитивно повлияет и на культурную и на экономическую ситуацию в Кыргызстане в любом случае. Это, думаю, вы сами увидите при ознакомлении с советами.

Пожалуйста, учтите - я являюсь сотрудником компании Google, но я не могу давать обещаний по поводу появления сервисов,
но я очень постараюсь дать советы, которые могут помочь более скорому потенциальному появлению сервиса.

Итак, вот как можно помочь:

1) Увеличение количества "параллельных" веб-страничек на кыргызском + русском языке (или кыргызском + английском языке).

    Статистический машинный перевод "учится" на большом количестве текста уже переведённом людьми.
    На данный момент в Интернете для кыргызского языка на текущий момент, думаю, больше всего параллельного перевода с русским языком.
    На втором месте, наверное, с большим отставанием с английским (сайты зарубежных и международных организаций).

    Что можно сделать?
    
    На сайте где вы можете изменять содержание (пример: Википедия, ваш сайт и др.) переводите текущие странички с русского (или английского языка) на кыргызский,
    или если сайт на кыргызском, то переводите на русский (или английский). Подробнее об этом в других разделах.

2) Ведение учёта многоязычных страничек.

    Давайте также сохранять все многоязычные странички с наличием кыргызской версии в этой публично редактируемой таблице: 
    Это поможет для измерения размера нашей работы, поможет легче найти такие странички, учиться друг у друга и во многом другом.

3) Загрузка данных в Google Translator Toolkit.

    Инструментарий Google Translator Toolkit: http://translate.google.com/support/toolkit/bin/answer.py?hl=ru&answer=147838
    Этот инструмент тесно интегрирован с Google Translate. Он помогает переводчикам делать переводы текстов с помощью подсказок Google Translate.

    Напрямую очень сильно поможет:

    1) Загрузка ваших памятей перевода (Translation Memories или TMs)
        Что это такое и как использовать? http://translate.google.com/support/toolkit/bin/answer.py?hl=ru&answer=147863 (статья на русском)
                                                             http://translate.google.com/support/toolkit/bin/answer.py?hl=en&answer=147863 (статья на английском, более подробная)
    2) Загрузка ваших глоссариев перевода (translation glossaries)
        Что это такое и как использовать? http://translate.google.com/support/toolkit/bin/answer.py?hl=ru&answer=147859 (под "переводом глоссария" имеется ввиду "глоссарий перевода)

    Также поможет:

    3) Переводить документы с и на кыргызский с помощью Google Translator Toolkit.
        Например, очень удобно переводить существующие статьи Wikipedia, для этого там есть специальная поддержка.
        Ниже представлено видео об использовании Translator Tookit. В примере даются языки поддерживаемые Google Translate,
        но можно также переводить вручную (без подсказок Google Translate) на языках без поддержки, таких как кыргызский.


4) Перевод статей энциклопедии Википедия.

    Статьи на кыргызском языке http://ky.wikipedia.org/ (там можно увидеть текущее количество статей на кыргызском языке)

    Википедия это самая большая энциклопедия и она редактируема любым пользователем.
    Так как Википедия открыта и очень популярна, её формат широка известен и более знаком статистическим машинным переводам.
    В данный момент (2011-07-14) на кыргызском языке всего лишь 1577 статей.
    Для сравнения сейчас (2011-07-14) на грузинском языке там более 50000 статей, на беларусском более 30000, а на армянском около 15000.
    Статистика по языкам: http://stats.wikimedia.org/EN/Sitemap.htm Кыргызский: таблица график

    Так как статей на кыргызском мало, более эффективным будет перевод с других языков (русского и может английского) на кыргызский, а не наоборот.

    Перевод статей на кыргызский язык не только поможет для машинных переводов, но и в намного большей степени для образования кыргызского язычного населения.
    А образование в Кыргызстане, думаю знаете, оставляет желать лучшего и в образовательных учреждениях большой недостаток материалов на кыргызском языке.

5) Увеличение количества сайтов на 2 и более языках.

    Очень полезным для Кыргызстана будет повышение количество сайтов на 2 и более языках. Что можно сделать?
    1) Повсеместно продвигать эту идею, говорить о ней владельцам сайтов.
        Примеры сайтов: сайты владельцев бизнесов, большие информационные сайты (это конечно целые отдельные проекты).
    2) Предлагать свою помощь в переводе сайтов. Поможет создать хорошие коллективы для такого перевода.

6) Больше контента на кыргызском языке.

    Также может помочь просто увеличения количества текста на кыргызском языке в Интернете.
    Этому может помочь перевод интерфейсов блог-платформ (Wordpress, Blogger, LiveJournal) и социальных сетей (Twitter, Google+, Facebook) на кыргызский язык.
    Среди всех них пока что насколько я знаю доступен для перевода только Wordpress (на казахский язык его кстати уже перевел Asqat Yerkimbay).

    Это наверное поможет даже больше не появлению Google Translate, а развитию самого языка, что ещё лучше.

7) Пытайтесь распределять темы.

   Если очень хорошо перевести сотни тысяч статей Wikipedia через Google Translator Toolkit,
   но только в разделе "Физика" например, то это конечно скажется на качестве машинного перевода.
   Так что нужно постараться распределить тематику перевода как можно шире.



Баарыңарга чоң рахмат жана ак жол!!! :)


Тилек
Comments