Яндекс.Перевод
Mar. 16th, 2011 03:26 pmЯндекс запустил свой онлайновый переводчик — между русским, украинским и английским языком.
Он, как сообщают, основан на собственной разработке, которая опирается на алгоритм статистического поиска, т.е. подбирает соответствия не столько отдельным словам, сколько смысловым блокам (подробнее — здесь). Поддерживается перевод страниц целиком, если в поле для перевода ввести адрес. К сожалению, не отдаются УРЛы результатов перевода.
Довольно любопытно сравнение результатов работы Яндекса и Гугла над одним и тем же абзацем из новостей CNN:
Akiko Kosaka, a Japanese student in the United States, feared the worst for her family following Friday's devastation. Then a friend told her of a YouTube video showing her family home as the only one standing amid the rubble
Вот как перевёл Яндекс:
Акико Косака, японский студент в соединенных штатах, боялась худшего для ее семьи после Пятницы опустошения. Тогда друг сказал ей Youtube видео, показывающее ее семьи, как только один стоя среди обломков
А вот версия Гугла:
Акико Косака, японского студента в США, опасались худшего для своей семьи следующие разрушений в пятницу. Потом подруга рассказала ей о видео YouTube с указанием ее семью, как только один стоял среди обломков
Как видим, у обоих машинных разумов — полная произвольность в родах и падежах, не мешающая, впрочем, передаче смысла. Google борется с сексизмом, убирая пол из местоимения her. Яндекс забыл добавить дни недели в список исключений для капитализации — в результате получился красивый мем «Пятница опустошения». И обе машины зажевали в последнем предложении слово home, отчего тотально потерялся смысл всей фразы.
Моё личное ощущение по опыту работы с Google Translate за последнюю пару лет — что результат подобного "перевода по блокам" лучше всех предшествующих алгоритмов. Но те ограничения, которые в нём есть — всерьёз и надолго. Что касается вебдванольного эксперимента на Гугле, позволяющего пользователям редактировать результаты переводов и подсказывать свои варианты — полезность этого вклада ещё долго предстоит выяснять.
Он, как сообщают, основан на собственной разработке, которая опирается на алгоритм статистического поиска, т.е. подбирает соответствия не столько отдельным словам, сколько смысловым блокам (подробнее — здесь). Поддерживается перевод страниц целиком, если в поле для перевода ввести адрес. К сожалению, не отдаются УРЛы результатов перевода.
Довольно любопытно сравнение результатов работы Яндекса и Гугла над одним и тем же абзацем из новостей CNN:
Akiko Kosaka, a Japanese student in the United States, feared the worst for her family following Friday's devastation. Then a friend told her of a YouTube video showing her family home as the only one standing amid the rubble
Вот как перевёл Яндекс:
Акико Косака, японский студент в соединенных штатах, боялась худшего для ее семьи после Пятницы опустошения. Тогда друг сказал ей Youtube видео, показывающее ее семьи, как только один стоя среди обломков
А вот версия Гугла:
Акико Косака, японского студента в США, опасались худшего для своей семьи следующие разрушений в пятницу. Потом подруга рассказала ей о видео YouTube с указанием ее семью, как только один стоял среди обломков
Как видим, у обоих машинных разумов — полная произвольность в родах и падежах, не мешающая, впрочем, передаче смысла. Google борется с сексизмом, убирая пол из местоимения her. Яндекс забыл добавить дни недели в список исключений для капитализации — в результате получился красивый мем «Пятница опустошения». И обе машины зажевали в последнем предложении слово home, отчего тотально потерялся смысл всей фразы.
Моё личное ощущение по опыту работы с Google Translate за последнюю пару лет — что результат подобного "перевода по блокам" лучше всех предшествующих алгоритмов. Но те ограничения, которые в нём есть — всерьёз и надолго. Что касается вебдванольного эксперимента на Гугле, позволяющего пользователям редактировать результаты переводов и подсказывать свои варианты — полезность этого вклада ещё долго предстоит выяснять.
no subject
Date: 2011-03-16 12:29 pm (UTC)no subject
Date: 2011-03-16 12:30 pm (UTC)no subject
Date: 2011-03-16 12:30 pm (UTC)no subject
Date: 2011-03-16 12:33 pm (UTC)no subject
Date: 2011-03-16 12:35 pm (UTC)no subject
Date: 2011-03-16 12:35 pm (UTC)no subject
Date: 2011-03-16 12:37 pm (UTC)no subject
Date: 2011-03-16 12:38 pm (UTC)no subject
Date: 2011-03-16 12:38 pm (UTC)Лингвистическая команда в Яндексе была сильна, когда создатели Гугла ещё школу заканчивали.
Про русский язык Гугл ничем Яндексу полезен быть не может.
А сервисы, которые есть у Гугла и у Яндекса, запускались в разное время, по мере готовности. Например, Новости, Карты, Деньги, Блоги и RSS-агрегатор на Яндексе запустились за несколько раз до аналогов Гугла.
При этом Яндекс всё, что имеет отношение к поисковым алгоритмам, разрабатывает сам, in house. А Гугл скупает и переименовывает успешные чужие стартапы. Это разные пути стратегического развития, if you know what I mean. И Яндекс совершенно не торопится вводить новые сервисы только потому, что увидел их на Гугле. Например, Яндекс.Wave и Яндекс.Buzz никому не пришло в голову делать.
no subject
Date: 2011-03-16 12:38 pm (UTC)no subject
Date: 2011-03-16 12:39 pm (UTC)google следит за речью, а яндекс нет - переводит прямо с матом
вот, в частности, комментарии к видео оба переводят совершенно по-разному:
http://www.youtube.com/watch?v=XtF1DZx2G58&feature=player_embedded
Яндексу - зачет. Уверен, улучшение пойдет семимильными шагами.
no subject
Date: 2011-03-16 12:41 pm (UTC)Во-первых, на переводчике ни там, ни тут нет рекламы, а без неё траффик - это чистый расход.
Во-вторых, если бы целью проекта была траффикогенерация, то первое, что там предусмотрели бы оба гиганта - это кнопки для расшаривания результатов перевода.
Вы пытаетесь оценить логику проектов, работающих на перспективу и глобальный рынок, с позиций владельца мелкой странички. А логика - очень разная. Страничка берётся за всё, что принесёт ей деньги сегодня, а стратегический проект работает на долю рынка, на перспективу, на user experience.
no subject
Date: 2011-03-16 12:46 pm (UTC)no subject
Date: 2011-03-16 12:47 pm (UTC)get a ride
Date: 2011-03-16 12:47 pm (UTC)Яндекс: получить езды
В любом случае, Яндексу удачи!
no subject
Date: 2011-03-16 12:48 pm (UTC)no subject
Date: 2011-03-16 12:48 pm (UTC)no subject
Date: 2011-03-16 12:49 pm (UTC)no subject
Date: 2011-03-16 12:50 pm (UTC)no subject
Date: 2011-03-16 12:51 pm (UTC)Пока анлизу слабо поддается.
no subject
Date: 2011-03-16 12:51 pm (UTC)no subject
Date: 2011-03-16 12:52 pm (UTC)how to create database mssql
и он находил результаты на русском и наоборот.
безумно радует эта штука у гугла.
no subject
Date: 2011-03-16 12:53 pm (UTC)no subject
Date: 2011-03-16 12:55 pm (UTC)no subject
Date: 2011-03-16 12:55 pm (UTC)Кстати, яндекс почему-то не торопится допиливать свой аналог google.reader'а, а вот их почта (новая версия) ну совсем тупо копия.