Tonight

Apr. 25th, 2009 02:04 pm
dolboed: (Default)
[personal profile] dolboed
Смотрел давеча фильм Раджа Капура Mera Naam Joker.
На языке оригинала, с субтитрами.
И там в одной из сцен шпрехшталмейстер начинает свой спич на арене цирка со слов "Aaj ki raat". Поклонники «Миллионера из трущоб» могут вспомнить, что так называется 11-я песня из его саундтрека.
В фильме она звучит в тот момент, когда Латика едет на джипе в Бомбей, покуда 95 миллионов индийских мусульманзрителей молятся у мечети за победу хорошего парня над злыми хиндутелеведущими.

Как поётся в другой широко известной песне, кто другой бы сидел — Иннокентий встаёт.
Полез я решительно в гуглопочту, которая с марта позволяет набирать тексты на хинди, телугу, малаялам и каннада, и ввёл там латиницей Aaj ki raat.
Получил на выходе आज की रात. Скормил гуглопереводчику, тот ответил: tonight.
Сложный язык. Но становится с годами доступнее, спасибо Империи Зла 2.0.

Конечно, работает эта хрень малость через пень-колоду.
Например, если ввести туда название фильма Раджа Капура मेरा नाम जोकर, то перевод будет Mera Naam Joker. А если последнее слово (Джокер) отрезать, то перевод будет My name. И заранее предсказать, как поведёт себя этот чёрный ящик в тех или иных ситуациях затруднительно. А подсказок, не владея письменностью, брать негде. Ещё не очень понятно, почему языковой модуль Gmail, запущенный в марте 2009, умеет преобразовать латиницу в деванагари, а Google Translate, где хинди добавился осенью 2007 года, этой волшебной способности лишён.
Казалось бы, понимать латиницу Гуглу должно быть проще, чем деванагари.
Но так уж устроено Гугло (см. про это позавчерашний доклад Сергея Буркова на StartCamp), что Chandramouli Mahadevan развивает поддержку деванагари в Gmail совершенно отдельно от Франца-Иосифа Оха, трудящегося над Google Translate. Возможно, они не только никогда в жизни между собой не встречались, но даже и не слышали о существовании друг друга. В компании, где трудятся больше 20 тысяч человек, и каждый занят каким-нибудь творчеством, такое случается сплошь и рядом.

Re: А такое видели ?

Date: 2009-04-25 10:22 am (UTC)
From: [identity profile] dolboeb.livejournal.com
Забавно.
Только про иврит - пиздёж процентов на 90%.
Hakishu означает не "clap", а "type", в смысле клавишу нажать.
Причём это повелительное наклонение множественного числа.
Единственное совпавшее слово, которое на иврите не выдумано, а существует - развалина.

Всё посмотрели ?

Date: 2009-04-25 10:27 am (UTC)
From: [identity profile] cialis-viagrych.livejournal.com
Не, про буквы они правы - очень много похожего
http://cialis-viagrych.livejournal.com/40834.html
Но там ведь не только о алфавите, чего стоят меноры на храмах и разные празднования, картины и привычки

Re: Всё посмотрели ?

Date: 2009-04-25 10:37 am (UTC)
From: [identity profile] dolboeb.livejournal.com
Вам нельзя в Индию.
Вы увидите синий магендавид на белом фоне, эмблему Банка Карнатаки, и рядом чёрную свастику, и страшно подумать, на какие выводы это Вас наведёт.

Date: 2009-04-25 10:24 am (UTC)
From: [identity profile] a-iv.livejournal.com
А.Б., а как вы относитесь к тотальной перлюстрации почты идущей за развитием языковой поддержки Google? Получая письма на китайском (и текстом, и сканы), я вижу как Ad корректирует таргетинг не только в зависимости от IP но и от содержания как самого письма, так и вложений.

Date: 2009-04-25 10:34 am (UTC)
From: [identity profile] dolboeb.livejournal.com
Не понимаю, какое это имеет отношение к перлюстрации.
Содержание письма действительно анализируется, и подчас выходят некоторые курьёзы (каждый выставленный провайдером счёт сопровождается рекламой конкурентов), но делается это в автоматическом режиме, роботом, и безо всякой привязки к Вашей true identity. Определение Вашего IP для геотаргетинга объявлений - совершенно отдельный процесс, который совершенно одинаков на любой веб-странице, персональной или публичной, и надо очень постараться, чтобы увидеть там вторжение в личную жизнь. Меня больше раздражает подстановка google.ru по запросам с российских адресов, но это лечится по адресу http://www.google.com/ncr

Date: 2009-04-25 10:45 am (UTC)
From: [identity profile] a-iv.livejournal.com
1) Я говорю об IP отправителей. Часть из них пользуется прокси ни как не привязанных к языку страны пребывания.
2) Я знаю, чем это лечить, но в соглашении есть пункт, предупреждающий о том, что Google имеет право на сохранение и анализ отправляемых сообщений с целью совершенствования сервиса.
З) Когда я говорю о таргетинге, я имею в виду что это не только географический, но и контекстный таргетинг. Содержание письма: "Договор в приложении". В приложении текст на английском о покупке тонких клиентов, справа в веб-интерфейсе идет реклама компаний, которые предлагают тонкие клиенты на трех языках: английском (язык документа), русском (контекст), китайском (география отправителя)

Date: 2009-04-26 01:40 am (UTC)
From: [identity profile] dolboeb.livejournal.com
1) Я говорю об IP отправителей. Часть из них пользуется прокси ни как не привязанных к языку страны пребывания

Язык интерфейса любых сервисов Гугла пользователь себе сам выставляет, не по IP и не по прокси, а в настройках.

в соглашении есть пункт, предупреждающий о том, что Google имеет право на сохранение и анализ отправляемых сообщений с целью совершенствования сервиса

А ещё все системы интернет-статистики, на любом посещённом сайте, анализируют наши по нему перемещения, безо всякого соглашения, и генерят отчёты посещаемости. Не вижу проблемы.

Когда я говорю о таргетинге, я имею в виду что это не только географический, но и контекстный таргетинг.

И я о нём же.
Контекст берётся из ключевых слов письма.
Берётся роботом, а не человеком.
Точно так же скрипт должен проиндексировать всю нашу почту, чтобы мы могли по ней искать.
И сортировка нашей адресной книги тоже осуществляется на основании текстуального анализа её полей.
Не вижу, в чём проблема.

Date: 2009-04-26 02:04 am (UTC)
From: [identity profile] a-iv.livejournal.com
1) IP.В немного не о том. Предположим у меня несколико коресспондентов в Китае: в Пекине, Чанша, Гуанджоу, Шеньяне и Даляне. Соответственно я получаю рекламу таргетированную не по моим, а по их IP.
2) Я ползуюсь почтой Гугла с первых месяцев ее существования и недавно отметил что появилось лингвистическое таргетирование. Несколько месяцев назад оценка шла по группе языков "ОК, в письме иероглифы, значит адресат понимает иероглифы" и подсовывались китайские, японские и корейские ссылки. Теперь Гугл стал понимать иероглифы какого языка идут в письме и почти не путает страну.
3) Раньше анализировалось только письмо с целью контекстного таргетинга, теперь я стал получать рекламу таргетированную в контексте вложения, при этом вложение в формате Ворд ОпенОфис или ПДФ может по своему языку радикально отличаться от русского.
4) Теперь, смутно попробоват проекты Гугла по OCR я попросил пару корреспондентов прислать мне вместо текстовых вложений картинки. И смотрю на результат.
5) Прайваси меня не волнует -- я читал соглашение и не страдаю конспирологической паранойей. )

Date: 2009-04-26 02:17 am (UTC)
From: [identity profile] dolboeb.livejournal.com
По пунктам 1) и 2) - Вы элементарно не можете знать настроек таргетинга конкретной кампании, они непубличны. Если в принципе есть таргетинг на языки в системе контекстной рекламы, то рекламодатель может одинаково легко затаргетить китайский отдельно, или китайский-корейский-японский вместе. Что до привязки рекламы к содержимому аттачмента - как научились искать по нетекстовым форматам, так и стали контекст оттуда брать.
По 4) интересно было б знать об успехах.

Date: 2009-04-26 02:32 am (UTC)
From: [identity profile] a-iv.livejournal.com
По 4) пока результат такой: таргетируют по IP отправителя, но но подсовывают рекламу в соответствии с IP получателя. Т.е., например: о китайских фирмах, но по русски. Я поставил консольный OCR "октопус" -- опенсорс проект гугла, который работает на Mac OS X довольно шустро, но, похоже застыл где то в 2007 и теперь думаю, будут ли они использовать его в своих OnLineApps и для внутренних нужд.

Date: 2009-04-26 02:13 am (UTC)
From: [identity profile] a-iv.livejournal.com
Да, и еще одно уточнение: я не пользуюсь Гуглом для поиска в китайском интернете, так что схранять историю запросов для таргетинга ему бесполезно. Разве что он анализирует лингвистику письма и соотносит его содержание с англоязычными запросами.

Date: 2009-04-25 01:41 pm (UTC)
From: [identity profile] liberast-rus.livejournal.com
спасибо за сцыло на google.com

Date: 2009-04-25 05:47 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
Это одноразовое действие. Заходите туда - и с тех пор перестаёт русский подсовывать.

Date: 2009-04-25 05:52 pm (UTC)
From: [identity profile] liberast-rus.livejournal.com
ага. спасибо

Date: 2009-04-25 08:50 pm (UTC)
From: [identity profile] -steppenwolf.livejournal.com
Некоторые сайты вместе с IP собирают например историю посещения сайтов.
А тот же liveinternet имеет статистику посещения по возрастам и группам, что явно сделано с помощью подшпионивания за посещениями залогиненых пользователей социалок.
Одно дело подсунуть рекламу по IP и другое дело узнать куда с этого IP ходят и использовать эту информацию.
Кстати в этой связи очень показательна позиция Майкрософт:
http://www.loleg.com/blog/2009/04/21/11089/
это называется деструктивная позиция империи зла, паталогически неспособной заниматься своим делом и обеспечить безопасность нормальным способом.

Date: 2009-04-26 01:56 am (UTC)
From: [identity profile] dolboeb.livejournal.com
Некоторые сайты вместе с IP собирают например историю посещения сайтов.
А тот же liveinternet имеет статистику посещения по возрастам и группам


Разница между Гуглом и liveinternet в этом смысле довольно-таки самоочевидна.
Обсуждался выше как раз Гугл.

Одно дело подсунуть рекламу по IP и другое дело узнать куда с этого IP ходят и использовать эту информацию

Если эту информацию использует тот, кому ты её доверил для такого использования, не вижу проблемы. Если же ею начинают торговать, тогда я против. У Гугла есть Privacy Policy, которая как раз про конфиденциальность доверенных ему сведений. А сам пусть улучшает мне выдачу по personal history, я только за.

это называется деструктивная позиция империи зла, паталогически неспособной заниматься своим делом и обеспечить безопасность нормальным способом

Создание системы, полностью устойчивой к любому будущему взлому - это не "нормальный способ", а сказки для самых маленьких.

Я не считаю анонимность абсолютным благом и универсальным правом.
Я не считаю свои права ущемлёнными всякий раз, когда от меня требуют назваться или предъявить паспорт.
Также мне бы категорически не хотелось, чтобы посторонние лица могли без моего ведома и согласия делать публичные заявления от моего имени, или распоряжаться моими банковскими счетами.
Как этого избежать в условиях всеобщей анонимности, я не понимаю.

Date: 2009-04-26 02:20 am (UTC)
From: [identity profile] -steppenwolf.livejournal.com
"Также мне бы категорически не хотелось, чтобы посторонние лица могли без моего ведома и согласия делать публичные заявления от моего имени, или распоряжаться моими банковскими счетами."

Я думаю всё же речь идет о том, что информация о моём банковсом счете будет с распечаткой предоставлятся в органы. В частности я не желаю, чтобы власть имела информацию даже о существовании моего счета. Ни к чему им это.
"Анонимность и отсутствие всякого контроля в Сети должны остаться в прошлом. Из-за того, что в интернете не отслеживаются действия пользователей и у них есть возможность остаться неузнанным"

То есть тут ключевое слово - должна. Вот я хочу ходить по лесу без предъявления паспорта, а в те места, где надо паспорт, я или не пойду, или предъявлю, но отчитываться перед какими-то органами контроля куда я хожу, я не желаю. А именно этого хочет Майкрософт, потому, что например инвайт можно и сейчас делать на основе авторизированного через паспорт РФ вебмоней. Так какого именно контроля надо ещё? У нас не всеобщая анонимность в сети, у нас добровольная анонимность. Более того, существующая система она полностью достаточна для регуляции сети. Она работает, она развивается, зачем что-то менять? Ответ простой - чтобы могла по-прежнему существовать Майкрософт.

"чтобы посторонние лица могли без моего ведома и согласия делать публичные заявления от моего имени"
Пускать в интернет после предъявления паспорта?


"Создание системы, полностью устойчивой к любому будущему взлому - это не "нормальный способ", а сказки для самых маленьких. "
Я не специалист, но взлом взлому рознь. То, чем занимается Майкрософт, это не просто воровство идей и кривая их реализация, это диверсия всемирного масштаба.

"А сам пусть улучшает мне выдачу по personal history, я только за."
А я против, потому, что если кто-то получит доступ, а такое бывает, к этой информации, то вот например можно будет украсть чью-то идею, рассмотрев сферу интересов, запросы итд. И никакие уверения кого-то, что всё будет нормально, меня не успокоят, потому, что я часто видел много уверений, а потом просто пожимания плечами: "ой ну так получилось".
Говорят, что полиция очень любит рассматривать содержимое помоек, счета и телефонные соединения.

Date: 2009-04-26 01:34 pm (UTC)
From: [identity profile] lamantyn.livejournal.com
В частности я не желаю, чтобы власть имела информацию

Власть сама выбирает, какую информацию иметь о гражданах.
Желание граждан никакого значения не имеет.

Друг в Яндексе

Date: 2009-04-25 10:54 am (UTC)
From: [identity profile] ygrodz.livejournal.com
Вам нужен друг в Яндексе. Если да, то прошу - http://ygrodz.livejournal.com/4899.html

Шевелилка

Date: 2009-04-25 11:19 am (UTC)
From: [identity profile] formalist.livejournal.com
сейчас стал искать в гугле ссылку, но вместо той, что хотел, вылезла вот эта
http://russian.alibaba.com/product-gs/pitched-blade-disc-turbine-impeller-impeller-stirrer-rabbler-beater-propeller-mixing-blade-paddle--212608204.html
а вообще подразумевалась
http://russian.alibaba.com/product-gs/magnetic-stirrer-203086761.html

Date: 2009-04-25 11:31 am (UTC)
From: [identity profile] rezdm.livejournal.com
Переводчик Корпорации Зла недавно выдал и вот такое:

Image



Date: 2009-04-25 01:00 pm (UTC)
From: [identity profile] pmishka.livejournal.com
А если убрать "voor een werkgever", то на выходе - "Can you work in Singapore". Убираем и "Mag u", на выходе - снова "work in Australia". Оставляем "in Netherlands" - всё равно "in Australia". Более, чем забавно.

Date: 2009-04-25 01:01 pm (UTC)
From: [identity profile] rezdm.livejournal.com
Во как! Спасибо за наблюдение!

Date: 2009-04-25 08:06 pm (UTC)
From: [identity profile] huzhepidarasa.livejournal.com
ха-ха, а Ik spreek Nederlands переводится как I speak English. Причем не только на английский, но и на французский.
(deleted comment)

Date: 2009-04-25 03:32 pm (UTC)
From: [identity profile] vertikalj.livejournal.com
Бабуля Бот?

Date: 2009-04-25 03:04 pm (UTC)
From: [identity profile] vertikalj.livejournal.com
Мне здорово импонирует этот фильм и музыка к нему, Aaj ki raat у меня на рингтоне стоит с недавнего времени, буду знать, что это тунайт))

Date: 2009-04-25 03:45 pm (UTC)
From: [identity profile] leo-nardo.livejournal.com
Массовая блокировка пользователей?

http://community.livejournal.com/ru_support

Date: 2009-04-25 05:58 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
Не вижу массовости.
Также не вижу, чтобы я был блокирован.
И не вижу, чтобы блокированы были Вы.

Date: 2009-04-25 08:28 pm (UTC)
From: [identity profile] leo-nardo.livejournal.com
я через анонимайзер, с черепашьей скоростью и отсутствием половины сервисов

Date: 2009-04-25 07:23 pm (UTC)
From: [identity profile] vertikalj.livejournal.com
Хватит страху нагонять...)

Date: 2009-04-25 08:32 pm (UTC)
From: [identity profile] leo-nardo.livejournal.com
не нагонял бы, если бы техподдержка LJ ворон не считала

Date: 2009-04-25 04:37 pm (UTC)
From: [identity profile] toothedgoo.livejournal.com
Мне думается, разрабы перевода не хотят, чтобы пользователи получали на выходе абсолютно непредсказуемый результат при невладении письменностью. Много ли людей знают однозначные способы записи индийских языков латиницей, такие как ITRANS или Harvard-Kyoto? А если не знать ни их, ни письменности, можно получить на выходе все что угодно (точнее говоря, высоковариативный ответ). А пользователи гуглопочты с некоторой вероятностью письменностью владеют и могут отследить бред на выходе.

Date: 2009-04-25 05:56 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
Много ли людей знают однозначные способы записи индийских языков латиницей

Особенность Индии как раз в том и состоит, что латиница доступна большему числу жителей, чем любая из местных письменностей, см. плакат к вышеуказанному фильму:
http://en.wikipedia.org/wiki/File:Mera_Naam_Joker_poster.jpg

Date: 2009-04-25 05:53 pm (UTC)
From: [identity profile] chryzolit.livejournal.com
Не знаю, как с хинди, но переводы с хань-юя (китайского) там настолько чудовищны, что впору задуматься - а неужели кто-то китайским словарём пользуется на полном серьёзе?

Date: 2009-04-25 05:57 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
Они там засосали всю базу документов ООН для сопоставления словосочетаний.
Видимо, китайский синтаксис оказался непохож.

ну и как Joker?

Date: 2009-04-25 07:22 pm (UTC)
From: [identity profile] disolodova.livejournal.com
понравился?

Date: 2009-04-27 01:26 pm (UTC)
From: [identity profile] xyu-no1.livejournal.com
Триколор ТВ
Триколор ТВ http://www.tricolortv.net/ Триколор ТВ
Триколор ТВ

Profile

dolboed: (Default)
Anton Nossik

April 2017

S M T W T F S
       1
23 45678
9 10 11 12 13 14 15
16 17 18 19 202122
23 24 25 26 27 2829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 16th, 2026 09:31 pm
Powered by Dreamwidth Studios