И голос мой негромок
Jan. 5th, 2014 11:05 am
В том тексте, который вы сейчас читаете, правки случилось не больше двух-трёх символов на одно предложение. Я её как-то без напряжения осилил на экране Nexus 7. Потому что экран этот достаточно большой, и пальцами попадать по клавишам не составляет особенного труда.
Тем не менее, отдельные слова расшифровываются каким-то совершенно нелепым способом, и тогда уже хрен кто кроме меня поймёт, что я там на самом деле имел в виду. А это значит, что отправить сырой надиктованный текст какой-нибудь расшифровщице на вычитку совершенно нереально. Блох необходимо вылавливать самому. Тут уже не получается никакой экономии сил, нервов и времени.
А самое обидное – что один и тот же продукт по распознаванию текста значительно хуже поддерживает русский язык, чем любой другой европейский. К сожалению, двух объяснений этому факту нет, и быть не может. Даже если мало кто сегодня сомневается в готовности русскоязычного пользователя платить за всевозможные танки и прочие рингтоны, производители серьезного софта для профессиональных нужд не видят большой коммерческой перспективы в выпуске платных продуктов на наш рынок. Всё, что нужно и полезно, будет назавтра спирачено и расшарено. Так что в вопросе расшифровки речи придется русскоязычному пользователю и впредь довольствоваться крохами с барского стола. А, кстати сказать, вот же вам и наглядный пример кейса, в котором свою революционную роль мог бы сыграть краудфандинг: не нужно оглядываться на 70 миллионов любителей халявы, если можно подписать тысяч 50 платежеспособных и реально заинтересованных в продукте. Правда, я не имею ни малейшего понятия о том, сколько реально мог бы стоить в разработке подобный языковой модуль. Но тут, по крайней мере, хорошо понятно, у кого такую информацию можно было бы выспросить. Posted via LiveJournal app for Android.
no subject
Date: 2014-01-05 07:12 am (UTC)no subject
Date: 2014-01-05 07:15 am (UTC)no subject
Date: 2014-01-05 07:18 am (UTC)no subject
Date: 2014-01-05 07:25 am (UTC)no subject
Date: 2014-01-05 07:27 am (UTC)Мандарин?
Бенгальский?
Валлийский?
Кастильянский?
Африкаанс?
no subject
Date: 2014-01-05 07:34 am (UTC)no subject
Date: 2014-01-05 07:36 am (UTC)з.ы. капча - зло
no subject
Date: 2014-01-05 07:38 am (UTC)А вообще - "фефект фикции" как говорил Райкин.
no subject
Date: 2014-01-05 07:38 am (UTC)Не думаю что распознавалки для данных языков качественнее..если вообще существуют.
no subject
Date: 2014-01-05 07:40 am (UTC)no subject
Date: 2014-01-05 07:42 am (UTC)no subject
Date: 2014-01-05 07:50 am (UTC)Вот насмешили.
Распознавание речи — та сфера, в которой вообще ничего невозможно ни ограничить, ни засекретить, потому что и язык, и произношение, и миллионы часов диктовки на любом языке находятся в public domain.
Компания Nuance, на продукте которой надиктован этот пост, имеет капитализацию 5 млрд долларов, больше миллиарда долларов годовой выручки, 12.000 сотрудников и офисы в 35 странах. Чего такого не может сделать компания с такими мощностями, что могли бы сделать инженеры какой-нибудь режимной шарашки?! Где то секретное знание о фонетике, которое давало бы спецслужбам преимущество перед коммерсантами?
Ровно в одном вы правы: действительно, никто не будет делать подарки. Поэтому мы и в пролёте. Dragon Dictate стоит от 200 долларов США за одну лицензию, английский медицинский аналог — от 1000. Для русского рынка, где всё это украдут, где даже в госструктурах поставят пиратку, разумеется, никому не интересно стараться.
no subject
Date: 2014-01-05 07:52 am (UTC)no subject
Date: 2014-01-05 07:53 am (UTC)no subject
Date: 2014-01-05 07:54 am (UTC)Но знаю, что некоторые ребята так язык изучают, разговаривая с какой-то программой.
no subject
Date: 2014-01-05 07:57 am (UTC)Но, конечно, Яндекс — игрок серьёзный, и очень заинтересован в голосовом вводе поисковых запросов, потому что с мобильным рынком связаны основные перспективы его роста на ближайшие 5-10 лет. Тем более, что у Гугла есть русское распознавание. Поэтому на Яндекс большие надежды, но ввод текстов для них ни разу не приоритетен. Если Гугл по сей день не сделал в русской диктовке знаков препинания, вряд ли их сделает Яндекс. А без знаков препинания это не текст, а рыба. И не диктовка, а распальцовка.
no subject
Date: 2014-01-05 07:59 am (UTC)no subject
Date: 2014-01-05 08:01 am (UTC)В целом достаточно легко проверить, какие есть языки в коммерческих версиях диктовочного софта.
no subject
Date: 2014-01-05 08:03 am (UTC)Ну, и капчи бы в ЖЖ сделать для голоса :)
no subject
Date: 2014-01-05 08:05 am (UTC)no subject
Date: 2014-01-05 08:06 am (UTC)no subject
Date: 2014-01-05 08:09 am (UTC)no subject
Date: 2014-01-05 08:11 am (UTC)Крутые коммерческие продукты есть для английского, французского, немецкого.
Из того нерусского, что я пробовал, очень хорошо берётся иврит даже на базе Гугла.
no subject
Date: 2014-01-05 08:12 am (UTC)Но поверх API можно нахлобучить заменялку регулярных выражений знаками препинания.
Главная работа — массив лексикона накопить.
no subject
Date: 2014-01-05 08:13 am (UTC)