Previous Entry Поделиться Next Entry
Преферанс пингвинов
Rochecotte
igergel
shuragara,
заядлому картёжнику

Голосовой поиск в Android появился с полгода назад. Классная вроде вещь — не надо набирать текст на виртуальной клавиатуре телефона. Говори себе — программа распознаёт речь и запускает поиск по сказанному.

Иногда, правда, этот поиск может завести довольно далеко… Что со мной и случилось. Но обо всём по-порядку.

Устроена система просто и красиво. Нажимаем кнопку поиска на корпусе телефона и вместо ввода текста с клавиатуры, жмём виртуальную кнопочку с символом микрофона в правой верхней части экрана. Появляется приглашение: «Говорите, ну!».

Что бы такое спросить позаковыристее? Допустим, я забыл, кому принадлежит фраза «Не надо складывать оба яйца в одну корзину!».
1     2

Пингвины пока ни при чём, появятся позже.

Вернёмся к запросу про яйца. Длинная фраза. Трудно поверить, что система с ней справится. Однако же — секунды две выполняется обработка звука — и выскакивает перечень возможных вариантов. Причём первый же — правильный. Фантастика! Раньше системы распознавания речи справлялись только с определённым набором слов, либо долго «натаскивались» на произношение конкретного человека. А здесь — распознавание речи почти на лету. Бунина только вот ни к селу ни к городу вспомнили.

Того и гляди, не за горами появление автоматических переводчиков. И умных телефонов, понимающих связную речь. И уже скоро, совсем скоро, на обращение к смартфону поутру: «Где я? Как купить пива?», мы получим чёткий и непреклонный ответ: «Пьянству — бой» и адрес ближайшего клуба анонимных алкоголиков.
2а     3

Пока же нажимаем на первую строчку из предложенных и радостно узнаём, что фраза принадлежит незабвенному Виктору Степановичу, а МТС недовольно своими яйцами.
4

Но конь о четырёх ногах — и тот спотыкается. Что же говорить об электронных ушах? Понадобилось мне однажды найти адрес ресторана. Я так и сказал в микрофон: «Ресторан In Vino». И немедленно узнал, что пингвины уважают преферанс. Более того, у них своя игра. Не «сочинка» или какая там «ленинградка». А «преферанс пингвинов». Как же я хочу на это посмотреть!
5

К чести системы надо сказать, что со второго или третьего раза меня поняли, и поиск сразу запустился с голоса, без списка вариантов. В таком случае правее текста поиска «ресторан инвино» выводится значок. Обозначающий звуковые волны, по всей видимости.
6

Но поздно! С тех пор я обхожу стороной этот ресторан. Боюсь встретить за столиком компанию пингвинов, злобно строящих «паровоз» на мизере. Ещё канделябром залепят, не ровен час.

С днём рождения, Саша!


Я ржал полчаса, когда впервые это на экране увидел.

Функция интересная и нужная. Но пока явно сырая. Практической пользы от нее пока 0.

Да нет, не соглашусь. За последние полгода функцию здорово шлифанули напильником. Ошибок стало меньше. Сейчас, например услышал по радио Kylie Minogue. Произнёс её непростое имя в микрофон, выскочило сразу на английском.

Да и окончание этого комментария я уже вводил голосом, а не пальцами. Очень удобно за рулем.

Ну у меня навскидку правильно работает в 30% случаев. Кстати в случае с Kylie Minogue действительно сразу находит :)

А модель телефона какая? И какой язык стоит по умолчанию в голосовом поиске?

Samsung Galaxy S. Я всегда стараюсь, чтобы со мной вся электроника на английском разговаривала. Настолько к этому привык, что если вдруг где-то стоит русский, это иногда вводит в ступор :) То же самое и в компьютерах.

Про модель я зря спросил — ведь вся обработка идёт на серверах. Вряд ли аппаратура телефона влияет на качество распознавания.

А вот язык — это может быть существенно. Мне кажется, что качество распознавания подскакивает, если в настройках речевого ввода поставить русский по умолчанию. Или английский, но тогда говорить с Андроидом на английском.

У меня в HTC Desire качество распознавания что-нибудь районе 80-90%. Первый пример с длинной фразой говорит сам за себя.

Edited at 2011-01-21 11:55 (UTC)

:))))))))) "Не надо складывать оба яйца в одну корзину" - это по Фрейду оговорочка. :) В оригинале количество яиц не оговаривается.

Но йап с удовольствием посмотрел как это делается. :)))

Edited at 2011-01-20 00:43 (UTC)

Ты что, не слышал раньше этой максимы Черномырдина?

Да, забавно получилось)
Думаю, если время потратить, можно еще косяки найти!

Я бы это косяком не называл. Скорее, неточность распознавания.

прям-таки ура :)
не за горами время когда появятся нормальные миниатюрные переводчики речи (в ухо клипсу воткнул и общаешься)
и практически исчезнут языковые барьеры

и будет щастье, о котором так мечтали писатели-фантасты :)

Да, ты знаешь, Google активно кропает футуристические сервисы. Почитай у меня ещё про Android: Shiza technologies

Да, кстати, а в iPhone голосовой поиск есть? И речевой ввод?

штатно - нет
приблуды софтверные наверняка есть, тот же гугль рекламируется по телевизору

Значит, и речевого ввода нет. Ку-ку.

Не изучал вопрос

По ощущениям, либо уже есть либо скоро появится

В тебе говорит слепая влюблённость в Apple.

Я не про эппл говорю и не про андроид

А про технологическую реализацию, распознавание устной речи с допустимым уровнем точности

А что говорить о технологической реализации? Она есть — в Андроиде. Часть комментариев к этому посту я вводил голосом.

я сильно отстал от жизни, похоже :)

Я тоже узнал много нового, копаясь в своём HTC Desire.

прекрасно :)
если есть время - можно делать обзоры для каких-нибудь сми о гаджетах

Спасибо! Со временем плохо. Вот на комментарий через 3 дня отвечаю.

В качестве готового «обзора» под определённым углом есть Shiza Technologies.

три дня для обзоров не срок, это не новости :)))
поспрашиваю у своих знакомых редакторов


?

Log in

No account? Create an account