Сейчас, 22 сентября, компания Гугл официально представила сервис голосового поиска в Рф. Пресс-конференция, посвященная этому событию, прошла в Москве в Галерее на Солянке. В качестве спикеров выступили Hugo Barra – директор по мобильным продуктам Гугл, Евгений Вейнштейн, один из создателей технологии определения речи на российском языке, и Андрей Дроничев, менеджер по продуктам Гугл.
Гугл, глас!
Работает голосовой поиск Гугл так. Нажимаете кнопку на мобильном телефоне (рядом со строчкой поиска), произносите запрос вслух (лучше при всем этом гласить прямо в микрофон), к примеру: "Галерея на Солянке". Телефон сохраняет приобретенные звуковые сэмплы и посылает их на сервер Гугл. Потом браузер выдает строчку с распознанным текстом и ответы поисковой машины на ваш запрос. Звучит заковыристо, но на самом деле – очень комфортно.
На 1-ый взор с большинством фаворитных запросов голосовой сервис Гугл совладевает отлично. К примеру, на запрос "500 баксов в рублях", произнесенный в телефон, вы, вероятнее всего, получите ответ вточности такой же, как и в случае набора текста с клавиатуры. А конкретно: "500 баксов США = 15 512,0529 русских рубля".
То же самое – с погодой. На голосовой запрос "Погода в Москве" с вероятностью близкой к 100% вы получите хотимый ответ в первой строке: "10 градусов тепла, дождик". Неувязка с определением может появиться, в случае если у телефона не все в порядке с микрофоном, не считая того, опасность представляют наружные шумы. Качество результата может зависеть и от определенной модели телефона – не все микрофоны идиентично "полезны". Например, спикеру Hugo Barra, директору по мобильным продуктам Гугл, так и не удалось вынудить Гугл корректно передавать фразу "Pushkin restraunt" в текст. Величавый российский поэт Pushkin перевоплотился в глупое словосочетание Push Can.
По сути определение речи на различных языках – очень непростая задачка, которую с переменным фуррором решают в течение многих лет и продолжают решать до сего времени. Тут целая тонна подводных камешков – разные тембры голоса, огромное количество акцентов и, естественно, особенности и правила языка. Базу вычислений Гугл составляет вероятностная модель: сервер соотносит приобретенные голосовые сэмплы со собственной базой – и сначала с более пользующимися популярностью запросами. На практике это выливается в делему с определением редчайших слов и выражений: экзотичных имен собственных, фамилий либо аббревиатур. Со слов спикеров, компания Гугл сделала гигантскую работу – в проект вовлечены огромное количество добровольческих тестеров с разными моделями телефонов и особенностями голоса и произношения, по этому удалось добиться результата, который не постыдно показать.
Но работать есть еще над чем. Метод голосового определения (как, вобщем, и текстового поиска) совершенствуется с каждым новым пользовательским запросом. Так что качество голосового поиска – это только вопрос времени.
Разработка определения речи Гугл может быть встроена в хоть какое приложение (код открыт для всех желающих). На пресс-конференции был продемонстрирован голосовой набор SMS-сообщения. При всем этом неправильно распознанные слова всегда можно поправить при помощи клавиатуры. Неописуемо комфортен голосовой набор при навигации. В приложении Гугл Navigation продиктовать пункт предназначения – к примеру, "Аэропорт
Домодедово" – и вы здесь же получаете лучший маршрут. И все это без помощи рук.
Невзирая на то, что объем пересылаемых голосовых данных, со слов спикеров, в среднем не превосходит 100 Кб, практика показала: чтоб голосовой поиск работал отлично, нужна благопристойная скорость доступа в веб. По GPRS воспользоваться обслуживанием проблематично. По 3G – более-менее. Ну и совершенно отлично, если поблизости есть точка доступа Wi-Fi.
Принципиальный момент: чтоб находить голосом по-русски, необходимо непременно использовать российский в качестве языка интерфейса. Поиск на британском языке поддерживается независимо от языка интерфейса.
Куда мы катимся
Главный технологический тренд грядущего, по воззрению представителей Гугл, – это супервычисления (mobile supercomputing). Тенденция предполагает три вещи:
а) неизменный доступ в Сеть огромного количества юзеров со различных электрических устройств – и сначала с мобильников
б) пасмурные вычисления – база всех сервисов Гугл
в) забудьте про обычные средства ввода. Когда вы гласите в микрофон на вашем телефоне – вы гласите прямо в ухо суперкомпьютеру, если вы снимаете на камеру – его всевидящее око не спит. Под суперкомпьютером в этом случае предполагается огромное количество серверов Гугл, объединенных в сеть.
Идеология супервычислений получила воплощение не только лишь в голосовом поиске Гугл, но также и в распознавании изображений на ходу. Вы снимаете некий объект на камеру, при помощи программки Гугл Goggles здесь же отправляете его в Сеть и получаете в ответ информацию об этом объекте. На сегодня это прекрасно работает на том же Android, к примеру, в случае с известными достопримечательностями. В согласовании с основным трендом анонсированный голосовой сервис Гугл работает сейчас уже на 3-х мобильных операционных системах: Android, iOS и Симбиан S60. Насчет Windows Phone и настольных ОС пока ничего не сообщается, но в планах у Гугл окутать все пользующиеся популярностью платформы.
Юзеры Гугл Android (версия 2.1 и выше) отыщут приложение в Android Market по ключевикам <<голосовой поиск>>. Для хозяев iPhone в Apple App Store есть программка Гугл Mobile App. По этому адресу приложение доступно также и юзерам Nokia под управлением Симбиан S60.

Официальная страница сервиса
Назад
>
Анонсы статей:
>
div>