Как и Navicam Рекимото, программа AndroidScan интерпретирует машиночитаемые коды как гиперссылки, ведущие к информации об объекте. Только в данном случае используются не специально расклеенные в стратегических местах ярлыки, а обычные штрихкоды, которые и так есть на каждой упаковке или обложке. AndroidScan разбирает снятый с помощью камеры смартфона код, выясняет, какому товару он соответствует, и добывает в Интернете информацию о нем - отзывы покупателей, цены, а для аудиодисков - даже соответствующие MP3-файлы на пробу.
Идея, впрочем, не нова: похожий мобильный сервис еще в 2004 году предлагал японский филиал крупнейшего интернет-магазина Amazon (японцы все делают первыми).
Поисковая система Linkoln, которую разрабатывают в Microsoft Research, - это следующий логический шаг. Она справляется не только с машиночитаемыми кодами. Для Linkoln подойдут любые плоские изображения - например, афиши или обложки дисков.
Если картинка содержится в ее базе данных, Linkoln сможет ее отличить.
В распознавании образов видят будущее мобильной дополненной реальности и в Nokia: в прошлом году компания приобрела калифорнийский стартап PIXTO, разработавший технологию Point&Find. Теперь над нею работают в той же лаборатории, где была создана MARA. Телефон с поддержкой Point&Find выделяет на снимке, полученном с помощью встроенной камеры, характерные детали и сверяет их базой данных, хранящейся на сервере. Хотя основа технологии - распознавание образов, информация со встроенного в телефон приемника GPS тоже способна помочь делу. Если известно, где сделан снимок, круг поиска можно ограничить. По фотографии достопримечательности телефон Point&Find выдаст историческую справку и туристическую информацию, а если в объектив попадет афиша фильма, пользователь получит список ссылок на его трейлер и расписание киносеансов.
Создатели похожей системы, которую разрабатывали в Neven Vision, зашли еще дальше: их детище умеет различать не только предметы, но и людей. Впрочем, в этом нет ничего странного, если знать историю компании. Уникальная система распознавания лиц, способная работать на маломощных карманных устройствах, долгое время оставалась 'дойной коровой' компании, а основатель Neven Vision Хартмут Невен считался одним из ведущих экспертов в этой области. Пять лет назад Neven Vision начала работу над адаптацией своих патентованных алгоритмов для распознавания мест и предметов и, похоже, преуспела в этом: сообщалось, что уже в 2005 году программа уверенно идентифицировала известные ей объекты и спотыкалась лишь на предметах, которые легко спутает и человек - например, она могла не уловить тонкие различия между похожими моделями сумочек. Невен говорил, что его цель - создание 'визуального Google', работающего в реальном мире, а не в Интернете.
Но для этого мало иметь эффективный алгоритм распознавания. Даже если предположить, что эта задача успешно решена, остается еще одна проблема, и не меньшая, - поисковый индекс. Если он неполон, все остальные усилия бесполезны. Можно, конечно, на первых порах ограничиться малым - например, собрать базу данных по книжным обложкам или киноафишам не так уж трудно. Но что дальше? Кому под силу создать достаточно обширную базу данных мест и объектов? Разве что самому Google - и как тут не вспомнить фургончики Google StreetView, второй год колесящие по городам Америки, Японии и Европы и методично фиксирующие облик каждого дома, улицы и переулка. Кто-то уже в шутку сравнивал их с 'пауками'-гуглботами, которыми поисковик индексирует сайты. И как знать, возможно, в этом сравнении есть доля правды. В конце концов, Хартмут Невен теперь тоже работает в Google.
Во времена Великой депрессии у американских бродяг был особый жаргон, кодекс чести и даже набор значков-иероглифов, которые они оставляли в местах, где побывали. Три диагональные черты обозначали опасность, нарисованные зубы - обитающую поблизости злую собаку, а перекрещенные лопаты свидетельствовали, что здесь нетрудно найти работу.
В основе новомодных геосоциальных сетей для мобильных телефонов лежит тот же принцип: их участники оставляют на карте метки, которые потом могут увидеть другие, только используют для этого не мел, а специальную программу. Loopt, Nearby, Beetaun, Locly, Synchro Spot - списки приложений для iPhone 3G и Android пестрят разномастными реализациями одной и той же идеи.
Подключить самих пользователей к созданию геоконтента - важнейшая задача. К тому моменту, когда подоспеют мобильные системы дополненной реальности, он должен быть готов, ведь что толку в гиперссылках, если они никуда не ведут? С трехмерными моделями для дополненной реальности еще хуже: их изготовление обходится весьма недешево, и на откуп любителям эту задачу отдать труднее. Дело осложняется почти полным отсутствием общепринятых стандартов: информация, помещенная в одну систему, не годится для другой.
Ситуация в этой области напоминает период, предшествовавший распространению веба, когда каждый онлайновый сервис использовал несовместимое программное обеспечение. Момент, когда появится общепринятый и доступный стандарт, станет переломным в развитии геосервисов и мобильных систем дополненной реальности. Стоит ли пытаться предсказать, что произойдет дальше? Ни один прогноз из старых статей об augmented reality, которые я встретил, не сбылся. Вот и теперь все будет совсем не так, как мы представляем, - это единственное, в чем не приходится сомневаться.