и картин до кинофильмов и компьютерных игр.
Для эффективной обработки подобной информации используются статистические алгоритмы, позволяющие путём анализа самых разнообразных документов устанавливать связь разных понятий друг с другом. Проще говоря, она определяет, какие слова чаще всего употребляются вместе. К примеру, "Кремль" чаще связан со словами "Россия", "Москва", чуть реже с "Казань", "Нижний Новгород", ещё реже – с "собор", "икона"" и т.п. Хотя эти алгоритмы известны давным-давно, полноценно применять их стало возможно лишь в последнее десятилетие – после кардинального роста производительности вычислительной техники и снижения стоимости накопителей для хранения огромных массивов данных.
Команда Феруччи загружает в память IBM Watson миллионы всевозможных документов – учебники, энциклопедии, справочники, художественную и религиозную литературу. Для анализа вопросов одновременно используется более сотни алгоритмов, предлагающих сотни возможных решений. Затем другие алгоритмы оценивают достоверность потенциальных ответов, отсеивая невозможные в силу объективных причин (например, несоответствия даты события и лет жизни действующих лиц) и маловероятные. Чем больше будет получено одинаковых ответов, тем выше вероятность, что они правильны – в процессе игры, на табло выводится рейтинг из нескольких самых вероятных ответов, помимо чаще всего встречающегося.
К 2008 году IBM Watson переместился из разряда "неудачников" на верхние строчки так называемого "облака победителей", состоящего из людей, в 50% случаев успевающих первыми нажать кнопку, сигнализирующую о готовности к ответу и затем в 85-95% случаев дающих правильный ответ. В IBM даже договорились с продюсерами Jeopardy о проведении осенью 2010 года специальной серии игр с участием Watson и победителей прошлых лет. Для подготовки к этим играм (то есть фактически для совершенствования алгоритмов) был воссоздан примерный интерьер студии викторины и стали проводиться испытания с участием живых игроков и ведущего. При этом, как и полагается, "Ватсон" даёт свои ответы вслух синтезированным компьютерным голосом, чем немало веселит присутствующих.
В ходе "тренировок" выяснился занятный факт: несмотря не весь потенциал Watson, он может не только выигрывать большинство игр, но и проигрывать более половины из них. Причин несколько: от "его величества случая" (возможны ситуации, когда соперник может выиграть, просто повышая ставки, оставив машину банкротом) до специфики правил. Как ни странно, но человек способен быстрее нажать на кнопку, чем машина, и это связано с правилами игры, которые менять нельзя.
Дело в том, что каждый вопрос выводится на экран и зачитывается ведущим, причём нажать на кнопку можно только после окончания чтения вопроса. Watson получает текст вопроса в электронном виде одновременно с его выводом на экран, но даже при этом он не успевает прийти к готовому решению быстрее человека. Пока ведущий читает вопрос, на что уходит шесть-семь секунд, опытный игрок уже может оценить свои шансы дать правильный ответ и готов нажать на кнопку за какие-то десятки миллисекунд. На последующий ответ правила отводят ещё пять секунд.
Нажимая на кнопку, человек рискует: если он не даст правильный ответ на вопрос за 100 единиц, его виртуальный счёт опустеет на ту же сумму. Компьютер не склонен рисковать и выдаёт ответы только после проведения всех расчётов и только в том случае, если у него достаточно сведений для оценки достоверности и вероятности того, что этот ответ правильный. Как это выглядит в процессе игры, можно увидеть на видеролике. Рискуя, живой игрок может выиграть благодаря тому, что вспомнит нужный ответ за имеющиеся в его распоряжении 11-12 секунд.
В чуть более формализованной ситуации, чем телевикторина, алгоритмы Watson способны дать куда более предсказуемые и точные ответы. В частности, глава исследовательского подразделения IBM Джон Келли намерен создать медицинскую версию этого устройства под неофициальным названием Watson M.D. Такая система помогла бы врачам быстро принимать правильные решения с учётом огромного множества данных о пациенте, которые физически невозможно всегда удерживать в памяти. "Ватсон" вполне может заменить живых операционистов в компьютерных и телефонных службах в розничной торговле, в банковской сфере и на транспорте.
Стоимость системы класса IBM Watson на сегодняшний день может составить несколько миллионов долларов, поскольку для её работы требуется по крайней мере один суперкомпьютер IBM за миллион долларов. Келли считает, что в ближайшие десять лет подобная технология может быть реализована на гораздо более дешёвом сервере, а в перспективе такая программа будет работать на компьютере не дороже современного ноутбука.
PS. Знающие английский язык могут сразиться с IBM Watson онлайн на сайте The New York Times. Вы, конечно, проиграете.
дана бойд: 4chan и взлом экономики внимания
Автор: дана бойд
(Пояснение для начинающих: если вы никогда не слышали про 4chan, ни в коем случае не отправляйтесь туда немедленно. Этот сайт способен оскорбить чувства многих взрослых людей. Начните лучше со статьи о нём в "Википедии". Как говорит один мой знакомый, любить мемы вроде LOLcats или "рикролла" - это всё равно, что любить вкусные гамбургеры; посещение 4chan, скорее, напоминает поход на мясокомбинат. Это, наверное, полезно когда-нибудь сделать, но в итоге есть опасность превратиться в вегетарианца.)
За минувший год 4chan выбрался из полной безвестности и был признан мейнстримной прессой важным явлением. Возможно, дело в появлении "мута" (Кристофер Пул по прозвищу moot - создатель 4chan) на первом месте в списке самых влиятельных людей мира, публикуемом в журнале Time. Ещё вероятнее, что всё завертелось после того, как "мут" выступил на конференции TED с докладом об анонимности.
На TED "мут" продемонстрировал более "разумную" сторону андеграундного сайта, который посторонним обычно кажется выгребной ямой интернета, и тем самым заявил о себе как об одном из самых интересных, вдумчивых и понимающих лидеров сообществ в интернете. Короче, он оказался тем, кого серьёзные люди готовы принять, даже если его сайт пугает их до чёртиков.
Вот тут-то 4chan и "выстрелил". Журналисты и учёные наперебой обсуждают и анализируют 4chan. Поначалу все дискутировали о том, считать ли это сообщество, состоящее из 9,5 миллионов (в основном) молодых людей (в основном) мужского пола, ужасным или прекрасным. Затем шумиха поднялась вокруг анонимности - судя по всему, под влиянием выступления Криса на TED.
Обе темы определённо интересны. С одной стороны, 4chan породил большую часть любимых интернетом мемов. С другой стороны, "битарды" (участники самого популярного форума 4chan) принадлежат к числу самых мерзких и вредных троллей в Сети. И анонимность - очень сложная тема, которую нельзя свести к вопросу об ответственности за свои поступки в свете того, видится ли анонимный комментатор собеседнику "хорошим" или "плохим".
Я могла бы написать длинную статью о противоречии между анонимностью, которую люди рассчитывают найти в интернете, и простотой идентификации людей в Сети по сравнению с оффлайном, но речь сейчас не об этом. Речь о другом: я полагаю, что 4chan - это, на самом деле, новое поколение хакерской культуры. И именно с этой позиции его стоит оценивать (или поносить).
Я выросла в сообществе хакеров на закате эры взломщиков защищённых систем. Многие мои друзья в старших классах гордились своими умениями в области фрикинга или взлома сложных систем