исключить человеческий фактор, и новые алгоритмы работают намного лучше использовавшихся каких-то три года назад, потому-то они и привлекают к себе широкое внимание. Они опираются на мощные вычислительные ресурсы серверных парков и на очень большие массивы данных, которых раньше не существовало. Но, что важнее всего, они также опираются на последние научные разработки.
Известный пример того, как они работают, — это маркировка изображения как относящегося к классу «ребенок с мягкой игрушкой». Когда вы смотрите на изображение, то именно это и видите. Алгоритм очень хорошо справился с маркировкой, намного лучше, чем прогнозировали практикующие специалисты по искусственному интеллекту. Но у него нет полноты компетентности, которая есть у человека, имеющего дело с тем же самым изображением.
Алгоритм обучения знает, что на изображении есть ребенок, но не знает строения ребенка, равно как не знает и того, где именно на изображении он расположен. Нынешние алгоритмы глубокого обучения способны только обозначить вероятность для каждого пикселя: что именно этот пиксель является частью ребенка. В то время как человек видит, что ребенок занимает среднюю четверть изображения, у современного алгоритма есть только вероятностное представление о пространственной протяженности ребенка. Он не способен применить исключающее правило и заявить, что пиксели на границах изображения не могут с ненулевой вероятностью также не быть частью ребенка. Если взглянуть на слои нейронов изнутри, то мы увидим, что одно из свойств, изученных на данном уровне, — это участок изображения, похожий на глаз, а другое — участок, похожий на стопу. Однако нынешние алгоритмы не способны понять, какие пространственные отношения между глазами и ступнями в принципе допустимы на данном изображении, а потому их можно легко одурачить, подсунув им гротескный коллаж из частей ребенка, и они посчитают, что на изображении — ребенок. Ни один человек такого не сделает; он сразу ясно увидит, что ему подсунули какую-то ерунду. А еще современный алгоритм не сможет сообщить роботу, в какой точке пространства нужно захватить ребенка, чтобы поднять его, где надо держать бутылочку, чтобы накормить его, и с какой стороны подойти, чтобы поменять подгузник. Даже самому современному алгоритму очень далеко до компетентности человеческого уровня в области понимания изображений.
Полным ходом ведутся работы над тем, чтобы добавить в глубинное обучение направленность внимания и обработку согласованной пространственной структуры. Это тяжелый научно-исследовательский труд, и мы понятия не имеем о том, насколько сложным он будет, сколько уйдет времени, а также не заведет ли нас в тупик такой подход. Потребовалось около 30 лет, чтобы проделать путь от обратного распространения до глубинного обучения, и многие исследователи считали, что у обратного распространения нет будущего. Они ошибались, но я бы не удивился, если бы они оказались правы, поскольку мы все же узнали, что алгоритм обратного распространения — это не то, что происходит в голове у человека.
Страхи по поводу того, что системы искусственного интеллекта выйдут из под контроля и либо покорят людей, либо сделают их лишними на планете, не имеют ни малейшего основания. Введенные в заблуждение «словами-чемоданами», люди совершают ошибки категоризации — ошибки такого рода, как если бы распространение более эффективных двигателей внутреннего сгорания означало скорое появление варп-двигателей.
Искусственный интеллект сделает вас умнее
Глубинное обучение — актуальная сегодня тема в области машинного обучения. Первые алгоритмы такого рода появились в 1980-х годах, но компьютеры тогда были медленными и могли моделировать лишь несколько сотен нейронов с одним слоем скрытых элементов между вводом и выводом. Обучение на примерах — привлекательная альтернатива искусственному интеллекту, основанному на правилах, ведь его создание — очень трудоемкая задача. С бо?льшим количеством слоев скрытых элементов между вводом и выводом можно получить больше абстрактных свойств из данных для обучения. В структуре коры головного мозга миллиарды нейронов образуют десять слоев. Раньше много спорили о том, насколько будет улучшаться производительность нейронных сетей с ростом их размеров и глубины. В те годы не хватало не только более производительных компьютеров, но также и больших объемов данных для обучения сети.
Благодаря 30 годам исследований, повышению производительности компьютеров в миллион раз и большим данным из интернета мы теперь знаем ответ на этот вопрос: нейронные сети, увеличенные до двенадцати слоев в глубину и имеющие миллиарды связей, превзошли по эффективности лучшие алгоритмы машинного зрения и распознавания объектов, а также коренным образом изменили расшифровку речи. Алгоритмы редко так хорошо масштабируются, а это может означать, что скоро нейронные сети научатся решать и более сложные проблемы. Последние достижения науки и техники позволяют применить глубинное обучение к обработке естественного языка. Глубинные рекуррентные сети с кратковременной памятью научились переводить предложения с английского на французский и продемонстрировали высокие результаты. Другие сети глубинного обучения оказались способны создавать подписи к изображениям, проявив при этом неожиданную проницательность, а иногда даже остроумие.
Контролируемое обучение, использующее нейронные сети, — это шаг вперед, но им все-таки еще далеко до интеллекта. Функции, выполняемые ими,