примера эксперимент с Большим адронным коллайдером (БАК), проводимый Европейским советом по ядерным исследованиям[222] Ожидалось, что с 2007 года[223] крупнейший в мире ускоритель частиц начнёт производить петабайты сырых данных в год, данных, которые будут предварительно обработаны, структурированы и проанализированы командами из тысяч физиков по всему миру (заметьте, что петабайт — это квадриллион[224] байтов, другими словами, очень много данных!). В ходе этого процесса данных будет создано ещё больше. Появится необходимость управлять сотнями миллионов файлов, что включает их размещение в сотнях институтов.
Помимо этого существует ещё Решетка земной системы[225] (ESG), опытная таблица данных, включающая возможности суперкомпьютера с масштабными серверами для сохранения и анализа данных, созданная для учёных, занимающихся совместными исследованиями климатических явлений. Будучи когда-то единственным в своём роде, данный проект создаёт виртуальное пространство для сотрудничества, которое объединяет распределённые центры, пользователей, модели и данные на территории США. Данные для этого проекта собираются из самых разных источников, включая наземные и спутниковые датчики, компьютерное моделирование, а также тысячи независимых исследователей, размещающих в системе свои файлы. Специальные программы позволят учёным выполнять долгосрочное моделирование высокого разрешения, используя распределённые системы данных сообщества. Основатели ESG предполагают, что проект приведёт к революции в нашем понимании глобальных изменений климата.
Такие проекты вдохновляют исследователей во многих областях знаний на генерирование изменений, уже сейчас замещающих такие дисциплины, как биоинформатика и физика высоких энергий (физика элементарных частиц). Возьмите, например, астрономию. Редакторы журнала
По мере того как масштабные научные совместные проекты становятся нормой, учёные больше полагаются на распределённые методы сбора данных, проверяя точность открытий, тестируя гипотезы не только для ускорения работы, но и для повышения достоверности самих научных знаний. Быстрое, повторяющееся раскрытие информации привлечёт к пиринговому процессу ещё больше членов научного сообщества. Результаты будут проверены сотнями участников сообщества в один момент, а не пятёркой анонимных рецензентов чуть ли не через год. Это позволит новым знаниям быстрее поступать к практикам и предпринимателям.
В быстроразвивающихся дисциплинах, например, в физике высоких энергий и биоинформатике, этот совместный метод сбора и оценки публикаций уже становится реальностью. В 1991 году Пол Джинспарг[227] основал arXiv — общественный сервер, на котором физики могли размещать цифровые копии своих рукописей до публикации. Начав жизнь как механизм для обмена допечатными текстами в теоретической физике, ресурс быстро стал главной библиотекой для большой части исследовательской литературы по физике, компьютерным наукам, астрономии и многим математическим дисциплинам.
«Изначально я ожидал около ста поступлений в год от двух сотен человек в одной узкой области, на которую первоначально ориентировался, — объясняет Джинспарг. — Но с первого дня ежедневно поступало множество рукописей, и к концу года подключилось уже несколько тысяч человек».[228]
Сегодня более половины всех исследовательских публикаций по физике размещается на этом ресурсе. Они продолжают поступать со скоростью около 4,5 тысячи в месяц. Пользователи могут даже получать RSS-потоки, сообщающие им о новых публикациях в их области.
Доктор Пол Кемп[229] из Спелман-колледжа, активный пользователь сайта, говорит, что «[arXiv] намного быстрее традиционного издательского цикла». Однако самоорганизующееся вокруг arXiv сообщество справляется с сохранением важных элементов пиринговой оценки публикаций. «Мы хотим получить ценную, прошедшую пиринговое рецензирование информацию, — заявляет Кемп. — Какая разница, получили мы её от издателя, который организовал стороннее рецензирование публикации, или с помощью прямой обратной связи от сообщества людей, заинтересованных в предмете, по электронной почте в ответ на предпечатный текст на arXiv? Результат один».[230]
Недавние попытки, такие как Google Book Search, Public Library of Science и World Digital Library, сейчас строятся на концепции открытого доступа. Эти проекты собирают огромные объёмы научных исследований и достижений человеческой культуры в легкодоступных формах. Результаты новых исследований, которыми могли бы пользоваться только богатые подписчики, сейчас широко доступны на бесплатной основе для изучения и исследований. Более старые источники, которые при другом сценарии валялись бы в пыльных архивах, сейчас, в цифровом формате, получат новую жизнь и новых читателей.
Полностью укомплектованные открытые библиотеки смогут предоставить беспрецедентный доступ к человеческим знаниям. Улучшенный доступ к знаниям поможет углубить и расширить научный прогресс, дав каждому — от школьника до предпринимателя — возможность использовать его результаты.
Цифровые библиотеки являются лишь первым шагом к модернизации научных исследований и издательского процесса. Более значимые прорывы ещё будут происходить по мере того, как исследователи будут меньше надеяться на «бумагу» как на основной механизм для научного сотрудничества, и больше на такие инструменты, как блоги, вики, доступные в Сети базы данных. Такие блоги, как Bioethics, CancerDynamics, NodalPoint, Pharyngula и RealClimate, предполагают, что как минимум небольшая группа учёных, особенно молодых, уже использует новые формы коммуникаций.
Исследователи, включённые в OpenWetWare, проект Массачусетс ского технологического института, разработанный для обмена экспертными оценками, информацией и идеями по биологии, возвещают приход Науки 2.0. Двадцать лабораторий в различных институтах по всему миру уже используют сайт, выстроенный по типу Википедии, для обмена данными, стандартизации исследовательских протоколов и даже обмена материалами и оборудованием. Исследователи предполагают, что этот сайт станет полигоном для экспериментирования с более динамичными методами раскрытия и оценки научной работы. Лаборатории планируют генерировать RSS-потоки, которые поставляют результаты, как только они опубликованы, и используют методику вики для создания и изменения отчётов. Другие предлагают адаптировать функцию читательской оценки публикаций, аналогичную используемой на Amazon, что сделает пиринговое рецензирование быстрее и прозрачнее.
В то же время учёные Европейского института биоинформатики[231] используют услуги Сети, чтобы в корне изменить методы, которыми они извлекают и интерпретируют данные из различных источников, и создать абсолютно новые услуги, основанные на информации. Представьте, например, что вы хотели найти все данные, которые существуют о животном, от его систематики и генетической последовательности до ареала обитания. Теперь представьте, что у вас есть возможность собрать вместе последнюю информацию об этом животном из всех биологических баз данных мира просто одним кликом мыши. Это не преувеличение. Такая возможность существует уже сейчас.
В последних публикациях по вопросам научных данных, редакторы журнала
Как пишет