примера эксперимент с Большим адронным коллайдером (БАК), проводимый Европейским советом по ядерным исследованиям[222] Ожидалось, что с 2007 года[223] крупнейший в мире ускоритель частиц начнёт производить петабайты сырых данных в год, данных, которые будут предварительно обработаны, структурированы и проанализированы командами из тысяч физиков по всему миру (заметьте, что петабайт — это квадриллион[224] байтов, другими словами, очень много данных!). В ходе этого процесса данных будет создано ещё больше. Появится необходимость управлять сотнями миллионов файлов, что включает их размещение в сотнях институтов.

Помимо этого существует ещё Решетка земной системы[225] (ESG), опытная таблица данных, включающая возможности суперкомпьютера с масштабными серверами для сохранения и анализа данных, созданная для учёных, занимающихся совместными исследованиями климатических явлений. Будучи когда-то единственным в своём роде, данный проект создаёт виртуальное пространство для сотрудничества, которое объединяет распределённые центры, пользователей, модели и данные на территории США. Данные для этого проекта собираются из самых разных источников, включая наземные и спутниковые датчики, компьютерное моделирование, а также тысячи независимых исследователей, размещающих в системе свои файлы. Специальные программы позволят учёным выполнять долгосрочное моделирование высокого разрешения, используя распределённые системы данных сообщества. Основатели ESG предполагают, что проект приведёт к революции в нашем понимании глобальных изменений климата.

Такие проекты вдохновляют исследователей во многих областях знаний на генерирование изменений, уже сейчас замещающих такие дисциплины, как биоинформатика и физика высоких энергий (физика элементарных частиц). Возьмите, например, астрономию. Редакторы журнала Nature недавно заметили: «Десятилетие назад астрономия во многом касалась групп, хранящих результаты своих наблюдений в секрете и публикующих частные выводы. Сейчас данная наука организована вокруг больших объёмов данных, которыми обмениваются, которые кодируют и делают доступными общественности».[226]

По мере того как масштабные научные совместные проекты становятся нормой, учёные больше полагаются на распределённые методы сбора данных, проверяя точность открытий, тестируя гипотезы не только для ускорения работы, но и для повышения достоверности самих научных знаний. Быстрое, повторяющееся раскрытие информации привлечёт к пиринговому процессу ещё больше членов научного сообщества. Результаты будут проверены сотнями участников сообщества в один момент, а не пятёркой анонимных рецензентов чуть ли не через год. Это позволит новым знаниям быстрее поступать к практикам и предпринимателям.

В быстроразвивающихся дисциплинах, например, в физике высоких энергий и биоинформатике, этот совместный метод сбора и оценки публикаций уже становится реальностью. В 1991 году Пол Джинспарг[227] основал arXiv — общественный сервер, на котором физики могли размещать цифровые копии своих рукописей до публикации. Начав жизнь как механизм для обмена допечатными текстами в теоретической физике, ресурс быстро стал главной библиотекой для большой части исследовательской литературы по физике, компьютерным наукам, астрономии и многим математическим дисциплинам.

«Изначально я ожидал около ста поступлений в год от двух сотен человек в одной узкой области, на которую первоначально ориентировался, — объясняет Джинспарг. — Но с первого дня ежедневно поступало множество рукописей, и к концу года подключилось уже несколько тысяч человек».[228]

Сегодня более половины всех исследовательских публикаций по физике размещается на этом ресурсе. Они продолжают поступать со скоростью около 4,5 тысячи в месяц. Пользователи могут даже получать RSS-потоки, сообщающие им о новых публикациях в их области.

Доктор Пол Кемп[229] из Спелман-колледжа, активный пользователь сайта, говорит, что «[arXiv] намного быстрее традиционного издательского цикла». Однако самоорганизующееся вокруг arXiv сообщество справляется с сохранением важных элементов пиринговой оценки публикаций. «Мы хотим получить ценную, прошедшую пиринговое рецензирование информацию, — заявляет Кемп. — Какая разница, получили мы её от издателя, который организовал стороннее рецензирование публикации, или с помощью прямой обратной связи от сообщества людей, заинтересованных в предмете, по электронной почте в ответ на предпечатный текст на arXiv? Результат один».[230]

Недавние попытки, такие как Google Book Search, Public Library of Science и World Digital Library, сейчас строятся на концепции открытого доступа. Эти проекты собирают огромные объёмы научных исследований и достижений человеческой культуры в легкодоступных формах. Результаты новых исследований, которыми могли бы пользоваться только богатые подписчики, сейчас широко доступны на бесплатной основе для изучения и исследований. Более старые источники, которые при другом сценарии валялись бы в пыльных архивах, сейчас, в цифровом формате, получат новую жизнь и новых читателей.

Полностью укомплектованные открытые библиотеки смогут предоставить беспрецедентный доступ к человеческим знаниям. Улучшенный доступ к знаниям поможет углубить и расширить научный прогресс, дав каждому — от школьника до предпринимателя — возможность использовать его результаты.

Коллаборативная наука на практике

Цифровые библиотеки являются лишь первым шагом к модернизации научных исследований и издательского процесса. Более значимые прорывы ещё будут происходить по мере того, как исследователи будут меньше надеяться на «бумагу» как на основной механизм для научного сотрудничества, и больше на такие инструменты, как блоги, вики, доступные в Сети базы данных. Такие блоги, как Bioethics, CancerDynamics, NodalPoint, Pharyngula и RealClimate, предполагают, что как минимум небольшая группа учёных, особенно молодых, уже использует новые формы коммуникаций.

Исследователи, включённые в OpenWetWare, проект Массачусетс ского технологического института, разработанный для обмена экспертными оценками, информацией и идеями по биологии, возвещают приход Науки 2.0. Двадцать лабораторий в различных институтах по всему миру уже используют сайт, выстроенный по типу Википедии, для обмена данными, стандартизации исследовательских протоколов и даже обмена материалами и оборудованием. Исследователи предполагают, что этот сайт станет полигоном для экспериментирования с более динамичными методами раскрытия и оценки научной работы. Лаборатории планируют генерировать RSS-потоки, которые поставляют результаты, как только они опубликованы, и используют методику вики для создания и изменения отчётов. Другие предлагают адаптировать функцию читательской оценки публикаций, аналогичную используемой на Amazon, что сделает пиринговое рецензирование быстрее и прозрачнее.

В то же время учёные Европейского института биоинформатики[231] используют услуги Сети, чтобы в корне изменить методы, которыми они извлекают и интерпретируют данные из различных источников, и создать абсолютно новые услуги, основанные на информации. Представьте, например, что вы хотели найти все данные, которые существуют о животном, от его систематики и генетической последовательности до ареала обитания. Теперь представьте, что у вас есть возможность собрать вместе последнюю информацию об этом животном из всех биологических баз данных мира просто одним кликом мыши. Это не преувеличение. Такая возможность существует уже сейчас.

В последних публикациях по вопросам научных данных, редакторы журнала Nature (одного из ведущих научных изданий мира) предполагают, что для использования эффективности сетевых услуг научные институты должны пересмотреть методы сбора и управления данными.[232] Сетевые сервисы работают, только если компьютеры подключены к данным в реальном времени. Многие крупные общественные базы данных, такие как GenBank, уже дают возможность беспрепятственного доступа к своей информации. Но, как утверждает Nature, многие исследовательские организации всё ещё цепляются за устаревшую, ручную политику предоставления доступа к данным, что мешает развитию сетевых услуг.

Как пишет Nature, учёные немало инвестируют в сбор данных, поэтому понятно, что многие считают справедливым сохранение привилегированного доступа к результатам. Но существует большой объём данных, которые не нужно хранить за забором. Лишь немногие организации

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату