Олег Бартунов, научный сотрудник, ГАИШ МГУ
Гранты РФФИ: 96-07-89395-в, 99-07-90069-в, 02-07-90222-в, 05-07-90225-в
Проект посвящен анализу проблем в информационной инфраструктуре современной науки и поиску путей их преодоления.
Повсеместное распространение интернет, ускорение и унификация доступа к информации и т.п. привело к формулированию концепции киберобщества (информационного общества) как реалистичного сценария постиндустриального общества - новой исторической фазы развития цивилизации, в которой главными продуктами производства являются информация и знания.
Составной частью информационного общества является так называемая e-Science - синтез науки и информатики, наступающий когда роль информации и ее обработки в научных исследованиях становится превалирующей. Переход на e-стадию (информационную стадию) развития - реальная ситуация, затронувшая на сегодняшний день ряд естественных наук, оперирующих огромными объемами информации: физика (в первую очередь исследование элементарных частиц и физика высоких энергий), геофизика и геология, астрономия, биология, экономика, медицина.
Причины "информационного взрыва" в астрономии обусловлены следующими факторами:
Доступ к информации осложнен тем, что результаты наблюдений хранятся в неоднородных распределенных архивах. Разнородность архивов определяется тем, что они создавались независимо и были ориентированы на различные эксперименты со своими целями. Распределенность информации связана со следующими причинами:
Кроме того, астрономы стали работать с бОльшим количеством объектов, что делает интерактивную работу с хранилищами данных крайне неэффективной. Необходимость взаимодействия со многими хранилищами данных (географически удаленные центры данных, разные каталоги) делает интерактивную работу практически невозможной.
Таким образом, на примере астрономии видна необходимость новых методов научных исследований и новой информационной инфраструктуры, способной обеспечить унифицированный доступ к разнородным и распределенным очень большим хранилищам слабо-структурированной информации. При этом, на первый план выступают методы, основанные на программном, неинтерактивном доступе к информации, способные перерабатывать огромные её объемы.
Одним из наиболее перспективных направлений развития информационной инфраструктуры науки на данном этапе считается переход к сервисно-ориентированной архитектуре, которая обеспечивает доступ к информационным системам стандартными и унифицированными средствами.
В астрономии сервисно-ориентированная архитектура получила название Виртуальной Обсерватории. Международный Альянс Национальных Виртуальных Обсерваторий (http://www.ivoa.net) координирует деятельность национальных ВО и занимается разработкой стандартов и протоколов, специфических для астрономии. Основной задачей Виртуальной Обсерватории является обеспечение астронома данными независимо от способа и места их хранения, а также инструментами для поиска закономерностей и анализа данных. Таким образом, Виртуальная Обсерватория предоставит астроному уникальное средство исследования космоса - Всемирный Телескоп, который будет доставлять данные независимо от погодных условий !
Для российской астрономии задача интеграции в мировое астрономическое сообщество жизненно важна, так как практически все существующие центры данных ориентируются на новую технологию, а новые проекты полностью ориентированы на новые стандарты описания, хранения и доступа к данным. Поэтому доступ к данным очень скоро превратится в то узкое место, которое будет мешать научным исследованиям. При этом проблема будет не в качестве каналов связи, не в доступности архивов, а в совместимости информационной инфраструктуры российской науки и международного сообщества. Новые российские проекты необходимо с самого начала ориентировать на такую совместимость.
Проект "Астронет (http://www.astronet.ru) ГАИШ МГУ при поддержке РФФИ ( гранты 96-07-89395-в, 99-07-90069-в, 02-07-90222-в, 05-07-90225-в ) с самого начала ставил задачи, нацеленные на исследование и применение информационных технологий в науке (астрономия), рассматривая практическое применение результатов, полученных в ходе исследований, как важнейший фактор успешности проекта. Информационные системы в естественных науках не являются частью этих наук, они представляют собой очень удобные (а сегодня уже незаменимые) инструменты исследования, однако они являются научной инфраструктурой, без которой эффективное развитие науки сегодня уже невозможно. Вопросы научно-информационного обмена неотделимы от всего процесса развития науки в целом, они возникли и развиваются вместе с ней. Многовековая практика развития науки показала необходимость сбалансированного развития всех доступных методов научных коммуникаций, от личного общения специалистов, занимающихся одной и той же задачей, специальных семинаров, конференций и симпозиумов, включающих значительно более широкий круг специалистов, зачастую представляющих несколько смежных наук, и до таких, ориентированных на значительно более широкую аудиторию, форм, как написание учебников и научно-популярных книг с статей ведущими специалистами. К этим "классическим" методам обмена информацией современная информатика и, в первую очередь, интернет добавили очень и очень много. За время существования нашего проекта произошли уже описанные изменения в науке, изменились возможности интернета (бОльшие скорости, бОльшая доступность), рос наш опыт (мы многому научились, на проекте выросло поколение молодых специалистов, активно занимающихся сейчас научными и смежными вопросами). Соответственно, проект прошел несколько стадий.
1). Вначала было создано хранилище информации институтского уровня с передовыми на тот момент средствами доступа: ftp- и web-серверами, с продуманной структурой и интересным (до сих пор) содержанием.
2). Затем оно превратилось в цифровую библиотеку - в связи с появлением в сети большого количества научной информации, которую требовалось уметь хранить, организовывать поиск информации.
3). Немного позже, когда в проект были введены средства для создания собственных электронных публикаций и ряд полезных интерактивных приложений (системы on-line расчетов фиксированных событий, новостные ленты, поисковая система по российским астрономическим ресурсам и пр.) проект развился в Отраслевой Астрономический Портал (который с момента его появления и по настоящее время остается самым популярным русскоязычным астрономическим ресурсом). Портал является технологическим средством, позволяющим максимально эффективно, оперативно и квалифицированно доносить современную научную информацию до всех заинтересованных в ней читателях - ученых, инженеров, аспирантов, студентов. Его важность для астрономии определяется большим количеством новых открытий в современной астрономии, которые невозможно охватить традиционными печатными изданиями, все более узкой специализацией астрономов-профессионалов, для которых портал дает возможность ознакомиться с новостями в смежных областях.
4). И, наконец, в последние годы в рамках проекта появилась и стала интенсивно развиваться Виртуальная Обсерватория - сервисно-ориентированный источник астрономической информации, содержащий самые современные данные и каталоги и работающий по стандартам, разработанным Международным Альянсом Виртуальных Обсерваторий, в который входит и Россия. Сервер проекта http://vo.astronet.ru является крупнейшим в России и Европе центром астрономических данных, работающим по стандартам Виртуальной Обсерватории. Он входит в консорциум Российская Виртуальная Обсерватория. Проект состоит из многотерабайтного хранилища астрономических каталогов, а также ряда веб-сервисов, предоставляющих доступ к хранилищу и реализующие основные астрономические запросы. Отметим, что многие из этих каталогов существуют в единственном экземпляре в России, так как организация подобного хранилища является серьезной инженерной задачей и требует значительного финансирования и наличия квалифицированных специалистов. Поэтому организация свободного доступа к таким каталогам является очень важным для российских астрономов и первоочередной задачей нашего проекта. Кроме того, мы предоставляем полнотекстовый поиск по электронным архивам препринтов с распознаванием астрономической терминологии и номенклатуры названий астрономических объектов и службу уточнения координат объектов на астрономических изображениях.
Сайт проекта "Астронет" входит в топ-400 всех российских сайтов (из примерно 100,000 сайтов) и в топ-20 всех научных сайтов по независимой оценке рейтинга Yandex. По результатам голосованиям астрономического сообщества сайт ежегодно занимает первые места по номинациям "Лучший астрономический сайт" и "Лучший образовательный астрономический сайт". Ежемесячно сайт проекта посещают около 130-180 тысяч уникальных посетителей, которые читают 2-3 миллиона страниц (запросы от поисковых роботов в статистике не участвуют).
Результаты работы были опубликованы в научных статьях и представлены на конференциях как на российских, так и на международных. С помощью Виртуальной Обсерватории ГАИШ в нашей Галактике были открыты два шаровых скопления с очень слабой светимостью. Разработанные технологические решения доступны и используются в других проектах.
Развитие проекта предполагает
В заключение хочется подчеркнуть роль РФФИ в целом и 7-го отдела в частности в развитии нашего проекта и многих других, определивших тот уровень информационной инфраструктуры в российской науке, столь необходимый для современных научных исследований. Кроме того, многолетняя поддержка позволила вырастить целое поколение специалистов, которые сейчас определяют новые рубежи информационной инфраструктуры общества.