Геологический Google - что это такое и каким он будет
18 марта 2020 г.
Бюро Отделения наук о Земле РАН обсудило вопрос участия российских ученых в новой программе Международного союза геологических наук (IUGS) Deep-Time Digital Earth (DDE).
Председатель Национального комитета геологов России, академик РАН М. А. Федонкин представил ознакомительную презентацию DDE, подготовленную коллегами из Китая.
В разных странах мира существуют огромные хранилища геологических данных различного профиля. В некоторых случаях специалисты этих стран могут получить не только реальный, но и виртуальный доступ к хранящимся в них данным.
А можно ли сделать такие важные сведения общедоступными в мировом масштабе? Такая задача – не простая дань модной глобализации. Это насущная необходимость для решения сложных геологических задач и задач, обеспечивающих безопасность людей. Таким образом, идея создания сети баз геонаучных данных витала в воздухе давно и такие попытки уже предпринимались.
Миссия новой программы – накопление, обработка и гармонизация глобальных цифровых данных о древней Земле и совместное использование глобальных знаний в области геонаук. Теперь эта работа возможна благодаря революционным изменениям в мире цифровых технологий. Однако, потребуется формирование новых протоколов, платформ и программ для того, чтобы геоданные, сохранившие на разных носителях, изложенные на разных языках и в терминах разных научных дисциплин в разных базах данных, могли быть совместимыми и операционально пригодными. Эта большая работа предполагает анализ Больших Данных с помощью суперкомпьютеров, облачные вычисления в интернете, машинное обучение и искусственный интеллект.
Процесс будет осуществляться через систему связанных сетей, сформированных для удобства и поощрения международного сотрудничества специалистов в области различных наук о Земле со специалистами в таких областях, как компьютерная инженерия, геоинформатика, наука о Больших Данных, экономика и социология.
Исследования по программе DDE сосредоточатся в четырех основных направлениях:
1. Жизнь, эволюционная история биосферы, модели динамики глобального биоразнообразия. Анализ больших данных в этой области помогут выявить факторы окружающей среды, влиявшие на эволюцию живого в прошлом, и позволят глубже понимать проблемы биоразнообразия в настоящем.
2. Материалы, характер пространственного и временного распределения минеральных ресурсов, геологическое и палеогеографическое положение месторождений полезных ископаемых в истории Земли. Эти данные крайне важны для развития промышленности и технологий.
3. Палеогеография, совершенствование реконструкций высокого пространственного и временного разрешения станет новой основой палеотектонических, палеоклиматических и ресурсных исследований.
4. Климат, адаптация к его изменениям – обширные геонаучные данные будут иметь возрастающее значение для прогноза и разработки мер адаптации к последствиям климатических изменений. Одна из критических проблем в этой сфере – достоверная информация о подземных водах.
В числе ближайших этапов программы DDE – создание трех центров передового опыта (в Китае, Великобритании и США), имеющих совместимые базы данных для их обмена. Планируется формирование 4D цифровой модели Земли, представляющей полную эволюцию всех геосфер. Будет создана интернет-платформа открытого доступа (подобие геологического Google), гарантирующая равные возможности для физических лиц и организаций всех стран в сфере получения данных и образования. Предполагается создание периодически обновляемых стандартных ссылок IUGS, в частности, палеогеографического атласа IUGS и системы знаний для машинного обучения и интеллектуального анализа данных.
У создаваемой сейчас сети DDE есть определенное преимущество перед ее предшественниками. Это, во-первых, понимание мировой геонаучной общественностью необходимости свободного обмена геонаучной информацией, во-вторых, финансирование и поддержка инфраструктуры сети со стороны правительства Китая, и в-третьих, полученная в декабре 2018 года поддержка исполнительного комитета Международного союза геонаук – сегодня DDE является первой признанной Программой Большой Науки IUGS.
Среди учредителей программы – ВСЕГЕИ и Российский федеральный геологический фонд.
А началось все с оцифровки данных из китайской базы, названной «База данных геобиоразнообразия» (Geobiodiversity Database — GBDB). Её создал в 2006 году китайский палеонтолог Фань Цзюньсюанем (Fan Junxuan) из Нанкинского университета. Китай к тому моменту накопил огромные запасы данных в области наук о Земле, но они были разбросаны по многочисленным коллекциям и учреждениям. Фань, который в то время работал в Нанкинском институте геологии и палеонтологии при Академии наук Китая, организовал GBDB вокруг геологических разрезов, пород и окаменелостей в каждом пласте.
Норман МакЛеод (Norman MacLeod), палеобиолог из Музея естественной истории в Лондоне и консультант DDE, говорит, что GBDB преуспел там, где схожие попытки потерпели неудачу. В прошлом, по его словам, ученые-добровольцы пытались сделать почти все сами, включая информатику и управление данными. Вместо этого GBDB платит неспециалистам за ввод данных, почерпнутых из журналов по естествознанию, освещающих результаты китайских исследований. Затем палеонтологи и стратиграфы проверяют данные на предмет точности и согласованности. В свою очередь, специалисты по информационным технологиям курируют базу данных и создают программное обеспечение для поиска и анализа данных. Постоянное финансирование также способствовало успеху GBDB.
Ученые-геологи за пределами Китая начали использовать GBDB, и она стала официальной базой данных Международной комиссии по стратиграфии в 2012 году. Затем европейские и китайские ученые начали задаваться вопросом, могут ли средства информатики, разработанные для GBDB, помочь создать более широкий союз баз данных. Главная идея состоит в том, чтобы заставить имеющиеся большие базы данных использовать одни и те же стандарты и ссылки.
Фань также надеется, что отдельные учреждения будут вносить свой вклад, обмениваясь данными, разрабатывая аналитические инструменты и поощряя участие своих ученых. По его словам, после того, как ученые освободятся от тяжелой работы по сбору разрозненных данных, у них будет время для более важных задач, таких как ответы на «вопросы об эволюции жизни, материалов, географии и климата в глубоком времени».
Согласно формулировке Международного союза геологических наук, целью DDE является создание больших связанных естественнонаучных центров данных. Центры могут взаимодействовать с другими базами данных, включая опубликованные данные в открытом доступе и неопубликованные данные в учреждениях и экспертных центрах.
Подобно международному проекту OneGeology, целью которой является составление единой геологической карты Мира, DDE будет стремиться предоставлять согласованные данные в удобной форме для науки, общественности и промышленности. Но, в отличие от других существующих баз данных, DDE предоставит геологию и географию с учетом временной составляющей, а также данные о свойствах этих геологических данных. Таким образом, DDE предоставит информацию о распределении и стоимости земных ресурсов и материалов, а также об опасностях — одновременно обеспечивая представление о геологическом будущем Земли.
Реализация этой программы уже началась: в конце февраля 2019 года в Пекине прошла трехдневная встреча, посвященная запуску программы DDE ко времени проведения в Дели 36 Международного геологического конгресса 2020 года. В работе форума приняли участие представители 40 геологических научных организаций Мира, в том числе и делегация Всероссийского научно-исследовательского геологического института им. А.П. Карпинского.
Подобные программы создаются не только в Китае, но и в других странах.
Среди членов бюро ОНЗ РАН развернулась дискуссия о формах сотрудничества с DDE.
«Надо ли нам включаться в этот проект – очень сложный вопрос. – считает академик РАН А. Д. Гвишиани, – Китайцы демонстрируют огромные успехи в создании, и, главное, в правильной математической обработке Больших Данных. Математика 20 века – это была достаточно развитая математика 19 века. Она акцентировалась на одной стороне явления, не давая целостной картины. Со временем данных стало настолько много, они стали такими разнообразными и появляются так быстро, что это коренным образом изменило математику 21 века. Системный анализ – это объединение связанных друг с другом методов дискретной математики, которые дают возможность узнать ядро знания целиком. Для этого нужно собрать разные знания.
Китайцы в этом сильно продвинулись. У них есть финансовые средства и человеческие ресурсы для воплощения этого проекта. Они создали центр данных, где будут работать колоссальные серверы и где будут объединены самые различные данные наук о Земле. Это дает возможность выйти на системное моделирование в формате 4D.
У нас же в стране вообще не ведется эта работа. Поэтому считаю предложенный проект очень интересным. Конечно, надо войти в него и знать о его работе. Но участвовать на равных в этом деле нам будет сложно».
Академик-секретарь Отделения наук о Земле РАН, академик РАН А. О. Глико высказал мнение, что, прежде чем входить в программу, нужно понимать: что на самом деле дают Большие Данные для понимания природы, явлений? Как эти результаты реально используются в естественной науке? Данных может быть очень много, но много ли в них нового? Получив четкие ответы на эти вопросы, мы сможем аргументированно поднимать тему создания собственной современной базы данных – дорогостоящей масштабной задачи правительственного уровня.
«Вопрос о данных ставится сегодня перед каждым руководителем научной организации, – подчеркнул академик РАН Н. С. Бортников. – Существует огромное количество отчетов, авторских данных, уникальных карт, которые, с уходом старшего поколения, просто потерялись. В лучшем случае, они либо разбросаны по статьям, или просто лежат в столах. Если данные и сохраняются в каких-то институтах, то они, наверняка, не оцифрованы. Нет общей базы, нет общей картины.
С моей точки зрения, они будут потеряны навсегда для будущего человечества. И придется проводить изучение заново и тратить огромные средства. Ну или вообще забыть об этих исследованиях, как будто их не было никогда.
Я считаю, надо встраиваться в программу DDE, но единую базу научно-исследовательских данных однозначно надо делать и у нас в стране. Это большая работа, которая требует отдельного финансирования и отдельного института. И вопрос об этом надо ставить на самом высоком уровне».
Татьяна Пономаренко
Презентация Deep-time Digital Earth: Introduction and progress in 2019