Геологический Google - что это такое и каким он будет

18 марта 2020 г.

Бюро Отделения наук о Земле РАН обсудило вопрос участия российских ученых в новой программе Международного союза геологических наук (IUGS) Deep-Time Digital Earth (DDE).

Председатель Национального комитета геологов России, академик РАН М. А. Федонкин представил ознакомительную презентацию DDE, подготовленную коллегами из Китая.

Председатель Национального комитета геологов России, академик РАН М. А. Федонкин

В разных странах мира существуют огромные хранилища геологических данных различного профиля. В некоторых случаях специалисты этих стран могут получить не только реальный, но и виртуальный доступ к хранящимся в них данным.

А можно ли сделать такие важные сведения общедоступными в мировом масштабе? Такая задача – не простая дань модной глобализации. Это насущная необходимость для решения сложных геологических задач и задач, обеспечивающих безопасность людей. Таким образом, идея создания сети баз геонаучных данных витала в воздухе давно и такие попытки уже предпринимались.

Миссия новой программы – накопление, обработка и гармонизация глобальных цифровых данных о древней Земле и совместное использование глобальных знаний в области геонаук. Теперь эта работа возможна благодаря революционным изменениям в мире цифровых технологий. Однако, потребуется формирование новых протоколов, платформ и программ для того, чтобы геоданные, сохранившие на разных носителях, изложенные на разных языках и в терминах разных научных дисциплин в разных базах данных, могли быть совместимыми и операционально пригодными. Эта большая работа предполагает анализ Больших Данных с помощью суперкомпьютеров, облачные вычисления в интернете, машинное обучение и искусственный интеллект.

Процесс будет осуществляться через систему связанных сетей, сформированных для удобства и поощрения международного сотрудничества специалистов в области различных наук о Земле со специалистами в таких областях, как компьютерная инженерия, геоинформатика, наука о Больших Данных, экономика и социология.

Исследования по программе DDE сосредоточатся в четырех основных направлениях:

1. Жизнь, эволюционная история биосферы, модели динамики глобального биоразнообразия. Анализ больших данных в этой области помогут выявить факторы окружающей среды, влиявшие на эволюцию живого в прошлом, и позволят глубже понимать проблемы биоразнообразия в настоящем.

2. Материалы, характер пространственного и временного распределения минеральных ресурсов, геологическое и палеогеографическое положение месторождений полезных ископаемых в истории Земли. Эти данные крайне важны для развития промышленности и технологий.

3. Палеогеография, совершенствование реконструкций высокого пространственного и временного разрешения станет новой основой палеотектонических, палеоклиматических и ресурсных исследований.

4. Климат, адаптация к его изменениям – обширные геонаучные данные будут иметь возрастающее значение для прогноза и разработки мер адаптации к последствиям климатических изменений. Одна из критических проблем в этой сфере – достоверная информация о подземных водах.

В числе ближайших этапов программы DDE – создание трех центров передового опыта (в Китае, Великобритании и США), имеющих совместимые базы данных для их обмена. Планируется формирование 4D цифровой модели Земли, представляющей полную эволюцию всех геосфер. Будет создана интернет-платформа открытого доступа (подобие геологического Google), гарантирующая равные возможности для физических лиц и организаций всех стран в сфере получения данных и образования. Предполагается создание периодически обновляемых стандартных ссылок IUGS, в частности, палеогеографического атласа IUGS и системы знаний для машинного обучения и интеллектуального анализа данных.

У создаваемой сейчас сети DDE есть определенное преимущество перед ее предшественниками. Это, во-первых, понимание мировой геонаучной общественностью необходимости свободного обмена геонаучной информацией, во-вторых, финансирование и поддержка инфраструктуры сети со стороны правительства Китая, и в-третьих, полученная в декабре 2018 года поддержка исполнительного комитета Международного союза геонаук – сегодня DDE является первой признанной Программой Большой Науки IUGS.

Среди учредителей программы – ВСЕГЕИ и Российский федеральный геологический фонд.

А началось все с оцифровки данных из китайской базы, названной «База данных геобиоразнообразия» (Geobiodiversity Database — GBDB). Её создал в 2006 году китайский палеонтолог Фань Цзюньсюанем (Fan Junxuan) из Нанкинского университета. Китай к тому моменту накопил огромные запасы данных в области наук о Земле, но они были разбросаны по многочисленным коллекциям и учреждениям. Фань, который в то время работал в Нанкинском институте геологии и палеонтологии при Академии наук Китая, организовал GBDB вокруг геологических разрезов, пород и окаменелостей в каждом пласте.

Норман МакЛеод (Norman MacLeod), палеобиолог из Музея естественной истории в Лондоне и консультант DDE, говорит, что GBDB преуспел там, где схожие попытки потерпели неудачу. В прошлом, по его словам, ученые-добровольцы пытались сделать почти все сами, включая информатику и управление данными. Вместо этого GBDB платит неспециалистам за ввод данных, почерпнутых из журналов по естествознанию, освещающих результаты китайских исследований. Затем палеонтологи и стратиграфы проверяют данные на предмет точности и согласованности. В свою очередь, специалисты по информационным технологиям курируют базу данных и создают программное обеспечение для поиска и анализа данных. Постоянное финансирование также способствовало успеху GBDB.

Ученые-геологи за пределами Китая начали использовать GBDB, и она стала официальной базой данных Международной комиссии по стратиграфии в 2012 году. Затем европейские и китайские ученые начали задаваться вопросом, могут ли средства информатики, разработанные для GBDB, помочь создать более широкий союз баз данных. Главная идея состоит в том, чтобы заставить имеющиеся большие базы данных использовать одни и те же стандарты и ссылки.

Фань также надеется, что отдельные учреждения будут вносить свой вклад, обмениваясь данными, разрабатывая аналитические инструменты и поощряя участие своих ученых. По его словам, после того, как ученые освободятся от тяжелой работы по сбору разрозненных данных, у них будет время для более важных задач, таких как ответы на «вопросы об эволюции жизни, материалов, географии и климата в глубоком времени».

Согласно формулировке Международного союза геологических наук, целью DDE является создание больших связанных естественнонаучных центров данных. Центры могут взаимодействовать с другими базами данных, включая опубликованные данные в открытом доступе и неопубликованные данные в учреждениях и экспертных центрах.

Подобно международному проекту OneGeology, целью которой является составление единой геологической карты Мира, DDE будет стремиться предоставлять согласованные данные в удобной форме для науки, общественности и промышленности. Но, в отличие от других существующих баз данных, DDE предоставит геологию и географию с учетом временной составляющей, а также данные о свойствах этих геологических данных. Таким образом, DDE предоставит информацию о распределении и стоимости земных ресурсов и материалов, а также об опасностях — одновременно обеспечивая представление о геологическом будущем Земли.

Реализация этой программы уже началась: в конце февраля 2019 года в Пекине прошла трехдневная встреча, посвященная запуску программы DDE ко времени проведения в Дели 36 Международного геологического конгресса 2020 года. В работе форума приняли участие представители 40 геологических научных организаций Мира, в том числе и делегация Всероссийского научно-исследовательского геологического института им. А.П. Карпинского.

Подобные программы создаются не только в Китае, но и в других странах.

Среди членов бюро ОНЗ РАН развернулась дискуссия о формах сотрудничества с DDE.

Академик РАН А. Д. Гвишиани

«Надо ли нам включаться в этот проект – очень сложный вопрос. – считает академик РАН А. Д. Гвишиани, – Китайцы демонстрируют огромные успехи в создании, и, главное, в правильной математической обработке Больших Данных. Математика 20 века – это была достаточно развитая математика 19 века. Она акцентировалась на одной стороне явления, не давая целостной картины. Со временем данных стало настолько много, они стали такими разнообразными и появляются так быстро, что это коренным образом изменило математику 21 века. Системный анализ – это объединение связанных друг с другом методов дискретной математики, которые дают возможность узнать ядро знания целиком. Для этого нужно собрать разные знания.

Китайцы в этом сильно продвинулись. У них есть финансовые средства и человеческие ресурсы для воплощения этого проекта. Они создали центр данных, где будут работать колоссальные серверы и где будут объединены самые различные данные наук о Земле. Это дает возможность выйти на системное моделирование в формате 4D.

У нас же в стране вообще не ведется эта работа. Поэтому считаю предложенный проект очень интересным. Конечно, надо войти в него и знать о его работе. Но участвовать на равных в этом деле нам будет сложно».

Академик-секретарь Отделения наук о Земле РАН, академик РАН А. О. Глико

Академик-секретарь Отделения наук о Земле РАН, академик РАН А. О. Глико высказал мнение, что, прежде чем входить в программу, нужно понимать: что на самом деле дают Большие Данные для понимания природы, явлений? Как эти результаты реально используются в естественной науке? Данных может быть очень много, но много ли в них нового? Получив четкие ответы на эти вопросы, мы сможем аргументированно поднимать тему создания собственной современной базы данных – дорогостоящей масштабной задачи правительственного уровня.

«Вопрос о данных ставится сегодня перед каждым руководителем научной организации, – подчеркнул  академик РАН Н. С. Бортников. – Существует огромное количество отчетов, авторских данных, уникальных карт, которые, с уходом старшего поколения, просто потерялись. В лучшем случае, они либо разбросаны по статьям, или просто лежат в столах. Если данные и сохраняются в каких-то институтах, то они, наверняка, не оцифрованы. Нет общей базы, нет общей картины.

С моей точки зрения, они будут потеряны навсегда для будущего человечества. И придется проводить изучение заново и тратить огромные средства. Ну или вообще забыть об этих исследованиях, как будто их не было никогда.

Я считаю, надо встраиваться в программу DDE, но единую базу научно-исследовательских данных однозначно надо делать и у нас в стране. Это большая работа, которая требует отдельного финансирования и отдельного института. И вопрос об этом надо ставить на самом высоком уровне».

Татьяна Пономаренко


Презентация Deep-time Digital Earth: Introduction and progress in 2019

 

Печать

Joomla SEF URLs by Artio