ИИ помогает расшифровывать столетние записи данных

19 сентября 2025 г.
Инструмент машинного обучения MeteoSaver помогает распознать записи в погодных журналах. Статья о нем опубликована в EGUsphere.
Климатолог Деррик Мухеки из Брюссельского свободного университета обратился к метеорологическим архивам Демократической Республики Конго, которые содержат данные с 1960 года. Для того, чтобы извлечь информацию из более 9000 отсканированных изображений, он использовал разработанный им инструмент машинного обучения. В ходе первоначальных испытаний MeteoSaver мог расшифровывать данные с точностью 75%, но дальнейшее усовершенствование нейросети – на основе пакета с открытым исходным кодом для распознавания рукописного текста под названием Tesseract – увеличило этот показатель до 90%. Полученные данные помогут понять, как со временем менялись условия во втором по величине тропическом лесу в мире.
«В архивах по всему миру до сих пор пылятся бумажные записи», – говорит соавтор исследования Эд Хокинс, климатолог из британского Редингского университета. К ним относятся миллионы неиспользованных данных наблюдений за осадками в Национальном метеорологическом архиве Великобритании.
Эд Хокинс руководил проектами, участники которых расшифровывали записи вручную. Лет десять назад инструменты машинного обучения не справлялись с этой задачей. Самым сложным для них было распознавание таблиц. Большая часть работы Деррика Мухеки заключалась в разработке алгоритмов для выполнения этой задачи. Теперь работа ИИ наконец становится сопоставимой с человеческой, утверждает Эд Хокинс.
Аналогичные проекты других команд показывают, что машинное обучение может значительно ускорить восстановление исторических записей. Так, команда Мартина Стенделя из Датского метеорологического института в Копенгагене разрабатывает системы машинного обучения для расшифровки тысяч бортовых журналов с 1800-х годов.
С появлением основанных на машинном обучении моделей для климатических прогнозов необработанные данные становятся все более ценными. По мере совершенствования технологии расшифровки исследователи смогут не только оцифровывать новые документы, но и возвращаться к ранее неучтенным данным. Полнота информации будут способствовать пониманию и прогнозированию краткосрочной изменчивости погоды, а также долгосрочных тенденций и разрушительных явлений.
Источник: Nature.
Читайте также:
- ИИ научили «читать» сейсмические волны в 10 раз быстрее
- Анонсирован новый онлайн-инструмент для упрощения идентификации минералов