В России создали базу данных для обучения геологических систем ИИ
4 сентября 2023 г.
Источник: ТАСС
Российские исследователи создали специализированную базу данных из тысяч изображений образцов горных пород, которая поможет обучать нейросети классифицировать минералы и определять их размер, а также оценивать качество работы алгоритмов компьютерного зрения для задач геологии. Об этом в понедельник сообщила пресс-служба Института искусственного интеллекта AIRI.
«Ученые подготовили базу данных из 44 тыс. изображений более чем 5 тыс. видов минералов. Внутри этой базы содержатся подмножества данных для классификации, сегментации и оценки размера образцов. Работа была проведена при поддержке Минералогического музея им. Ферсмана, в фондах которого хранится более 170 тыс. образцов горных пород и минералов», — говорится в сообщении.
По текущим оценкам геологов, в природе существует около 6 тыс. минералов, из которых детально изучена лишь небольшая часть. Это осложняет визуальную идентификацию горных пород и часто вынуждает геологов проводить анализ химического состава и другие трудоемкие и длительные процедуры по идентификации минерала, которые длятся от получаса до нескольких дней.
Для ускорения этого процесса российские и зарубежные ученые разрабатывают системы ИИ, способные идентифицировать минералы по фотографиям и другим просто измеримым характеристикам. Коллектив российских ученых под руководством ведущего эксперта по исследованию данных в Sber.AI Сергея Нестерука разработал базу данных MineralImage5k, которая позволит значительно ускорить этот процесс.
По словам разработчиков, их база несколько уступает по размеру самому большому в мире набору Mindat из миллиона изображений, но при этом она является более однородной по условиям съемки, состоит из необработанных образцов, близких к минералам в дикой природе, и формирует более широкий взгляд на минеральное разнообразие. Кроме того, база MineralImage5k привязана к коллекции музея и позволяет провести дополнительное изучение любого образца.
Как надеются ученые, созданная ими модель ускорит разработку геологических систем машинного обучения и сделает их работу более качественной за счет преимуществ MineralImage5k перед другими, неспециализированными геологическими базами данных и банками изображений.
Метки: минералы