Искусственный интеллект обучили распознаванию древнеегипетских иероглифов

Искусственный интеллект обучили распознаванию древнеегипетских иероглифов

Рубрика Исследования

Группа учёных из Института искусственного интеллекта AIRI, Институт системного программирования им. В.П. Иванникова Российской академии наук (ИСП РАН) и Университета ИТМО создала систему, которая распознаёт и переводит древнеегипетские иероглифы с высокой точностью.

Распознавание иероглифов — сложная задача: вместо алфавита из 30-40 букв система должна «понимать» сотни похожих символов с уникальным значением. Для повышения точности учёные использовали контекстуальные OCR-модели и диффузионные модели, генерирующие реалистичные изображения для расширения обучающего набора.

Основой для обучения модели стал Thesaurus Linguae Aegyptiae — самое полное собрание древнеегипетских текстов с переводами. Сначала применялись автоматические метрики, затем тексты оценивали профессиональные египтологи из НИУ ВШЭ.

Розеттский камень в Британском музее в Лондоне

В ходе проекта создаются новые технологии распознавания рукописных текстов, которые востребованы при создании и обогащении больших языковых моделей в условиях недостатка данных. По словам разработчиков, в перспективе новые технологии можно будет использовать в мобильных приложениях дополненной реальности. Например, посетители музея смогут навести на камеру на экспонат с иероглифами и понять, что там написано. Студентам-египтологам, которые только начинают изучать язык, данный метод облегчит процесс обучения.

«Проект стал результатом работы междисциплинарной команды специалистов по машинному обучению и египтологии. Первую научную работу, посвящённую разработке метода, мы уже представили на международной конференции SIGGRAPH 2025 ... На данный момент доступ к системе открыт по запросу для заинтересованных специалистов», — прокомментировал руководитель проекта, ведущий научный сотрудник ИСП РАН и AIRI, доцент ИТМО Илья Макаров.

Источник: ИСП РАН.

Новости Российской академии наук в Telegram →