От расшифровки клинописи до перевода древнеегипетских надписей — задача, казавшаяся почти невозможной, постепенно переходит в цифровую эпоху. Российские исследователи сделали шаг вперёд: специалисты из Института искусственного интеллекта AIRI, Института системного программирования им. В. П. Иванникова РАН и Университета ИТМО создали систему, способную распознавать и переводить древнеегипетские иероглифы с высокой точностью.
Разработка основана на технологиях искусственного интеллекта и машинного обучения, но её суть — в умении "понимать" контекст. В отличие от алфавитных систем, где достаточно распознать несколько десятков букв, древнеегипетское письмо состоит из сотен сложных символов, каждый из которых может иметь особое значение в зависимости от соседних знаков. Система должна не просто видеть контуры иероглифа, а интерпретировать его смысл в контексте других знаков и фрагмента текста.
Чтобы справиться с такой нагрузкой, учёные применили комбинированный подход. В основу легли контекстуальные OCR-модели, которые анализируют изображение и текст вместе, и диффузионные модели, генерирующие реалистичные изображения редких символов. Это позволило увеличить объём обучающего набора и добиться более устойчивых результатов при распознавании повреждённых надписей или плохо читаемых фрагментов папирусов.
Подробнее https://www.pravda.ru/news/science/22...