Модель Aeneas от Google DeepMind восстанавливает фрагментированные латинские тексты

Что же сказал Август?!

Наилучшим образом искусственный интеллект выполняет роль инструмента, а не конечного результата. Он помогает людям выполнять свою работу лучше, а не отправляет их на биржу труда. В пример «хорошего» использования AI компания Google DeepMind представила модель, которая восстанавливает древние надписи и помогает в их интерпретации. Модель получила название Aeneas в честь героя римской мифологии. Примечательно, что инструмент открыт для всех и бесплатен.

Древние римляне оставили после себя огромное количество надписей, однако многие из них оказались повреждены или искажены временем. Восстановление этих текстов требует сложной аналитической работы с контекстными подсказками. Алгоритм, способный анализировать эти данные, значительно облегчает задачу.

Aeneas ускоряет одну из самых сложных задач историков — поиск "параллелей". Это означает нахождение похожих текстов, сгруппированных по формулировкам, синтаксису или географическому расположению. DeepMind заявляет, что модель анализирует тысячи латинских надписей и находит параллели за считанные секунды, прежде чем снова передать работу историкам.

По словам компании, Aeneas создаёт для каждого текста "исторический отпечаток". "Модель обнаруживает глубокие связи, которые помогают историкам определять более широкий исторический контекст надписей", — пояснили в Google DeepMind.

Особенно впечатляющим трюком Aeneas является восстановление текстовых пробелов неизвестной длины. (Это похоже на решение кроссворда, где количество букв в каждом пункте неизвестно.) Инструмент также мультиформатный, что означает возможность анализа как текстового, так и визуального входного материала. Это первый в своём роде инструмент, использующий такой комплексный подход для определения происхождения текста.

Mодель Aeneas предназначена как союзник в существующих рабочих процессах историков. Она наилучшим образом подходит для предоставления "интерпретируемых предложений", которые служат отправной точкой для исследователей. Один из историков, протестировавших модель, отметил: "Параллели, обнаруженные Aeneas, полностью изменили моё восприятие надписи. Она заметила детали, которые оказались ключевыми для восстановления и хронологической атрибуции текста."

Вместе с выпуском Aeneas для работы с латинскими текстами, компания модернизировала свою модель Ithaca для анализа древнегреческих текстов. Теперь Ithaca использует контекстуальные и восстановительные возможности Aeneas.

Исследователи могут испытать Aeneas на сайте DeepMind «Predicting the Past». Кроме того, компания открыла доступ к коду и базе данных модели.

Отзывы