Ученые из Беэр-Шевы используют искусственный интеллект для расшифровки неразборчивых слов на древнем иврите и арамейском языках

В Курси найдена мраморная плита с надписью на иврите. (фото предоставлено: ДЖЕННИФЕР МАНРО)

Каждый год на Ближнем Востоке находят всё более древние тексты, написанные как на иврите, так и на арамейском. Анализ этих текстов имеет колоссальное значение для ученых, изучающих культуру и историю этого региона.

Поскольку многие из этих надписей со временем были повреждены из-за землетрясений, пожаров, политических конфликтов и других природных и антропогенных причин, эпиграфисты – специалисты, занимающиеся реконструкцией, переводом и датировкой надписей, а также выявлением соответствующих обстоятельств, оставляли историкам задачу определения и интерпретации записанных событий. До недавнего времени они полагались на трудоемкие ручные процессы для восстановления недостающего контента, что стало серьезной проблемой при попытках восстановления пропущенных частей этих ценных текстов.

Теперь студенты факультета программной инженерии и информационных систем Университета Бен-Гуриона в Негеве (BGU) в Беэр-Шеве подошли к решению этой задачи, рассматривая ее как расширенную задачу моделирования замаскированного языка. В таком подходе поврежденный контент может включать в себя отдельные символы, n-граммы символов (части слов), отдельные слова и многословные n-граммы. Это исследование стало первой попыткой применить методы моделирования замаскированного языка к искаженным надписям на иврите и арамейском, использующим еврейский алфавит, в основном состоящий из согласных.

В своем заключительном проекте под руководством профессора Марка Ласта студенты четвертого курса бакалавриата Нив Фоно, Харель Мошайоф, Эльдар Кароль и Итай Асраф применили метод моделирования замаскированного языка к поврежденным надписям на иврите и арамейском языках.

Их модель под названием «Embible» была представлена на последнем заседании Европейского отделения Ассоциации компьютерной лингвистики в прошлом месяце. Они опубликовали свои результаты в журнале ACL Anthology под заголовком «Embible: реконструкция древних еврейских и арамейских текстов с использованием трансформеров».

Система проанализировала тысячи предложений из Танаха (еврейской Библии). Студенты обучили ее на 22 144 предложениях из Танаха. При тестировании на оставшихся 536 предложениях система показала значительный успех. Ансамбль моделей для предсказания слов и символов продемонстрировал наивысшую точность.

«Мы можем помочь историкам, которые посвятили свою жизнь как можно более точному воссозданию этих древних текстов», — подчеркнули они. И добавили: «Кроме того, я убежден, что модель можно адаптировать для работы с другими морфологически сложными древними языками».

Опубликовано на сайте The Jerusalem Post

Телеграм канал Радио Хамсин >>

  • Джуди Сигель-Ицкович

    Другие посты

    Космос: новый фронт Израиля в войне с террористическими прокси

    Израильская система ПРО «Хец» (Стрела) перехватила ракету, запущенную хуситами, за линией Кармана. Тем самым мир вступил в эпоху космических боевых действий.

    Читать
    Что на самом деле происходит на рынке высоких технологий в Израиле?

    Официальные данные указывают на то, что опытные сотрудники вытесняются с рынка, но реальная ситуация на местах гораздо сложнее.

    Читать

    Не пропустите

    48 видов сионизма

    48 видов сионизма

    В битве за будущее: как демография определяет выживание Израиля и еврейского народа

    В битве за будущее: как демография определяет выживание Израиля и еврейского народа

    Как инициатива «Хевронского эмирата» меняет концепцию двух государств

    Как инициатива «Хевронского эмирата» меняет концепцию двух государств

    10 основных заблуждений о войне между Израилем и Газой

    10 основных заблуждений о войне между Израилем и Газой

    Почему левые продолжают терпеть поражение?

    Почему левые продолжают терпеть поражение?

    Мы — фавориты Европы: почему Израиль победил в зрительском голосовании на «Евровидении»

    Мы — фавориты Европы: почему Израиль победил в зрительском голосовании на «Евровидении»