Meta представила переводчик — часть проекта универсального переводчика речи, — который предназначен для перевода между языками, которые не имеют своей письменности. Прототип переводчика сейчас умеет переводить по одному предложению за раз между английским и Хоккиен — диалекту классического китайского, который не имеет стандартного письма, хотя при этом является одним из официальных языков Тайваня.
Сложность для реализации переводчика в данном случае в том, что AI не имеет материала для анализа — большое количество слов в Хоккиен не имеют стандартного отображения в китайской письменности и записываются либо в фонетической транскрипции латинскими символами, либо совпадающими по фонетике иероглифами безотносительно того, насколько они подходят по лексическому значению. При этом не существует стандарта — два разных человека могут написать одно и то же слово по-разному. Поэтому разработчикам пришлось сделать двойной перевод, используя классический китайский (Mandarin) в качестве промежуточного языка.
Кстати, таких языков во всем мире немало — больше половины из 7000 известных науке языков и диалектов не имеют письменной формы.