Настоящий полиглот. Продвинутая ИИ-модель OpenAI внезапно переходит на мандаринский язык
Модель искусственного интеллекта со способностью к рассуждению o1 от OpenAI начала внезапно менять язык общения с пользователем, выбирая то французский, то мандаринский языки.
by Анастасия Печенюк · NV | nv.ua | Радіо NV | Новини України | Аналітика | Відео | НВ | · ПодписатьсяВскоре после того, как OpenAI выпустила o1, свою первую модель ИИ со способностью к рассуждению, пользователи начали замечать интересное явление. Модель иногда начинала «думать» на китайском, персидском или каком-то другом языке, когда ей задавали вопросы на английском.
К примеру, один пользователь на английском попросил модель посчитать, сколько R в слове strawberry. Обычно модель отвечает на английском на запрос на этом языке. Но в этот раз o1 начала процесс «размышлений» на английском, а затем продолжила рассуждения на китайском.
OpenAI не предоставила объяснений странному поведению o1, и даже не признала наличие проблемы, пишет TechCrunch. Некоторые эксперты предполагают, что это могло произойти из-за того, что модели рассуждения, такие как o1, обучаются на наборах данных, которые содержат много китайских иероглифов. Также OpenAI использует сторонние службы маркировки данных на китайском языке, и переход o1 на китайский может быть примером «китайского лингвистического влияния на рассуждения».
«OpenAI и Anthropic используют службы маркировки данных для данных рассуждений докторского уровня для науки, математики и кодирования. Из-за доступности экспертной рабочей силы и стоимости многие из этих поставщиков данных находятся в Китае», — отмечает Тед Сяо, исследователь из Google DeepMind.
Однако другие эксперты отмечают, что o1 с такой же вероятностью перейдет на хинди, тайский или другой язык, кроме китайского, при поиске решения. Это может произойти потому, что o1 и другие модели рассуждений могут использовать языки, которые они считают наиболее эффективными для достижения цели. Опыт пользователей подтверждает это. В соцсетях также жаловались, что модель отвечает на вопросы о песнях на французском языке, а о синтетической биологии — на мандаринском.