ШІ досі не вміє правильно рахувати літери у словах
- Ярослава Несисюк

- 28 трав.
- Читати 1 хв

AI Overview від Google знову привернув увагу користувачів до своїх помилок у простих словах — система неправильно рахує літери та помиляється у написанні базових слів, повідомляє TechCrunch.
AI Overview неправильно рахує літери у простих словах
Користувачі помітили, що AI Overview неправильно відповідає на елементарні запити.
Наприклад, система заявила, що у слові «Google» є дві літери P.

У слові «journalism» система знайшла дві літери o і написала його як j-o-u-r-n-a-l-i-s-o-m.
Прізвище президента США ШІ теж написав неправильно — t-r-p-u-m.
«Підрахунок усередині слів є відомою проблемою для LLM, і ми працюємо над виправленням саме цієї помилки», — заявили у компанії.

Проте під час аналогічних запитів українською мовою AI Overview не демонструє таких частих помилок із підрахунком літер або правописом.
Причина — те, як працюють великі мовні моделі
Причина помилок полягає в тому, що LLM не сприймають текст так, як люди. Замість слів і літер моделі працюють із токенами — фрагментами тексту, які можуть бути словами, складами або окремими символами.
ШІ перетворює текст на числові представлення й аналізує їх у контексті. Через це модель добре програмує або вирішує складні задачі, але може помилятися у правописі.
Дослідник ШІ та професор University of Alberta Метью Гуздіал пояснив, що модель не «бачить» окремі літери у словах.
PhD-дослідник Північно-Східного університету Шерідан Фойхт заявив, що створити ідеальну систему токенізації навряд чи можливо.




