top of page

ШІ досі не вміє правильно рахувати літери у словах 

ШІ досі не вміє правильно рахувати літери у словах 

AI Overview від Google знову привернув увагу користувачів до своїх помилок у простих словах — система неправильно рахує літери та помиляється у написанні базових слів, повідомляє TechCrunch.


AI Overview неправильно рахує літери у простих словах


Користувачі помітили, що AI Overview неправильно відповідає на елементарні запити.


Наприклад, система заявила, що у слові «Google» є дві літери P.


Відповідь AI Overview на питання про правопис слова journalism
Відповідь AI Overview на питання про правопис слова «journalism»

У слові «journalism» система знайшла дві літери o і написала його як j-o-u-r-n-a-l-i-s-o-m.


Прізвище президента США ШІ теж написав неправильно — t-r-p-u-m.


«Підрахунок усередині слів є відомою проблемою для LLM, і ми працюємо над виправленням саме цієї помилки», — заявили у компанії.

Відповідь AI Overview на питання про правопис слова журналістика
Відповідь AI Overview на питання про правопис слова «журналістика»

Проте під час аналогічних запитів українською мовою AI Overview не демонструє таких частих помилок із підрахунком літер або правописом. 


Причина — те, як працюють великі мовні моделі


Причина помилок полягає в тому, що LLM не сприймають текст так, як люди. Замість слів і літер моделі працюють із токенами — фрагментами тексту, які можуть бути словами, складами або окремими символами.


ШІ перетворює текст на числові представлення й аналізує їх у контексті. Через це модель добре програмує або вирішує складні задачі, але може помилятися у правописі.

Дослідник ШІ та професор University of Alberta Метью Гуздіал пояснив, що модель не «бачить» окремі літери у словах.


PhD-дослідник Північно-Східного університету Шерідан Фойхт заявив, що створити ідеальну систему токенізації навряд чи можливо.


Кнопка для підписки на High Bar Newsletter

© 2035 by Business Name. Made with Wix Studio™

bottom of page