Результати пошуку

Start Now

Знайдено 1079 результатів із порожнім запитом

Highload fwdays'26 збере інженерів MacPaw, Uklon, Silpo та EPAM у Києві
6 червня у Києві відбудеться конференція Highload fwdays'26 для інженерів, архітекторів і спеціалістів із роботи з даними. Захід проходитиме у змішаному форматі — офлайн та онлайн. ШІ, аналітика та інфраструктура Захід відбудеться 6 червня. У програмі заявлені виступи спеціалістів із MacPaw, Uklon, Silpo, DraftKings та EPAM. Учасники обговорюватимуть побудову високонавантажених систем, інтеграцію ШІ, оптимізацію інфраструктури та сучасні підходи до роботи з даними. Solution Architect у MacPaw Йожеф Гісем розповість про перенесення аналітики з backend у data pipeline. У доповіді йтиметься про використання CDC через Debezium та BigQuery для зменшення навантаження на production-бази. Також спікер пояснить, із якими компромісами доводиться працювати — зокрема із затримками даних, дублікатами та вартістю інфраструктури. Список спікерів Highload fwdays'26 Кейс побудови каталогу на Elasticsearch від Silpo Domain Architect у Silpo Олексій Романченко представить кейс побудови каталогу товарів на Elasticsearch. За його словами, команда працювала з агрегованою read-моделлю для понад 30 млн документів і навантаженням у 1500 write-запитів на секунду. Доповідь присвятять роботі з мікросервісною архітектурою та побудові швидких систем пошуку. Оптимізація витрат CTO FORMA та Universe Ігор Закутинський виступить із доповіддю про оптимізацію інфраструктурних витрат у високонавантажених системах. Він пояснить, чому витрати часто ростуть не через саме навантаження, а через overprovisioning, надмірне використання керованих сервісів і зайвий рух даних. У межах виступу також планують обговорити кешування, CDN, моніторинг та компроміси між продуктивністю, стабільністю й вартістю інфраструктури. Для читачів доступна знижка на квитки Організатори також надали знижку для читачів HBJ. За промокодом HIGHLOAD_HBJ можна отримати 10% знижки на квитки для участі в конференції. Деталі заходу та реєстрація доступні за посиланням.
Сайт UK Visa Portal відкрив доступ до паспортів і селфі тисяч людей
Сайт UK Visa Portal опинився в центрі масштабного витоку персональних даних. У відкритому доступі виявилися паспорти та селфі людей, які користувалися сервісом для оформлення британських віз. Про це повідомляє TechCrunch. Понад 100 тисяч документів у відкритому доступі Про проблему повідомив анонімний дослідник безпеки виданню TechCrunch. За його словами, сайт публічно відкривав доступ щонайменше до 100 тис. документів користувачів. Йдеться про фотографії паспортів і селфі, які люди завантажували під час оформлення заявок. Журналісти TechCrunch підтвердили справжність витоку та зв’язалося з постраждалими користувачами, щоб перевірити достовірність даних. UK Visa Portal не пов’язаний із урядом Великої Британії UK Visa Portal не є офіційним державним сервісом Великої Британії. Деякі користувачі помилково оплачували послуги сайту, думаючи, що користуються офіційною платформою GOV.UK. Для оформлення електронного дозволу на в’їзд до Великої Британії не потрібно користуватися сторонніми сервісами, крім випадків коли заявник працює через імміграційного юриста. Компанія не відреагувала на повідомлення про проблему Журналісти повідомили UK Visa Portal про витік даних. Однак на сайті не було окремого механізму для повідомлення про проблеми безпеки або контактів керівництва компанії. Представники TechCrunch намагалися передати деталі витоку напряму менеджменту, однак отримали відповідь лише від юристів і PR-представників компанії. На момент публікації матеріалу проблема залишалася невиправленою.
Користувачі масово переходять з Google на DuckDuckGo через оновлений ШІ-пошук
Після масштабного оновлення Google Search користувачі почали активніше переходити на DuckDuckGo — пошукову систему, яка дозволяє повністю вимкнути ШІ-функції. Про це повідомляє TechCrunch. Користувачі незадоволені новим ШІ-пошуком Google На конференції I/O Google оголосила, що класичний пошук зі списком посилань поступово замінюватиметься ШІ-асистентом. Нова система не лише відповідає на запити, а й виконує завдання та запускає фонові ШІ-агенти. Після анонсу користувачі почали критикувати зміни. Частина людей вважає, що ШІ-пошук може зашкодити відкритому інтернету. Інші скаржаться на неточні відповіді, втрату контролю над пошуком і надмірне ускладнення простих запитів. DuckDuckGo швидко зростає після змін у Google Генеральний директор DuckDuckGo Габріель Вайнберг заявив, що Google нав’язує ШІ без можливості відмовитися. «У результаті їхній пошук стає гіршим, а не кращим. Ми хочемо бути платформою, де користувач сам вирішує, скільки ШІ йому потрібно», — додав він. За даними DuckDuckGo, кількість встановлень застосунку у США зросла на 18,1% у період із 20 до 25 травня порівняно з попереднім тижнем. На iOS приріст був ще вищим — у середньому 33%, а пікове зростання досягло 69,9%. Також різко виросла популярність сторінки noai.duckduckgo.com, де всі ШІ-функції вимкнені за замовчуванням. DuckDuckGo теж використовує ШІ — але дає вибір користувачам Попри критику Google, DuckDuckGo має власний ШІ-сервіс Duck.ai. Він надає доступ до моделей Anthropic Claude 4.5 Haiku, Meta Llama 4 Scout, Mistral Small 3 24B та OpenAI GPT-5 mini. Компанія стверджує, що всі ШІ-чати залишаються приватними. DuckDuckGo видаляє IP-адреси користувачів перед передачею запитів ШІ-провайдерам, видаляє історію чатів через 30 днів і не використовує розмови для тренування моделей. DuckDuckGo також має функцію Search Assist — аналог ШІ-відповідей Google — та фільтр ШІ-зображень. Головний директор із комунікацій компанії Каміл Базбаз заявив, що обидві функції залишаються дуже популярними. «Люди просто хочуть мати вибір», — зазначив він.
NASA планує три нові місії для підготовки місячної бази перед поверненням людей на Місяць
NASA представила попередній графік трьох місій для підготовки майбутньої місячної бази. Вони мають допомогти протестувати техніку та інфраструктуру перед поверненням людей на поверхню Місяця. Перша місія Організація завершила пілотовану місію Artemis II у квітні, однак вона була лише частиною ширшого плану зі створення постійної присутності на Місяці. Тепер NASA готує серію місій для перевірки нових місячних технологій. Перша з них запланована не раніше осені 2026 року. Для неї NASA використає посадковий модуль Blue Moon Mark 1 Endurance від компанії Blue Origin. Місія доставить на Місяць інструмент Lunar Plume-Surface Studies та камери для дослідження поверхні. Друга місія Друга місія також запланована на 2026 рік. У її межах посадковий модуль Griffin компанії Astrobotic доставить транспортну платформу FLIP від стартапу Astrolab. NASA хоче використати місію для тестування майбутніх місячних транспортних систем для астронавтів і вантажів. Паралельно NASA фінансує розробку таких платформ через окремі контракти. Astrolab отримала контракт на $219 млн, а Lunar Outpost — на $220 млн. Blue Origin також отримала $118 млн на доставку цих платформ на поверхню Місяця. Третя місія Третя місія використовуватиме модуль Nova-C Trinity від компанії Intuitive Machines. Вона має досліджувати світлі візерунки на поверхні Місяця, відомі як lunar swirls. Також NASA доставить вантажі для European Space Agency та Korea Astronomy and Space Science Institute. Подальші плани У лютому NASA оновила графік місячної програми та перенесла повернення астронавтів на поверхню Місяця на 2028 рік. До цього організація також планує місію MoonFall, у межах якої дрони досліджуватимуть потенційні місця посадки. NASA паралельно тестує нові покоління місячних посадкових модулів Blue Origin для майбутніх пілотованих місій.
Xiaomi втратила понад половину прибутку через кризу пам’яті для ШІ
Xiaomi зафіксувала різке падіння прибутку на тлі глобальної кризи чипів пам’яті, спричиненої ШІ-бумом і попитом дата-центрів на високопродуктивну пам’ять. Про це повідомляє Bloomberg. Xiaomi втратила понад половину прибутку У першому кварталі 2026 року чистий прибуток Xiaomi впав на 57% — до $695 млн. Це виявилося гірше за очікування аналітиків, які прогнозували падіння приблизно на 52%. Виторг компанії також скоротився вперше майже за три роки — на 11%, до майже $14,6 млрд. Xiaomi стала одним із найбільших постраждалих виробників смартфонів через глобальний дефіцит пам’яті. Дата-центри спричинили дефіцит пам’яті для смартфонів Samsung та SK Hynix переорієнтували виробництво на виробництво чипів для дата-центрів. Через це на ринку виник дефіцит звичайних чипів пам’яті для смартфонів, а ціни різко виросли. Президент Xiaomi Лу Вейбін заявив, що компанія змушена балансувати між обсягами продажів і прибутковістю. «Витрати на пам’ять тиснуть не лише на Xiaomi, а й на всю індустрію», — сказав він під час дзвінка з інвесторами. Xiaomi підвищує середню ціну смартфонів і скорочує частину бюджетних моделей, щоб компенсувати зростання витрат. EV-бізнес Xiaomi також залишається збитковим Додатковий тиск на фінансові результати створює EV-напрям Xiaomi. Підрозділ, який об’єднує електромобілі, ШІ та нові ініціативи, зафіксував збиток $456 млн за квартал. Попри це Xiaomi продовжує активно розширювати EV-бізнес. Компанія вже поставила понад 600 тис. автомобілів після виходу на ринок EV у 2024 році. Цього року Xiaomi планує випустити другий SUV і вийти на європейський ринок у 2027 році. Минулого тижня Xiaomi також представила нову версію SUV YU7 для конкуренції з Tesla Model Y. Ставка на ШІ та робототехніку Компанія продовжує інвестувати в штучний інтелект. Раніше цього року Xiaomi оновила власну ШІ-модель MiMo. Розробкою керує дослідниця Ло Фулі, яку Xiaomi переманила з команди DeepSeek. У квітні Xiaomi також показала інвесторам гуманоїдного робота та заявила, що працює над ШІ-моделлю для складніших фізичних завдань роботів у реальному світі.
Genesis Press відкрила брендовану бізнес-вітрину в книгарні «Сенс» у центрі Києва
З 26 травня до 2 червня у книгарні «Сенс» на Хрещатику працюватиме попап-вітрина від Genesis Press — некомерційної ініціативи Genesis із перекладу бізнес-літератури українською мовою. Рекомендації українських підприємців У просторі представили світові бізнес-бестселери, перекладені українською за підтримки Genesis Press. Серед рекомендацій — книги, які радять віцепрем’єр-міністр Михайло Федоров, CEO Genesis Володимир Многолєтній, засновник Fedoriv Group Андрій Федорів, засновниця Gunia Project Media Марія Гаврилюк тощо. Genesis Press просуває бізнес-літературу українською У Genesis Press заявляють, що головна ідея ініціативи — зробити якісну світову бізнес-літературу доступною українською мовою. Вітрина з книгами від Genesis Press Команда вважає, що правильна книга може допомогти підприємцям змінити траєкторію розвитку компанії або уникнути критичних помилок. «Ініціатива інвестує у видання примірників, у які вірить — щоб ці ідеї лунали українською і розвивали підприємницьку спільноту країни», — йдеться в описі проєкту. Відвідувачі можуть взяти участь у розіграші У межах кампанії Genesis Press також проводить розіграш подарункового боксу. Для участі потрібно сфотографуватися біля вітрини або книг із логотипом Genesis Press, опублікувати фото у соцмережах і відмітити сторінку Genesis. Розіграш триватиме до 2 червня.
Епоха Compute Crunch: куди зник безлімітний інференс і як економити токени
Ще рік тому розробники та ШІ-ентузіасти сприймали compute як каву в офісі — гарантований невичерпний ресурс, на який не діють закони економіки. Оформи підписку за $20 на місяць і ганяй нейромережі «і в хвіст, і в гриву». Індустрія вірила, що контекстні вікна моделей скоро проковтнуть весь GitHub, а масштабування моделей триватиме вічно. Настав 2026 рік. Користувачі масово вперлися в ліміти повідомлень, пакети в Cursor тепер тануть за кілька днів, а рахунки за API нагадують номери телефонів. Ласкаво просимо в епоху Compute Crunch. Виявилося, що алгоритми навчилися думати швидше, ніж людство здатне будувати дата-центри та генерувати для них електроенергію. Разом з Владиславом Прудіусом, Software Engineer у Genesis, заглянемо за лаштунки дефіциту обчислень, розберемо, куди зникають мільйони токенів, і дізнаємось, як їх економити без втрати якості відповідей. Гігаватні рахунки за світло: чому compute став дефіцитом Раніше ШІ-перегони виглядали просто: достатньо було нарощувати кількість чипів Nvidia та інженерних ресурсів — і на виході з'являлася потужніша модель. 2026 року ця схема зламалася. Новою «валютою» ШІ-економіки стали енергія, охолодження та дата-центри. Попит на обчислення став настільки агресивним, що капітальні витрати окремих техногігантів давно пробили планку у $100 мільярдів на рік. За даними Goldman Sachs, лише у 2026 році світові витрати на ШІ-інфраструктуру становитимуть рекордні $765 мільярдів, а до 2031 року вони зростуть до $1,6 трильйона щорічно. Проблема в тому, що ці гроші не конвертуються у прибуток так швидко, як очікували інвестори. Попри багатомільярдні доходи, OpenAI продовжує працювати в глибокий мінус: вартість інференсу й тренування нових моделей з'їдає виторг швидше, ніж він надходить. Фінансова директорка OpenAI Сара Фріар чесно визнає: через хронічний брак обчислювальних потужностей компанії доводиться йти на важкі компроміси й буквально відхиляти вигідні комерційні контракти, бо їх просто немає на чому крутити. Цей дефіцит швидко доходить до кінцевого користувача. Користувачі ChatGPT і Claude масово вперлися в ліміти повідомлень, пакети в Cursor тануть за лічені дні, а підписники Claude Max за $100 на місяць здивовано виявляють, що інтенсивна сесія може зʼїсти весь місячний пакет за кілька годин. В Anthropic офіційно підтвердили, що динамічно коригують ліміти використання залежно від поточного завантаження серверів — тобто ваш «безлімітний» план насправді обмежений поточним станом GPU-кластера в іншій півкулі. Кейс OpenClaw: справжня ціна автономної розробки Найбільш показовим прикладом цієї проблеми стала історія від Пітера Штайнберґера, творця ШІ-агента OpenClaw. Команда з трьох людей запустила паралельно близько 100 інстансів Codex в автономному режимі для повного циклу розробки (від рев'ю пулл-реквестів і пошуку вразливостей у комітах до написання фіксів) і зафіксувала рекордні витрати. 15 травня 2026 року Штайнберґер опублікував у X скриншот дашборду CodexBar, який показав $1 305 088,81 витрат на OpenAI API за 30 днів — рахунок покрив 603 мільярди токенів і 7,6 мільйона запитів. Лише за день публікації скриншота акаунт зафіксував $19 985,84 витрат і 206 000 запитів. Рахунок повністю покриває OpenAI, де Штайнберґер працює з лютого 2026 року, а сам розробник описує це як дослідницький експеримент щодо того, як виглядала б розробка ПЗ, якби вартість токенів не була обмежувальним фактором. Причина такої стрімкої перевитрати бюджету криється в логіці функціонування сучасних автономних агентів, які є надзвичайно марнотратними щодо обчислювальних ресурсів. Щоб виконати будь-яку дрібну дію, агент змушений щоразу відправляти в модель повний контекст: усю історію попередніх кроків, системні інструкції та поточний стан репозиторію. Коли сторонні автономні системи обходять оптимізацію промпт-кешування, цей обсяг даних розростається за експонентою. Модель змушена повторно зчитувати мільйони вхідних токенів на кожній ітерації, що робить повну автономію дуже витратною. Анатомія токена: за що насправді платять Цифри з кейсу OpenClaw виглядають як аномалія — рекорд одного ентузіаста, що має мало спільного з повсякденною роботою. Але той самий механізм, що згенерував рахунок на $1,3 мільйона за 30 днів, працює в будь-якій сесії з Cursor — просто з іншими множниками. Щоби це контролювати, варто розібратися, як саме провайдери рахують вартість запиту. Що таке токени і як вони витрачаються Щоразу, коли ви відправляєте запит до ChatGPT, Claude або Gemini, текст не передається моделі «як є». Спершу він проходить через токенізатор, який розбиває його на невеликі фрагменти — так звані токени, кожен з яких отримує числовий ідентифікатор. Саме з цими числами й працює модель. Один токен — це приблизно 4 символи або ¾ англійського слова. Фраза «Hello, world!», наприклад, займає 4 токени. Але не весь текст токенізується однаково ефективно — саме ці нюанси впливають на якість відповідей і на вартість роботи. Кожен провайдер використовує власний токенізатор: OpenAI — tiktoken (алгоритм BPE) Anthropic — власна BPE-модифікація Google (Gemini/Gemma) — бібліотека SentencePiece (також BPE-подібний) Головна відмінність між ними — обробка пробілів. BPE одразу розділяє текст по пробілах, тоді як SentencePiece трактує пробіл як звичайний символ. Це дає SentencePiece кращу якість для мов із нестандартним розбиттям на слова, але BPE залишається швидшим і стабільнішим для англомовних текстів. Отже, той самий текст може давати різну кількість токенів залежно від провайдера. Подивитися, як конкретна модель токенізує ваш текст, можна на OpenAI Tokenizer. Контекстне вікно: заявлений максимум ≠ реальна ефективність Контекстне вікно — це загальний обсяг токенів, який модель може «тримати в голові» під час однієї сесії: ваш промпт, історія діалогу, завантажені файли і сама відповідь. Актуальні ліміти провідних моделей: Модель Максимальний контекст Claude Opus 4.7 1M токенів (API / Claude Code) / 500K (chat) Claude Sonnet 4.6 1M токенів (API / Claude Code) / 500K (chat) GPT-5.5 1M токенів (API) / 400K (Codex) Gemini 3.1 Pro 1M токенів (API, preview) Але є нюанс, який рідко згадують у маркетингу: більшість моделей мають максимальне ефективне контекстне вікно (MECW) — точку, до якої точність реально тримається. Це значення зазвичай суттєво нижче від заявленого максимуму. Коли контекст виходить за межі MECW, починається явище, яке дослідники назвали context rot — поступова деградація відповідей зі зростанням обсягу контексту. Модель «губиться» в надто великому масиві інформації, і точність падає навіть на тих задачах, де раніше вона справлялася впевнено. Тобто заливати в 1-мільйонне вікно цілий проєкт «бо влізе» — це не лише дорого, а й шкідливо для якості. З чого складається вартість роботи з LLM Більшість кінцевих ШІ-сервісів продають підписки з фіксованою ціною та лімітами на використання. Але якщо ви підключаєте модель напряму від провайдера (або користуєтесь Bring Your Own Model у сервісах, які це підтримують), вартість рахується за формулою: Total cost = (input tokens × input price) + (output tokens × output price) При цьому output-токени коштують у 3-10 разів дорожче за input. Наприклад, для Claude Opus 4.7 це $5 за мільйон input токенів і $25 за мільйон output токенів; для Sonnet 4.6 — $3 і $15 відповідно. Також є кілька неочевидних факторів, які суттєво змінюють реальну ціну: Thinking tokens. Reasoning-моделі (Claude Opus 4.7, GPT-5.5 та інші) генерують внутрішні «роздуми» перед фінальною відповіддю. Користувач їх не бачить, але тарифікуються вони як output. Детальніше цей механізм розглянемо нижче. Prompt caching. Claude і GPT дозволяють кешувати вхідні токени промпту, зменшуючи їхню вартість до 90%. Це критично для агентів з великим системним промптом, що повторюється в кожному запиті. Саме нехтування цим механізмом — одна з головних причин, чому автономні агенти на кшталт OpenClaw генерують такі рахунки: кожен крок повторно зчитує мегабайти контексту, які можна було б закешувати. Зміни в токенізаторі. Коли провайдер оновлює токенізатор разом з новою моделлю, це може непомітно збільшити вартість. Claude Opus 4.7 при виході отримала новий токенізатор: ціна за токен лишилась тією ж, але для частини кейсів фактична вартість input зросла до +35% через зміни у співвідношенні token-to-word. Для розрахунку й порівняння вартості між провайдерами зручно користуватися LLM Price Calculator від Artificial Analysis. Мова та мова програмування — теж мають значення Кирилиця, ієрогліфи, арабська — усі ці системи письма токенізуються значно гірше, ніж латиниця. Причина проста: токенізатори навчались переважно на англомовних корпусах. До цього додається UTF-8 encoding: текст українською займає більше байтів, що напряму збільшує кількість токенів у 2,5-3 рази і вартість запиту відповідно. Порівняння моделей у токенізації саме української мови можна знайти в цьому дослідженні. Те саме стосується і мов програмування. Динамічні мови в цілому більш token-efficient, бо не потребують явного зазначення типів. Наприклад, Python ефективніший за Go у цьому плані більш ніж у 1,5 рази. Детальне порівняння — на martinalderson.com. Оптимізація: рівень щоденного використання Управління контекстом: чому довгі чати — це погана ідея Через context rot — деградацію якості зі зростанням контексту — найефективнішою звичкою є уникання довгих, multi-topic чатів. Ось базові принципи: Один чат — одна задача. Не варто поєднувати в одному діалозі планування, реалізацію і дебагінг. Кожна нова задача або тема – новий чат. Розділяйте сесії за типом. Окремий чат для загального аналізу й планування, окремі – для конкретних підзадач із вузьким контекстом. Це не лише покращує якість відповідей, а й дозволяє більш точно контролювати, яка інформація потрапляє до моделі. Використовуйте вбудовані інструменти для менеджменту контексту. У Claude — це Projects з окремим контекстом і кнопка «New chat». У Cursor і Claude Code — команди /clear або /compact для стиснення або скидання контексту. Загалом, багато корисних рекомендацій щодо ефективного context engineering для AI-агентів можна почитати у Anthropic. Передача контексту: чому Markdown — найдешевший формат Коли потрібно передати LLM великий обсяг зовнішнього контексту (вміст сайту, документацію, статтю), формат файлу має пряме значення для токенів і якості обробки. Markdown є найефективнішим форматом: до 87% менше токенів порівняно з HTML і до 70% економії порівняно з PDF. Причина проста: Markdown позбавлений важкої структурної розмітки, метатегів та візуального сміття, які не несуть семантичного навантаження для моделі, але справно тарифікуються провайдерами API. Для конвертації використовують такі рішення: Сайти → Markdown: Jina AI Reader — достатньо додати r.jina.ai/ перед будь-яким URL (наприклад, https://r.jina.ai/https://journal.gen.tech/news), і сторінка повертається у чистому Markdown. PDF → Markdown: Any-to-Markdown — безкоштовний тариф дає до 50 конвертацій на місяць. Caveman та міф про 75% економії на output-токенах Торік на GitHub набрав понад 60,000 зірок репозиторій з так званим Caveman skill для Claude Code. Ідея проста: системний промпт змушує модель відповідати примітивно – лише іменники й дієслова, без граматичних зв'язок, коротко й «телеграфно». Заявлена економія: до 75% output-токенів. Деякі бенчмарки показували лише 14-21% реальної економії від такого формату відповіді на практичних задачах. Також на практиці є декілька нюансів: Output-токени у типовій Claude Code сесії становлять лише 5-15% від загального контексту. Основна витрата — це input: кеш репозиторію, файли, історія сесії. Навіть якби Caveman справді давав 75% економії на output, реальна загальна економія склала б 3-10% від усієї вартості інтеракції. Так звані filler-токени («Certainly!», «I'd be happy to...») не є просто повністю зайвими словами. Для моделі вони виконують роль своєрідного обчислювального заповнювача — поки генерується малозначущий токен, модель формує наступний суттєвий крок відповіді. Крім того, примусовий стилістичний формат відповіді займає частину уваги (attention) моделі, яка тепер витрачається не лише на вирішення задачі, а й на дотримання стилю. Однак, наразі немає надійних публічних бенчмарків, які б дали точну відповідь, наскільки це впливає на якість роботи моделі. Що гарантовано економить output-токени — це точність і конкретність у описі бажаного результату. І цього можна досягти без Caveman промпту на 552 токени. Кілька простих конструкцій, додані до системного промпту або безпосередньо до запиту, дають у реальних тестах схожий результат (до ~21% економії output токенів): No filler, no preamble. Answer first. Tool call first, explanation after. Drop pleasantries. No hedging. Fragments fine. Short synonyms. Pattern: [thing] [action] [reason]. [next step]. Pro-поради Серіалізація даних: CSV, JSON і чому варто знати про TOON Коли потрібно передати структуровані дані в LLM — результати запиту з бази, конфіг, аналітику — більшість за замовчуванням використовує JSON. Це розумний вибір для складних даних із вкладеними об'єктами та масивами, але не завжди оптимальний з точки зору токенів. Коротке правило: Flat tabular дані (рядки й стовпці без вкладеності) — CSV буде найефективнішим: мінімум синтаксичного шуму, лінійна структура. Складні дані з вкладеністю та зв'язками — тут зазвичай беруть JSON. Але є альтернатива. У 2025 році з'явився формат TOON (Table-Oriented Object Notation), розроблений саме для передачі даних у LLM. Ключова ідея: замість того, щоб повторювати назви полів для кожного об'єкта, TOON зберігає їх один раз у заголовку, а самі значення розміщує в табличному вигляді з відступами — без дужок і зайвих лапок. Офіційні бенчмарки показують економію 30-60% токенів порівняно з JSON (в деяких тестах — до 70–75%). Для передачі великих масивів однотипних об'єктів у LLM це наразі найбільш ефективне рішення. Корисні посилання: якісне порівняння форматів TOON, JSON, CSV, YAML онлайн-конвертер JSON → TOON. Thinking-моделі: коли вони виправдані і чому коштують дорожче Частина сучасних LLM перед тим, як видати фінальну відповідь генерує внутрішні «роздуми» – так звані thinking tokens або reasoning tokens. Ці токени не відображаються у відповіді, яку бачить користувач, але тарифікуються як output. Що це дає: модель має можливість явно дослідити кілька підходів, перевірити проміжні результати й лише потім зафіксувати відповідь. Для складних задач із багатокроковою логікою це суттєво покращує якість — модель значно рідше «ковзає» по поверхні проблеми. Аналіз 45+ reasoning-моделей показує, що в середньому thinking-модель генерує майже у 6,5 разів більше токенів, ніж відображає у фінальній відповіді. Тобто видима відповідь у 200 токенів може насправді споживати 1,500 і більше токенів. Для прикладу, thinking mode підтримують Claude Opus 4.7, Claude Sonnet 4.6, GPT-5.5, Kimi k2.5 тощо; без thinking mode — Claude Sonnet 4.5, Gemini 3.1 Flash та попередні покоління більшості моделей. Adaptive thinking — це офіційно рекомендований режим для frontier Claude моделей. У цьому режимі модель сама оцінює складність запиту і вирішує, чи думати перед відповіддю. На ймовірність увімкнення thinking впливає також параметр effort, виставлений для запиту. Для AI-агентів adaptive thinking особливо корисний, оскільки дозволяє моделі продовжувати думати між послідовними викликами інструментів (tool calls). Thinking Mode дійсно виправданий в таких кейсах: Планування для агентів — задачі, де потрібно декомпозувати мету на кроки і вибудувати правильну послідовність дій. Синтез складних документів — cross-referencing між кількома джерелами, виявлення суперечностей, підготовка аналітики. Multi-step завдання зі складними вимогами — будь-яка ситуація, де рішення має відповідати кільком обмеженням одночасно і де помилка на проміжному кроці тягне за собою каскад помилок далі. Для рутинних запитів, прямих питань і простих трансформацій тексту увімкнений thinking mode буде просто зайвою витратою як токенів, так і часу на очікування відповіді, оскільки якість відповіді не буде помітно вищою. Отже, Compute Crunch — це новий базовий стан індустрії, який триватиме, доки попит на інференс випереджатиме темпи побудови дата-центрів. Ефективність промптингу стає окремою інженерною дисципліною. Раніше «вміти користуватися ШІ» означало просто формулювати запит. Тепер це означає розуміти, як рахується токен, коли модель повторно зчитує контекст, і де reasoning-режим подвоює рахунок.
Spotify запускає озвучку статей Rolling Stone, WIRED і Vogue
Spotify запускає новий формат контенту — Narrated Articles (озвучені статті). Компанія почала додавати в застосунок озвучені версії довгих журнальних статей. Spotify додає довгі статті в аудіоформаті На старті сервіс отримає понад 650 статей англійською мовою. Озвученням матеріалів займається внутрішня команда Spotify Audiobooks. До проєкту приєдналися медіа Rolling Stone, The Atlantic, Vogue, Variety, Billboard, WIRED, Vanity Fair, Pitchfork, GQ та Vibe. Кожна аудіостаття триває не більше двох годин. Для Premium-користувачів вони будуть доступні в межах щомісячного ліміту аудіокниг. Користувачі без підписки зможуть купувати окремі матеріали по $1,99. Spotify хоче зробити аудіокниги менш «страшними» для нової аудиторії У Spotify заявляють, що Articles мають стати проміжним форматом між подкастами та повноцінними аудіокнигами. «Ми додаємо статті в аудіоформат як природне продовження музики, подкастів та аудіокниг, за якими люди вже приходять у Spotify», — сказала Licensing Lead Spotify Audiobooks Коллін Прендергаст. За словами компанії, коротші формати мають допомогти користувачам поступово звикати до довшого аудіоконтенту. Spotify також планує використовувати власні алгоритми рекомендацій та персоналізацію для просування статей серед зацікавленої аудиторії. Spotify активно розширює напрям аудіокниг Компанія запустила сервіс аудокниг трохи більше двох років тому. За цей час Spotify розширила цей напрям на 22 ринки. У компанії заявляють, що кількість годин прослуховування аудіокниг виросла на 60% в порівнянні з минулим роком. Spotify також продовжує розвивати функції аудіокниг, такі як персоналізований підбір контенту, короткі підсумки прослуханого та синхронний супровід тексту.
Акції Nokia злетіли через ШІ-бум і попит на дата-центри
Акції фінської Nokia виросли більш ніж на 140% від початку року. Інвестори дедалі частіше оцінюють компанію як одного з гравців ШІ-інфраструктури, повідомляє Bloomberg. Nokia — один з ШІ-бенефіціарів у Європі Nokia стала четвертою найуспішнішою компанією індексу Stoxx Europe 600 цього року. Акції компанії піднялися до найвищого рівня з 2008 року. Головною причиною зростання став різкий попит на оптичне обладнання Nokia для дата-центрів і ШІ-інфраструктури. Ринок також почав по-новому оцінювати бізнес компанії. Forward P/E Nokia за рік виріс приблизно з 17 до 36. Водночас ШІ та хмарний напрям наразі формують лише 8% квартального виторгу Nokia. «Просте переоцінювання акцій уже відбулося. Тепер головне питання — чи буде друга хвиля зростання», — сказала керівниця досліджень Energy Group Capital Аманда Лайонс. ШІ-інфраструктура змінила позицію Nokia Після продажу мобільного бізнесу Microsoft у 2014 році Nokia зосередилася на комунікаційній інфраструктурі. Однак останніми роками цей ринок сповільнився через завершення активного розгортання 5G у багатьох країнах. Ситуацію змінив ШІ-бум. Минулорічне придбання Infinera Corp. посилило позиції Nokia в оптичних мережах — ключовій інфраструктурі для дата-центрів, адже ШІ-компанії відчули потребу у швидшій передачі даних між обчислювальними кластерами. У першому кварталі продажі Nokia, пов’язані з ШІ, виросли на 49%. У квітні компанія навіть підвищила прогнози для хмарних та ШІ-напрямів. NVIDIA інвестує в Nokia Додатковий імпульс акціям дала інвестиція NVIDIA на $1 млрд. У межах партнерства NVIDIA використовуватиме свої чипи для прискорення програмного забезпечення Nokia для 5G та 6G-мереж. Також NVIDIA вивчає можливість інтеграції дата-центрових технологій Nokia у власну ШІ-інфраструктуру. На цьому тлі інвестори почали сприймати Nokia як компанію ШІ-мережевої інфраструктури та порівнювати її з Arista Networks та Ciena. Основний бізнес Nokia тисне на компанію Попри ШІ-оптимізм, основний бізнес мобільних мереж Nokia усе ще залишається слабким місцем компанії. Він усе ще формує понад половину продажів Nokia та демонструє нижчу маржинальність, ніж ШІ-напрями. Компанія також стикається зі зниженням витрат операторів зв’язку і втратою окремих контрактів у США. Деякі інвестори побоюються, що ринок уже занадто агресивно заклав ШІ-зростання в оцінку Nokia. Портфельний менеджер Skagen Vekst Сондре Солволл Баккетун заявив, що фонд уже скоротив свою позицію в акціях Nokia через погіршення співвідношення ризику та потенційної прибутковості.
Uber заявила, що ШІ-витрати стає дедалі важче виправдати
Uber почала сумніватися в ефективності власних ШІ-інвестицій після різкого зростання витрат на ШІ-інфраструктуру та використання моделей. Про це заявив президент і COO компанії Ендрю Макдональд в інтерв’ю Rapid Response. Uber не бачить прямого зв’язку між ШІ і продуктивністю Макдональд заявив, що компанії складно оцінити, наскільки зростання використання ШІ реально впливає на кількість корисних функцій для користувачів. За його словами, Uber поки не бачить чіткої залежності між споживанням токенів у Claude Code та реальними продуктовими результатами. «Цього зв’язку поки немає. Можливо, ми справді випускаємо більше продуктів, але дуже складно провести пряму лінію між цими показниками та тим, що ми створюємо на 25% більше корисних функцій для користувачів», — сказав Макдональд. Він додав, що ситуація може стати зрозумілішою в наступні квартали або роки, однак зараз компанії складно оцінити реальну ефективність ШІ-витрат. Uber економить на наймі працівників через ШІ Uber витратила $3,4 млрд на дослідження та розробку в 2025 році. Це на 9% більше, ніж роком раніше. Раніше CEO Uber Дара Хосровшахі заявляв, що компанія компенсує зростання ШІ-витрат тим, що скорочує темпи найму нових працівників. «Якщо ви не можете напряму показати, скільки корисних функцій отримують користувачі, то таку заміну дедалі важче виправдати», — наголосив СОО компанії. ШІ-компанії дедалі частіше стикаються з питанням ROI Uber нібито вичерпала свій річний ШІ-бюджет лише за перші чотири місяці 2026 року. На цьому тлі компанія почала публічно ставити питання про реальний ROI від ШІ-інвестицій. Uber використовує Claude Code від Anthropic для ШІ-розробки та автоматизації частини інженерних процесів.
Китай створює національну систему ідентифікації для гуманоїдних роботів
Китай запускає національну систему цифрової ідентифікації для гуманоїдних роботів. Кожен з них, отримає унікальний цифровий код для відстеження протягом усього життєвого циклу, повідомляє South China Morning Post. Китай хоче стандартизувати ринок роботів Ініціативу запустили 23 травня під назвою Humanoid Full Lifecycle Management Service Platform. Проєктом керує комітет Humanoid Robotics and Embodied Intelligence Standardization (HEIS), який працює при Міністерстві промисловості та інформаційних технологій Китаю. Система присвоюватиме кожному двоногому гуманоїдному роботові унікальний цифровий ID. Його використовуватимуть для контролю всього життєвого циклу робота — від виробництва до утилізації. Уряд Китаю заявляє, що система потрібна для посилення безпеки, контролю ризиків і регулювання швидкозростаючої індустрії робототехніки. Гуманоїдний робот-поліціянт (AFP) Кожен робот отримає код із кількох частин Цифровий ID складатиметься з чотирьох блоків. Перші два символи — національний код для контролю міжнародних поставок і продажів. Ще чотири цифри позначатимуть виробника. Шість цифр відповідатимуть моделі, а 17-значний серійний код ідентифікуватиме конкретного робота. За словами заступника голови Китайського інституту стандартизації електроніки Юй Сюміня, правила поширюватимуться на всіх учасників ринку: виробників, продавців, сервісні компанії, користувачів і центри переробки. До системи вже підключили понад 28 тисяч роботів За даними китайської влади, у системі вже зареєстровані понад 100 виробників роботів, а цифрові ID уже отримали понад 28 тис. роботів із приблизно 200 моделей. Китай активно нарощує інвестиції у цьому напрямі. За даними IDC (International Data Corporation), світовий ринок гуманоїдних роботів зріс на 508% минулого року. Загальний обсяг поставок у світі становив близько 18 тис. роботів. IDC зазначає, що китайські компанії зараз займають лідерські позиції завдяки масштабному локальному виробничому ланцюгу. Китайські роботи швидко прогресують Недавно у Пекіні відбулось змагання між людьми та роботами Beijing E-Town Humanoid Robot Half-Marathon. Переможцем став робот від компанії Honor. Робот подолав дистанцію за 50 хвилин 26 секунд — це приблизно на шість хвилин швидше за світовий рекорд на аналогічній дистанції. Для порівняння, минулорічний робот-переможець Tiangong проходив дистанцію за 2 години 40 хвилин.
Ferrari представила електромобіль Luce за €550 тис. із дизайном від творця iPhone
Ferrari офіційно представила свій перший електромобіль під назвою Luce. Над дизайном моделі компанія працювала разом із Джоні Айвом та Марком Ньюсоном із дизайн-студії LoveFrom. Ferrari вперше випустила електромобіль Luce став першим EV в історії Ferrari. Також це другий чотиридверний автомобіль бренду та перша п’ятимісна модель компанії. Ferrari раніше вже показувала інтер’єр Luce, але тепер уперше повністю продемонструвала зовнішній дизайн автомобіля. Зовнішній вигляд моделі Luce (Ferrari) У компанії заявили, що LoveFrom брала участь у проєкті «з самого початку» та допомагала формувати загальний дизайн автомобіля — як зовні, так і всередині. Над дизайном працювали колишні дизайнери Apple Джоні Айв, один із головних дизайнерів iPhone, iMac та інших продуктів Apple, та Марк Ньюсон заснували LoveFrom після виходу з компанії. Luce має мінімалістичний дизайн, але водночас зберігає фізичні кнопки в салоні. Журналіст Engadget Тім Стівенс описав автомобіль як більш схожий на SUV, ніж на класичний спорткар Ferrari. Luce отримав чотири електромотори та понад 1000 кінських сил Ferrari заявила, що Luce оснащений чотирма електромоторами та має потужність 1035 кінських сил. Тест-драйв журналістам поки не надали, однак Тім Стівенс зазначає, що автомобіль «виглядає дуже перспективно» з точки зору характеристик. Інтер'єр моделі Luce (Ferrari) Окрему похвалу автомобіль отримав за звук. На відміну від багатьох EV, Ferrari не використовує повністю синтетичний звук. Натомість система підсилює реальні вібрації задніх електромоторів. Ferrari Luce стане найдорожчим автомобілем бренду У Ferrari повідомили, що в Італії Luce коштуватиме від €550 тис. Це робить модель найдорожчим автомобілем Ferrari. Американську ціну компанія поки не оголосила.