top of page
Фото автораКатерина Мещерякова

Нейромережа: що це, як працює, найкращі приклади



За 2022-2023 роки нейромережі стали частиною звичного життя. Хтось намагався делегувати задачі Chat GPT, хтось «грався» з налаштуваннями Midjourney, а хтось за допомогою DeepCode шукав помилки у коді. Пізніше у кожному напрямі з’явилося кілька альтернатив, тож кожен може обрати свого AI-асистента під конкретні робочі завдання. У цьому матеріалі розповідаємо про 13 поширених нейромереж із різних категорій, запитуємо, як ними користуються генезійці, пояснюємо, що таке нейромережа з точки зору технологій, та як все влаштовано «під капотом». 



Що таке нейромережа


Нейронні мережі — це спосіб машинного навчання, коли комп’ютер вчиться виконувати завдання, аналізуючи велику кількість прикладів. Нейромережі здатні обробляти великі обсяги даних, шукати серед них закономірності та давати підґрунтя для ухвалення різноманітних рішень. Спосіб передачі інформації схожий на те, як поводяться нейрони у мозку людини чи тварини. Звідси й назва технології. 


У 2022 та 2023 роках відбувався справжній бум у розвитку генеративного штучного інтелекту. Стрічками технологічних (і не тільки) медіа ширилися новини про ChatGPT та Midjourney, багато технологічних гігантів інтегрували AI у свої продукти, а дослідники з OpenAI забили на сполох, попередивши правління про небезпеку, яку становить нове відкриття у галузі штучного інтелекту. Велику роль у розвитку нейромереж, зокрема двох найпопулярніших, зіграла архітектура нейромереж Transformer. Розроблена в Google для машинного перекладу, вона замінила не настільки ефективну архітектуру LSTM.


Популярність та перспективність нової технології підтверджують і цифри: у 2022 році обсяг ринку програмного забезпечення для нейромереж складав $20,8 млрд. Прогнозують, що до 2032 року цей показник досягне позначки у $152,7 млрд при середньорічному темпі зростання (CAGR) у 24,8%. Світову першість у темпах розвитку утримує США, адже саме там зосереджена більшість компаній, які створюють відомі нейромережі. 


Як влаштовані нейромережі


Аби зрозуміти принцип роботи, потрібно розібратися з кількома термінами: 


  • нейрон — структурна одиниця та основний «будівельний матеріал» нейромережі. Він отримує інформацію, обробляє її та передає значення іншим нейронам;

  • шар — своєрідна система, в яку збираються нейрони;

  • поріг — це показник, що визначає, чи буде нейрон активним; 

  • вага — коефіцієнт, який визначає силу сигналу при з’єднанні нейронів. Простіше кажучи, вага показує наскільки сильно один нейрон впливає на інший;

  • функція активації, або передавальна функція — це залежність, яка показує, як вхідний сигнал нейрона впливає на вихідний. 


В основі нейромережі — поєднані між собою нейрони, які можуть передавати інформацію одне до одного. Спочатку дані надходять до вхідного шару нейронів, далі вони потрапляють у приховані шари, а потім — у вихідний шар, який і надає результат обробки. Щобільше шарів, то складнішу інформацію здатна обробляти нейромережа. 



Схема простої нейромережі
Схема простої нейромережі

Силу з’єднання регулює вага, яка збільшує чи зменшує силу сигналів. Також нейрони можуть мати поріг. Якщо сума вхідних сигналів нейрона його перевищує, то нейрон активується. Наскільки сильно — визначає активаційна функція.


Аби нейромережа правильно обробляла інформацію, її потрібно навчати. Цей процес відбувається за допомогою методу зворотного поширення помилки (Backpropagation). У 1989 році його описав Джефрі Гінтон, якого вважають «хрещеним батьком» штучного інтелекту. Спрощено все виглядає так: розробники «показують» нейромережі набір вхідних та вихідних даних. Та обробляє інформацію й намагається генерувати вихідні дані, які збігатимуться з заданими. Якщо результат неправильний, вага нейронів змінюється, і все повторюється заново.



Процес навчання нейромережі
Процес навчання нейромережі

Для чого використовуються нейронні мережі


Нейронні мережі мають кілька варіантів використання в багатьох галузях. До прикладу:


  • у технологічній сфері їх використовують для безлічі завдань — від обробки природної мови до пояснення чи розбору нових мов програмування; 

  • у медицині технологія допомагає діагностувати захворювання, покращувати системи підтримки життєдіяльності, розробляти чи створювати нові ліки;  

  • у фінансах нейромережі дозволяють робити прогнози щодо різних ринків, виявляти шахрайства чи перевіряти платоспроможність клієнтів; 

  • промислові підприємства можуть інтегрувати таких «помічників», аби пришвидчити роботу, знайти дефекти у виробах чи оптимізувати логістику.



Світові компанії, які використовують нейромережі


Серед світових лідерів, які активно використовують штучні нейронні мережі можна виокремити кілька техгігантів: 


  • Amazon — для формування стрічки товарів на основі попередніх вподобань.

  • Netflix — для пропозиції цікавих для користувачів фільмів та серіалів.

  • Spotify — для підбору музики відповідно до смаків.

  • PayPal  для виявлення шахрайства в електронних платежах. 

  • Tesla — для автономного керування автомобілями.

  • Google — для рекомендацій, перекладу та прогнозу погоди. 

  • Facebook для рекомендацій контенту чи автоматичного модерування. 



Нейромережі для роботи з текстом





Мабуть, найбільш популярний інструмент, який струсонув індустрію та привернув увагу багатьох людей великим набором можливостей. Окрім здатності відповідати на питання з різних предметних областей, він може генерувати код різними мовами програмування. Хоча точність відповідей нейромережі не раз була сумнівною, він і досі залишається найвідомішим і найбільш вживаним інструментом у своїй категорії.


«Chat GPT добре впорався з оптимізацією рутинних завдань, як-от пошук інформації (замість Google), генерація ідей, уточнення кількох технічних нюансів на кшталт перероблення regex, пошуку потрібної команди чи помилки в коді. Втім, інформацію потрібно вміти перевіряти й уловлювати момент коли чат починає вигадувати неіснуючі команди чи можливості для інструментів. Для максимальної користі потрібно давати максимально детальне та уточнене ТЗ, просити перефразувати запит або ж «гратися» з ролями, від імені яких він може відповідати — тренера, експерта, викладача тощо», — каже Олексій Лакович, Head of QA в Solidgate, партнерській компанії Genesis.


Переваги: 


  • може дати відповіді на питання з багатьох дисциплін; 

  • генерує якісний текст з точки зору формулювання думок;

  • швидкий та інтуїтивний у використанні;

  • багато плагінів, які розширюють функціонал;

  • хороша клієнтська підтримка.  


Недоліки: 


  • у безкоштовній версії є лише дані, які зібрали до 2022 року. Щоб отримати більш свіжу інформацію, потрібно заплатити за преміум; 

  • згенерована інформація буває вигаданою, неправдивою, містити стереотипи чи упередження; 

  • для складніших запитів потрібно написати детальний промпт та зробити кілька ітерацій. 


Ціна за платну версію: від $20 на місяць. 





Ця нейромережа допомагає авторам створювати тексти із заданим форматом під конкретні потреби. Через це Rytr популярний у маркетинговому та бізнес-середовищі — він допомагає швидко створити описи продуктів, слогани, контент для лендингів та блогів тощо. 


Переваги: 


  • простий та інтуїтивно зрозумілий у використанні; 

  • добре працює з короткими формами; 

  • є API, що дозволяє інтегрувати інструмент зі сторонніми програмами.


Недоліки: 


  • згенерований контент не завжди правдивий;

  • кількість символів для промпту обмежена; 

  • не підходить для багатьох видів роботи з контентом, зокрема для довгих форм; 

  • іноді текст буває занадто «роботизованим». 


Ціна за платну версію: від $9 на місяць. 





Ще один сервіс на базі GPT, який допомагає оптимізувати роботу з текстами. Відмінна риса Copy AI — десятки шаблонів-промптів під будь-який запит та можливість завантажувати власні текстові файли. Серед шаблонів, які пропонує сервіс — варіанти для постів у соціальних мережах, пресрелізів, емейл-листів, SEO-текстів та іншого. 


Переваги: 


  • великий вибір шаблонів та промптів для різноманітних робочих завдань;

  • можливість редагувати готові відповіді;

  • зручний інтерфейс;

  • можливість налаштувати власний tone of voice, аби одержувати відповіді у потрібному стилі (щоправда, для україномовних текстів ця функція працює гірше, ніж для англомовних).


Недоліки: 


  • не завжди генерує релевантний та правдивий контент;

  • висока ціна в порівнянні з аналогічними сервісами; 

  • аби використовувати інструмент на максимум та дізнатися про всі його можливості, доведеться витратити багато часу; 

  • принцип «один обліковий запис — один гаджет».


Ціна за платну версію: від $49 за місяць.





Безкоштовний AI-асистент, який стане в пригоді усім, хто пише англійською. За потреби нейромережа підкаже закінчення речення чи допоможе зі структурою великого тексту. У вебверсії є велика бібліотека шаблонів для роботи з різними напрямами, як-от освіта, маркетинг, рекрутинг. З цікавого: можна зімітувати стиль відомого письменника або написати текст у стилі фантастичного роману.


Переваги:


  • має вбудовану перевірку на плагіат; 

  • окрім вебверсії, є спеціальне розширення Google Chrome, яке дає змогу використовувати нейромережу на сторонніх ресурсах, зокрема, у Google Docs; 

  • велика бібліотека шаблонів з різних дисциплін та опція зробити свої шаблони;  

  • для користування не обов’язково створювати обліковий запис.


Недоліки:


  • обмеження у безкоштовному плані досягаються швидко; 

  • детектор плагіату працює не надто точно; 

  • згенерована інформація не завжди актуальна; 

  • відсутня служба підтримки;

  • користувацький інтерфейс складніший, ніж в інших AI-асистентів.


Ціна за платну версію: від $20 на місяць. 





Менш відома розробка OpenAI з відкритим вихідним кодом, яка розпізнає та транскрибує аудіо в текст. Аби натренувати мережу, розробники «згодували» їй 680 000 годин записів різними мовами. Завдяки цьому Whisper вміє розпізнавати акценти, не боїться фонових шумів та технічного сленгу. 


«Ми використовуємо кілька нейромереж, зокрема Midjourney, Firefly та Deepl. Саме Whisper допомагає з транскрибуванням користувацьких інтерв’ю. Це хороший утилітарний інструмент. Через те, що це open source-проєкт, його не так легко запустити «погратися», але є багато інструкцій для інсталяції. Співробітників моїх ці інструменти не замінили, а от роботи їм додали. Тепер  вміння працювати з ними стає обов’язковим», — каже Сергій Чеботарьов, UX/UI Designer в SUITSME. 


Переваги:


  • за багатьма відгуками, найточніший інструмент штучного інтелекту для розпізнавання мовлення;

  • розпізнає понад 100 мов, може розставити розділові знаки чи одразу перекласти транскрибований текст іншою мовою; 

  • може транскрибувати чи опрацьовувати кілька записів паралельно.


Недоліки: 


  • може включати у текст слова, яких не було на аудіозаписі; 

  • розрізняє не всі специфічні галузеві терміни; 

  • не працює із записами поганої якості або тими, де є кілька співрозмовників;

  • щоб встановити інструмент, потрібно мати певні технічні знання, зокрема, розумітися у Python, FFmpeg, Xcode та Homebrew. 


Ціна за платну версію: 40 центів за годину запису. 



Нейромережі для роботи з зображеннями





«Хіт» серед нейромереж для малювання, Midjourney вважається найкращим у своєму напрямі. Генерує зображення у різних стилях, які можна сплутати з роботами професійних художників або фотографів. Функціонал дає змогу не лише створити зображення за текстовим описом, а й поєднати дві картинки або стилізувати одну під іншу. 


Переваги: 


  • дивовижна якість візуалу — зображення Midjourney можна сприйняти як створені людиною; 

  • генерує по чотири варіанти зображення на кожен промпт; 

  • є можливість імітації різних художніх стилів;

  • найбільш доступний для широкого загалу порівняно з іншими нейромережами. 


Недоліки: 


  • немає безкоштовної пробної версії; 

  • проблеми з анатомією, спотворені зображення рук та ніг; 

  • доступ лише через Discord, тому перед початком роботи потрібно підключитися до відповідного каналу.  


Ціна за платну версію: від $10.





Інструмент став головним конкурентом Midjourney після того, як останні прибрали опцію безкоштовного доступу. Окрім можливості використовувати до 150 токенів та 30 покращень на день, розробники запропонували велику бібліотеку різних моделей на будь-який смак та завдання. 


«За допомогою цієї нейромережі ми оптимізували процес пошуку аналогічних зображень на стоках. Раніше, щоб реалізувати задумане, потрібно було шукати відповідні фото на стоках, іноді «дофотошоплювати» якісь деталі або змінювати  їхній колір. Це займало досить багато часу дизайнерів. Зараз завдяки купі налаштувань в Leonardo AI, ми витрачаємо на це значно менше часу», — говорить Ілля Медвідь, Design Lead в SKELAR, партнерській компанії Genesis. «З цікавого — тут є опція негативного промпту, коли ти окремо прописуєш те, що ти точно не хочеш бачити на зображенні. Наприклад, на пейзажі не має бути людей або колір автомобілів може бути будь-яким окрім жовтого». 


Переваги: 


  • велика бібліотека різних моделей для генерації зображень;

  • наявність вебверсії та мобільного застосунку; 

  • можна обирати, скільки зображень генерувати за один раз (від одного до восьми);

  • дає змогу генерувати зображення на основі наданої фотографії; 

  • є вбудований генератор промптів;

  • є безкоштовна версія. 


Недоліки: 


  • для того, щоб почати роботу, потрібно подати заявку; 

  • згенеровані зображення часто бувають низької якості; 

  • не можна згенерувати варіант картинки на основі уже згенерованої або об’єднати зображення; 

  • галерея фотографій менша, ніж у Midjourney. 


Ціна за платну версію: від $10. 





Нейромережа, під капотом у якої — технологія дифузії та використання прихованого простору. Окрім можливості створювати зображення за текстовими описами, модель здатна змінити зображення відповідно до обраного стилю, згенерувати 3D-об’єкт чи домалювати деталі. 


«Stable Diffusion доволі важко встановити, тому я використовую його рідше за ті ж Midjourney і Pika. Втім, він має величезний потенціал. Зазвичай я «прошу його» допомогти з відеокреативами, стилізувати зображення або змінити частину картинки. Наприклад, перевдягти модель чи перетворити її на людину з іншої епохи. Розміри зображення можна задавати аж до пікселя, є багато розширених параметрів. У промпті можна прописувати навіть інтенсивність певних налаштувань у кінцевому зображенні. Дуже круто працює з масками.


Величезний плюс — це безкоштовний інструмент. Однак обробка зображення та рендер відео забирають дуже багато часу, а зображення виходять не такими реалістичними, як у Midjourney. Для кращого результату потрібно завантажувати додаткові розширення, деякі з яких важать кілька гігабайтів. Одне з них, ControlNet, дає змогу контролювати кінцевий результат», — говорить Катерина Лебідь, Graphic Designer у Headway, партнерській компанії Genesis. 


Переваги: 


  • генерує зображення з високою якістю;

  • можна навчати на власних роботах;

  • працює не лише зі статичними зображеннями, а й з відеороликами та анімацією;

  • генерує зображення високої якості з низькоякісних першоджерел;

  • усі зображення можна редагувати, видаляти фон, працювати з палітрами кольорів тощо. 


Недоліки: 


  • для роботи з цією нейромережею потрібен потужний комп’ютер з хорошим процесором; 

  • поєднувати картинки не можна;

  • довго генерує зображення;

  • може довго обробляти «важкі» зображення чи відео;

  • не працює з низькоконтрастовими зображеннями та тими, які мають високу зернистість. 


Ціна за платну версію: 339 грн. 





Lexica працює за тим же принципом, що й інші нейромережі для генерації зображень. Відправною точкою для творчості може слугувати бібліотека готових артів з підказками, які промпти використовувалися для генерації кожної картинки. Більшість створених зображень мають схожий та більш-менш впізнаваний стиль. 


Переваги: 


  • висока якість зображень;

  • за одним запитом генеруються чотири зображення, на основі яких можна створювати нові картинки; 

  • є змогу генерувати два (у платній версії — три) зображення одночасно;

  • зручний та інтуїтивно зрозумілий інтерфейс; 

  • є бібліотека стилів для генерації. 


Недоліки: 


  • одноманітний стиль у різних зображеннях; 

  • обмежені можливості для вибору команд; 

  • проблеми із зображенням тексту — слів, цифр та символів. 


Ціна за платну версію: від $8.





Розробка від лідера на ринку продуктів для дизайнерів, який вирішив не відставати від тренду на штучний інтелект. Бета-версію Adobe Firefly запустили у березні 2023 року, й наразі вона все ще перебуває на стадії розробки. Нейромережа має чотири основні функції: створення зображення за текстовим описом, застосування різноманітних ефектів до слів та фраз, застосування до зображень різних колірних палітр, видалення фону та об’єктів на зображенні. 


«Adobe Firefly дуже круто допоміг мені для візуалізації різних креативів за запитом. Він підтримує українську мову, має багато зручних налаштувань стилів і освітлення, а результат досить якісний. Однак це платний інструмент, він нараховує кредити разом з покупкою пакета Adobe», — каже Ілля Медвідь, Design Lead в SKELAR, партнерській компанії Genesis.


Переваги:


  • генерує зображення високої якості; 

  • створені зображення можна використовувати як референси; 

  • простий, інтуїтивно зрозумілий інтерфейс;

  • є можливість роботи з текстом. 


Недоліки:


  • обмежені можливості налаштувань; 

  • задовга швидкість обробки зображення; 

  • немає власної бібліотеки; 

  • щоб почати користуватися, потрібно подати заявку та дочекатися запрошення;

  • іноді неправильно відтворює анатомію людей та тварин. 


Ціна за платну версію: залежить від пакета Adobe та користування.

 


Нейромережі для роботи з кодом





DeepCode — платформа для code review на основі ШІ, яка допомагає розробникам виявляти проблеми, помилки та вразливості у коді в режимі реального часу. Крім цього, нейромережа пропонує більш економні та вдалі рішення, базуючись на прикладах схожих алгоритмів у інших проєктах. Розробники нейромереж заявляють, що DeepCode виявляє набагато більше дефектів, ніж будь-який інший подібний інструмент. 


Переваги:


  • швидкий результат — за відгуками, DeepCode у десятки разів швидший за аналогічні інструменти; 

  • добре підходить для великих кодових баз; 

  • безперервно навчається;

  • вміє шукати прогалини у безпеці;

  • інтеграція з GitHub, GitLab, та у майбутньому — з Bitbucket; 


Недоліки:


  • занадто висока ціна за платну версію;

  • перед використанням потрібні певні налаштування та конфігурації;

  • не підтримує деякі мови та фреймворки. 


Ціна за платну версію: $98.

 




V0 — це система генеративного користувацького інтерфейсу від Vercel Labs на основі ШІ. Вона генерує зручний для копіювання та вставки React-код на основі shadcn/ui та Tailwind CSS, який люди можуть використовувати у своїх проєкт.

Фішка платформи у тому, що на основі цього коду можна швидко створити власний інтерфейс. 


«Нейронка дає готові сторінки за текстовим промптом, тож її доволі зручно використовувати для прототипування UI-компонентів. Якщо треба швидко зробити компонент, а дизайну з якоїсь причини немає, то інструмент якраз стає у пригоді. Якщо на проєкті є Tailwind, нейронка стає ще більш корисною, бо генерує готовий код, який можна використовувати», — говорить Юрій Підлісний, Front End Developer в Boosters. 


Переваги: 


  • те, що потрібно, аби створити простий інтерфейс, не залучаючи дизайнера; 

  • відносно швидкий. 


Недоліки:

 

  • не завжди показує очікуваний результат;

  • доступ надають за запитом, на нього доведеться очікувати. 


Ціна за платну версію: $20. 





Це не зовсім нейромережа, а скоріше бібліотека, де можна переглядати, шукати та використовувати уже готові моделі, тестувати демопроєкти. Платформа також слугує хабом для розробників та ШІ-ентузіастів. Сервіс має інфраструктуру для навчання та тренування моделей, тож тут можна легко завантажити власні нейромережі, або ж розвивати ті, що уже є. 


Розповідає Павло Кушнерик, Golang Developer у Solidgate, партнерській компанії Genesis: «Я використовував нейромережу для свого pet-проєкту контекстного таргетингу. Це метод який дає змогу ідентифікувати вподобання користувачів, базуючись на контенті який він споживає. Метод дозволяє оптимізувати рекламні компанії без використання файлів cookies. Я використовував її для кількох завдань: 


  • пошук ключових слів, тобто визначення списку слів, та фраз з тексту для ідентифікації основної теми контенту. Для розв’язання цієї задачі була використана нейромережа keyBERT

  • ідентифікація IAB категорій — загальноприйнятий в індустрії список категорій контенту, який дозволяє спростити оптимізації рекламних кампаній. Для цієї задачі я скористався алгоритмом Zero-Shot Classification, який дозволяє моделі розв'язувати задачу класифікації для класів, які були невідомі на етапі навчання. 


Серед цікавих кейсів — якщо попередньо ідентифікувати мову контенту, то якість пошуку ключових слів та категорій покращується. Для цього можна використати бібліотеку fasttext». 


Переваги: 


  • доступ до сотень різних моделей; 

  • можливість створювати власні нейромережі; 

  • система контролю версій;

  • модель можна легко протестувати на самому сайті; 

  • широка підтримка синтаксичного аналізу мови. 


Недоліки: 


  • більшість моделей великі за розміром, тому з ними важко працювати без доступу до високопродуктивної обчислювальної системи;

  • документація потребує покращення; 

  • знайти потрібні бібліотеки буває важко. 


Ціна за платну версію: від $9 на місяць. 



Асистент рівня джуніор


Поки Сем Альтман йде та повертається на посаду CEO OpenAI, а ChatGPT вчиться працювати з відео, розвиток нейр