Генерація зображень нейромережею: 5 безкоштовних сервісів

  • Нейромережa – це математична модель, що працює за принципом людського мозку. Вона навчається шляхом первинної обробки великого набору даних, не вимагаючи написання окремого коду під конкретне завдання.
  • В останні роки комп’ютерні нейромережі набули великого розвитку. В основному їх використовують для завдань, де потрібно обробити текст, відео, аудіо та іншу інформацію.
  • Особливої ​​популярності набули нейромережі, здатні швидко генерувати зображення з текстового запиту, поєднувати графічні об’єкти чи відтворювати відсутні елементи, зокрема людські обличчя. Вони не замінюють роботу дизайнерів та художників, але допомагають оптимізувати рутинні процеси.

Як нейромережі генерують зображення

Нейросети є одним із способів машинного навчання та лежать в основі алгоритмів глибокого навчання. Вони складаються з нейронів, які отримують, обробляють та повертають інформацію. Нейрони з’єднані між собою синапсами.

ІІ-моделі покладаються на навчальні дані для пошуку закономірностей та вирішення безлічі завдань на кшталт розпізнавання чи генерації зображень.

Наприклад, при пошуку схожих картинок за допомогою Google “Об’єктива” система також використовує нейромережу. Вона шукає подібність з іншими зображеннями з бази даних.

За подібним принципом алгоритми генерують ілюстрації з текстової підказки. Користувач вводить будь-який запит природною мовою і нейромережа комбінує відомі їй елементи.

Деякі моделі не здатні створювати зображення за текстом, але можуть накладати візуальні ефекти на готові картинки, стилізувати їх під роботи відомих художників або змінювати вибрані об’єкти.

Потенціал таких систем безмежний, особливо у сфері мистецтва. У 2022 році широку популярність набули ІІ-генератори зображень.

Bing Image Creator

Сервіс від компанії Microsoft заснований на нейромережі DALL-E. У березні 2023 року техгігант запустив окремий сайт для інструментів та інтегрував його в чат Bing.

У жовтні 2022 року відбувся публічний реліз сервісу, що дозволило вільно реєструватися у сервісі та користуватися ним. Наразі система генерує понад 2 млн зображень на день. У той же час, щоб створити профіль у DALL-E 2, знадобиться номер телефону з обмеженого списку країн.

Bing Image Creator

У квітні ІІ-генератор з’явився у браузері Edge. Він доступний з бічної панелі програм для користувачів по всьому світу.

Щоб застосувати сервіс, необхідно відкрити вікно браузера, ввести підказку і дочекатися результату. Image Creator згенерує чотири варіанти зображень, які можна завантажити.

Щоб уникнути використання інструменту для створення токсичного контенту, Microsoft запровадила власний механізм захисту на додаток до методів OpenAI.

Компанія також прямо уточнює, що зображення створюються штучним інтелектом та помічають результати водяними знаками.

Інструмент надає користувачам 25 бустерів на тиждень, призначених для прискорення створення картинок. Кожен запит списується один токен.

За вичерпанням бустерів, компанія пропонує отримати їх за бали системи винагороди Microsoft Rewards або дочекатися поновлення.

Dream by WOMBO

Веб-сервіс дозволяє створювати зображення безкоштовно та без реєстрації, але є Premium-версія. Також користувачам доступний мобільний додаток на Android та iOS .

Щоб створити картинку, потрібно ввести текстовий запит довжиною до 200 символів і вибрати стиль візуалізації. Через 10-20 секунд нейромережа видасть результат у роздільній здатності 960×1568 пікселів.

Готові зображення можна завантажити чи опублікувати у стрічці на сайті сервісу.

Dream by WOMBO

Опція “Редагувати з текстом” дозволяє за допомогою підказки змінити згенероване зображення. Можна перемалювати зображення, додати або видалити елемент, переробити стиль об’єкта або зробити інверсію ілюстрації.

Функція перебуває у беті і точність її досить низька.

Dream by WOMBO

У безкоштовній версії відредагувати малюнок можна лише двічі. Потім потрібно перезалити зображення або змінити нове.

Крім того, сервіс надає можливість на запит стилізувати власну картинку.

Premium-підписка коштує $9,99 на місяць або $89,99 на рік. Сервіс також пропонує користувачам можливість одноразового платежу $169,99.

Stable Diffusion

Генератор зображень тексту, створений компанією Stability AI. У вересні 2022 року сервіс став доступним для широкої аудиторії.

Модель навчили створювати картинки за будь-яким текстовим запитом, включаючи зображення з громадськими діячами та оголеними людьми. Однак у листопаді 2022 року компанія оновила алгоритм, «послабивши» його здатність створювати NSFW-контент та ілюстрації у стилі конкретних художників.

Нейросеть малює безкоштовно.

Користувачеві достатньо ввести текстовий запит, який може складатися з будь-якої кількості слів. Потім модель згенерує чотири варіанти ілюстрації з роздільною здатністю 512×512 пікселів.

Stable Diffusion

Lexica Aperture

У грудні 2022 року засновник пошуковика для картинок та ІІ-підказок Lexica Шаріф Хамім представив генератор зображень Lexica Aperture. Алгоритм вміє створювати фотореалістичні ілюстрації на текстовий запит.

Lexica Aperture

Нейросеть доступна безкоштовно після входу в систему через простий веб-інтерфейс. Вона створює зображення в книжковій або альбомній орієнтації з роздільною здатністю 768×1152 пікселів.

Під полем введення підказки можна вказати негативний запит — те, чого має бути малюнку. Також сервіс дозволяє завантажити референсну картинку.

Lexica Aperture

Готове зображення можна розширити чи створити його варіації.

Lexica Aperture

Deep Dream Generator

Платформа призначена для створення та редагування зображень. Сервіс вимагає реєстрації облікового запису та має обмеження на безкоштовне використання.

На сайті проекту є три режими роботи.

Text 2 Dream

Дозволяє створювати малюнки за текстовим описом. Користувачеві необхідно вигадати підказку або натиснути кнопку «рандомний запит».

Генератор працює відносно швидко, але іноді не дотягує рівня DALL-E 2 або Stable Diffusion. Це стосується інтерпретації слів та створених малюнків.

Deep Dream Generator

Deep Dream

Режим дозволяє проводити глибоке оброблення вихідного зображення за допомогою алгоритмів штучного інтелекту. Для цього потрібно завантажити картинку та задати параметри: початкову глибину, ІІ-посилення та шар нейромережі.

Deep Dream Generator

Deep Style

У цьому режимі користувач може стилізувати існуюче зображення. Йому потрібно завантажити картинку чи фото та вибрати референсну ілюстрацію зі списку.

Deep Dream Generator

Що стосується обмежень на безкоштовне використання, то при реєстрації облікового запису користувачеві нараховують 30 одиниць енергії. Вони згоряють при застосуванні інструментів: по п’ять балів за запит у Deep Style або Text 2 Dream та по два бали за звернення до Deep Dream.

Енергію можна докупити. Найдешевший тариф коштує $19 на місяць.

DALL-E 2

У січні 2021 року компанія OpenAI здійснила революцію в області ІІ, представивши генератор картинок за текстовим запитом DALL-E.

Це трансформер , побудований на базі великої мовної моделі GPT-3 з 12 млрд параметрів та навчений на парах «текст-зображення».

Нейросеть генерує зображення з роздільною здатністю 256×256 пікселів. Вона має різноманітний набір можливостей, включаючи створення антропоморфних тварин та об’єктів, реалістичне поєднання незв’язаних концепцій, рендеринг тексту та застосування перетворень до існуючих ілюстрацій.

DALL-E 2

У квітні 2022 року компанія випустила другу версію нейромережі, здатну з меншою затримкою генерувати реалістичні картинки з роздільною здатністю 1024×1024 пікселів.

DALL-E 2 дозволяє вибирати та редагувати певні області існуючих зображень, додавати або видаляти елементи разом із тінями, створювати колажі та варіації готових малюнків.

Сатоші Накамото

Також у новій версії нейромережі доступна функція Outpanting. З її допомогою можна розширити зображення за допомогою текстових підказок. При додаванні нових об’єктів система враховує існуючі візуальні елементи на кшталт тіней, відбитків та текстур.

У жовтні 2022 року OpenAI закрила список очікування для бета-версії генератора зображень.

Нейросеть доступна в усіх країнах, крім Афганістану, Білорусі, Венесуели, Ірану, Китаю та Росії.

У лютому 2023 року стало відомо, що Україну виключили зі списку держав, де заблоковано сервіси компанії. Однак алгоритми OpenAI не працюють на тимчасово окупованих Росією територіях.

Користувачі з регіонів, де технологія недоступна, зможуть взаємодіяти з DALL-E 2 тільки за наявності VPN-сервісу та активного телефонного номера з відкритої для продуктів OpenAI держави.

Реєстрація в DALL-E 2 безкоштовна. Для створення зображень будуть потрібні кредити, які списуються по одному при надсиланні кожного текстового запиту.

Раніше новим користувачам надавали безкоштовні спроби створення картинок. Однак нещодавно це змінилося.

Нейросеть стала платною для акаунтів, зареєстрованих після 6 квітня 2023 року. 115 спроб коштують $15.

При цьому користувачі, які створили обліковий запис раніше вказаної дати, досі можуть використовувати нейромережу безкоштовно. Вони отримають 50 кредитів, кількість яких за місяць зменшиться до 15. Кількість спроб відновлюється кожні 30 днів.

Різні компанії та відомі бренди використовують DALL-E 2. Журнали Cosmopolitan та The Economist задіяли нейромережу для генерації обкладинок. Microsoft запустила на базі сервісу власну програму Designer , яка вміє створювати контент на кшталт тексту, рекламних банерів, листівок та логотипів.

Джерело