Как с помощью нейросетей нарисовать картину по словам: ТОП-7 лучших онлайн сервисов в 2024 году
Новостями про нейросети уже никого не удивить. Искусственный интеллект может писать эссе, придумывать стратегии и рисовать картинки. Собрали ТОП лучших нейросетей для создания изображений. Разбираемся, как работает каждая из них.
Немного о нейросетях
Не каждую картинку нейросети рисуют только по словам: некоторые сервисы в работе полагаются и на наброски, и на заранее загруженные исходные материалы (например, иллюстрации, фотографии), и на собственные алгоритмы, автоматически генерирующие и пейзажи, портреты, а еще — рекламные креативы, логотипы и обложки для журналов.
У каждой нейронной сети собственный почерк, а потому ниже и представлен список наиболее актуальных и действительно запоминающихся сервисов для знакомства с технологиями из приближающегося будущего.
Midjourney — впереди планеты всей
Midjourney — нашумевшая нейросеть, генерирующая изображения на основе текстовых запросов любой сложности. «Гарри Поттер посреди декораций из Cyberpunk 2077», «Последний день Земли», «Обложка для журнала The Economist» — сервис креативно подходит ко всем задачам и всего за несколько минут превращает слова в иллюстрации.
Развивается Midjourney семимильными шагами: еще на стадии раннего бета-тестирования нейросеть стала постоянно появляться в заголовках новостей, а сейчас активно применяется в веб-разработке, дизайне и даже на специальных платформах для художников.
Где попробовать: в текстовом чате Discord-сервера Midjourney.
Сколько стоит: бесплатная версия включает 25 генераций в низком разрешении. Дополнительные попытки приобретаются по подписке (стоимость — от 10 долларов в месяц).
Как рисовать: перед доступом к «цифровому холсту» и алгоритмам Midjourney необходимо зарегистрироваться в Discord, добавить нейросеть в друзья и разобраться с рекомендациями от разработчиков.
После предварительной подготовки сервер разблокирует доступ к чатам для новичков (раздел Newcomer Rooms в левой части интерфейса Discord) и разрешит в появившемся текстовом поле ввести запрос, начинающийся с команды /imagine и включающий слова, описывающие тот контент, который и необходимо нарисовать.
Midjourney с легкостью воплощает любые идеи в жизнь: нейросеть за пару мгновений нарисует логотип для блога и макет для будущего сайта, подготовит абстрактные иллюстрации и персонажей из сериалов и кино, а еще изобразит лица, одежду или какие-нибудь космические пейзажи.
Разрозненные идеи Midjourney рекомендует постоянно комбинировать. Например, по запросу Mafia, Harry Potter, Russia — нейросеть способна всего за несколько минут нарисовать настоящий шедевр, который и не снился современным художникам.
DALL-E Mini — все впереди
DALL-E Mini — нейросеть, лишь частично связанна с оригинальной DALL-E, разрабатываемой специалистами из OpenAI (один из основателей — миллиардер Илон Маск) при сотрудничестве с Microsoft. Версия Mini подготовлена независимым экспериментатором, исключившим сложные концепции «оригинала», но сохранившим тысячи параметров и миллионы примеров, из которых и рождаются будущие проекты.
С точки зрения детализации и креативности DALL-E Mini не конкурент Midjourney, зато мини-нейросеть не требует предварительной регистрации в Discord, не вынуждает платить за попытки генерации, а вместе с тем выдает сразу 9 готовых картинок, наглядно демонстрирующих то, как искусственный интеллект распознает слова и смешивает идеи.
Простота DALL-E Mini мгновенно привлекла общественность: уже через несколько недель после запуска, нейросеть обрела популярность в социальных сетях и разошлась тысячами мемов по Telegram-каналам. Хайп по DALL-E Mini не стихает до сих пор.
Где попробовать: на официальном сайте DALL-E Mini, у партнеров (например, Crayion) или в чате одноименного Telegram-бота.
Сколько стоит: бесплатно, но на сайте периодически появляется реклама, а еще разработчики активно принимают пожертвования от тех, кто заинтересован в развитии концепта DALL-E.
Как рисовать: быстро прикоснуться к алгоритмам нейросети проще всего на сайте Crayion: там даже регистрация и не понадобится — достаточно найти пустующее текстовое поле в верхней части веб-страницы и вписать от 2 до 10 слов, разделенных пробелами.
Каждый запрос DALL-E Mini обрабатывает за 2-3 минуты: в результате под кнопкой Draw появится набор из 9 иллюстраций, по-разному представляющих ранее составленный запрос. И, хотя с поставленными задачами нейросеть справляется достаточно быстро, рассчитывать на результаты уровня Midjourney еще рано: DALL-E Mini редко справляется с прорисовкой персонажей, а те же пейзажи постоянно выдает недоработанными или смазанными. Но с сюрреализмом и абстракцией проблем точно не возникнет.
Подготовленный контент с сайтов и Telegram-каналов нейросети выгружаются несколькими способами — с помощью кнопок Save и Screenshot, а еще методом переноса иллюстраций на футболку (Print on a T-Shirt). Печать обойдется в 25-35 долларов — итоговая стоимость во многом зависит от способа доставки.
ruDALL-E Kandinsky / Malevich — по стопам великих художников
ruDALL-E Kandinsky / Malevich — семейство российских нейронных сетей, разрабатываемых и поддерживаемых специалистами из SberDevices и Sber AI. «Кандинский» и «Малевич» в руках «Сбербанка», как и сервисы-конкуренты, с легкостью превращают слова и целые предложения в иллюстрации, причем сразу в нескольких стилях, да еще и сходу распознавая текст, составленный на русском языке.
Разница между несколькими версиями нейросетей от Sber и значительная, и незаметная для тех, кто еще незнаком с нейросетями. Например, «Малевич» после отправленного запроса выдает всего одну картинку в художественном стиле, собранную на основе 1.3 миллиардов параметров. У «Кондинского» выборка масштабнее – уже 1.2 петабайт примеров и идей, но результат все тот же — одна картинка, но детализированная и в выбранном стиле.
Где попробовать: на официальном сайте ruDALL-E, в мобильных редакторах «Салют», а еще — в Discord и в Telegram.
Сколько стоит: бесплатно, без рекламы, подписок и дополнительных платежей.
Как рисовать: виртуальные холсты нейросети ruDALL-E разделены на категории и закреплены в верхней части веб-страницы. Например, слева в списке находится модель Kandinsky 2.0, разработанная в Институте искусственного интеллекта AIRI при сотрудничестве со Sber AI и включающая миллиарды параметров, генерирующих неповторимые иллюстрации всего за несколько минут.
По соседству на панели быстрого доступа закреплены сервисы Kandinsky 1.0 и Malevich, придерживающихся иных алгоритмов и иначе трактующие схожие запросы. Последняя вкладка выделена под Emojich — платформу, генерирующую эмодзи, смайлики и иной контент для социальных сетей.
Специалисты из SberDevices и Sber AI рекомендуют поочередно воспользоваться каждым из представленных проектов для знакомства с современными технологиями, но редакция блога Сергея Смирнова ограничится лишь разделом Kandinsky 2.0. Цель — нарисовать рыжего котика на зеленом диване в стилистике советского мультфильма с разрешением в 1024×512 пикселей.
Вписывать подготовленные запросы нейросеть разрешает в том числе и на русском языке: предварительно переводить текст на английский совсем необязательно. Время на распознавание текста и подготовку картинки — от 1 до 5 минут в зависимости от загруженности сервиса. Сгенерированная иллюстрация выводится в верхней части веб-страницы в единственном экземпляре (а не как у Midjourney или DALL-E сразу в нескольких версиях).
Dream by Wombo — сплошная абстракция
Dream by Wombo — канадский стартап, неожиданно превратившийся из локальной платформы для генерации NFT-изображений в сервис, завирусившийся в Tik Tok и социальных сетях и уже способный составить конкуренцию и DALL-E, и разработкам от Sber.
Нейронная сеть от Wombo специализируется на разработке абстрактных иллюстраций во многих стилях, включая фантастические, мультяшные и даже в духе художников-импрессионистов. С портретами и персонажами нейросеть справляется через раз: в 90% случаев вместо какой-нибудь выразительной фигуры появляется лишь призрачный силуэт, сливающийся с фоном.
Но так даже лучше: любые неточности Dream скрывает за пеленой абстрактного искусства, из-за чего даже невнятный набросок сразу же превращается в причудливую картину, мгновенно обретающую какую-то необычную форму. И с формой у нейросети действительно полный порядок — каждая сгенерированная картинка сразу же приковывает взгляд.
Где попробовать: на официальном сайте Dream.AI или в мобильных редакторах для iOS и Android.
Сколько стоит: бесплатно на сайте (но с ограничениями: например, без заранее оформленной подписки недоступны некоторые стили и алгоритмы), но платно на мобильных платформах. Стоимость Premium-версии — от 379 рублей в месяц.
Как рисовать: рабочая область на сайте Dream by Wombo разделена на части. Слева закреплена поисковая строка, куда вписываются текстовые запросы (слова необязательно разделять запятой, достаточно расставить пробелы), чуть ниже составлена таблица со стилями, полностью меняющими облик генерируемого изображения, а уже справа выводится результат.
Недоступные для взаимодействия стили и инструменты на сайте нейросети заблокированы: без Premium-аккаунта, например, нельзя использовать стили «город» и «акварельные краски», а еще — просматривать альтернативные версии подготовленных иллюстраций.
Среди недавних нововведений Dream — генерация контента на основе заранее добавленных исходников — картинок или NFT. Подмешивая дополнительные материалы, у цифровых художников появится шанс иначе взглянуть на собственные работы и даже сменить стиль.
Night Cafe — перерисовывая реальность
Night Cafe — набирающая популярность нейросеть, специализирующаяся не превращении разрозненных слов в выразительные иллюстрации в нескольких стилях: для экспериментов доступны десятки шаблонов, включая «Аниме», «Темное фэнтези» и «Портреты».
Кроме стилей, Night Cafe не мешает выбирать еще и алгоритмы распознавания текста и генерации нового контента. С момента запуска нейросети в редакторе появилась поддержка Stable, DALL-E 2, Coherent и Artistic. Но со временем разработчики обещают добавить и иные техники подготовки иллюстраций из слов.
Где попробовать: на официальном сайте Night Cafe.
Сколько стоит: каждая попытка генерации нового контента на сайте Night Cafe обходится в 1-2 кредита. Местная валюта или приобретается по подписке (от 10 долларов в месяц) или выдается за пройденные задания. Например, счет пополняется на 5 кредитов за публикацию сгенерированного контента в социальных сетях с хэштегом нейросети.
Как рисовать: начинать работу над новым контентом разработчики рекомендуют с выбора подходящего алгоритма (выбранный по умолчанию вариант Stable тоже подойдет, но почему бы и не поэкспериментировать?) и знакомства с проектами, уже подготовленными сторонними художниками (раздел Evolving a Top Creation).
Выставив подходящие параметры, остается лишь найти текстовое поле Your text prompt и ввести предложение или набор слов, способных расшифровать будущую иллюстрацию. Редакция блога Сергея Смирнова, например, попыталась изобразить с помощью алгоритма DALL-E 2 оживленный Париж темной ночью, да еще и под дождем.
Подготовленный нейросетью результат появляется на соседней вкладке и сразу же становится доступен для публикации в социальных сетях. При желании иллюстрацию несложно доработать – например, дополнив запрос новыми словами или же загрузив дополнительные исходные материалы.
Starryai — любое слово искусство
Starryai — альтернатива Dream от Wombo, придерживающаяся схожих идей. Речь и поддержке референсов (исходных материалов), и о мгновенной расшифровке сложных запросов, и о специальном разделе для быстрой генерации NFT.
Несмотря на сходства с конкурентами, у Starryai собственный почерк: например, нейросеть не мешает выбирать подходящий алгоритмы для работы (вариантов несколько – художественная Argo, абстрактная Altair и натуралистичная Argo 2), а вместе с тем настраивать количество выдаваемых результатов и регулировать качество итоговой работы.
Где попробовать: на официальном сайте, а еще в редакторах для iOS и Android.
Сколько стоит: не более пяти попыток генерации за сутки. Дополнительные попытки приобретаются разовым платежом (от 7 долларов) или же выдаются в течение месяца с Premium-подпиской (от 15 долларов).
Как рисовать: регистрация на сайте обязательна: для доступа к виртуальному холсту понадобится профиль Google или Apple ID. После пройденной авторизации Starryai предложит сначала выбрать алгоритм для генерации картинок (без собственных экспериментов найти разницу между ИИ та еще проблема), а уже после приступать к заполнению пустующих текстовых полей.
Например, в верхней части специально подготовленной формы ввести текстовый запрос, составленных из связанных слов или же разрозненных фраз. Чуть ниже предусмотрен выбор стиля (вариаций несколько — от работ импрессионистов до фотографий в стиле National Geographic), количества итоговых экземпляров (4 или 8).
Над кнопкой Create, запускающей процесс генерации, закреплен и ползунок Advanced Settings, отображающий дополнительные параметры (например, количество итераций и итоговый размер холста – широкий, мобильный или портретный). Как и в предыдущем случае, редакция блога Сергея Смирнова попытается нарисовать мрачный и дождливый Париж, скрывающийся в сумерках.
Artbreeder — графический редактор из будущего
Artbreeder — творческая платформа, напоминающая нечто среднее между графическим редактором, который составляет необычные портреты из загруженных с компьютера фотографий и иллюстраций, и нейросети, справляющейся в том числе и с текстовыми запросами.
От выбранного формата взаимодействия с Artbreeder во многом зависит и итоговый результат: например, если сосредоточиться на портретах, то платформа разрешит контролировать детали внешности — на ходу менять возраст и пол, добавлять волосы и скрывать под толстыми мазками невидимой кисти ехидную улыбку.
Переключившись же на холст с поисковой строкой, Artbreeder начнет распознавать добавляемый в специальное поле текст и генерировать иллюстрации в заранее подготовленной форме.
Где попробовать: на официальном сайте.
Сколько стоит: бесплатно. Перед доступом к виртуальному холсту необязательно даже регистрироваться. Но для загрузки сгенерированных изображений в высоком качестве разработчики рекомендуют оформить подписку (стоимость – от 10 долларов в месяц).
Как рисовать: инструменты для рисования и генерации картинок представлены на главной странице сервиса Artbreeder в виде заранее подготовленных шаблонов. Выбрав подходящую «основу», необходимо навести курсор на иллюстрацию и нажать на кнопку Remix This Image.
Если выбран портрет, то нейросеть разблокирует доступ к дополнительным заготовкам, необходимым для смены внешности: с помощью специальных ползунков появится шанс поменять чужие черты лица, одежду и даже аксессуары.
«Не портреты» редактируются уже на специальном холсте, но снова по заранее подготовленному шаблону. Вместо ползунков командовать предстоит уже текстовыми запросами, добавляя и меняя слова.
Подготовленный результат появится в центральной части веб-страницы и сразу же станет доступен для загрузки или публикации в социальных сетях.
Какие нейросети ждать в 2024-2026 году?
Нейросети развиваются слишком быстро: пока редакция блога рисовала котиков и дождливый Париж, специалисты из OpenAI запустили бета-тестирование DALL-E 2 (доступ до сих пор ограничен — понадобится специальное приглашение) и представили еще более многогранную систему распознавания текста. Генерируемые иллюстрации, как подсказывают разработчики, станут еще реалистичнее, а подготовленный контент появится возможность сразу же редактировать и дополнять новыми деталями.
Вместе с релизом DALL-E 2 готовится к запуску и Imagen — нейросеть от Google, способная составить конкуренцию даже Midjourney. Будущая новинка еще на стадии бета-тестирования впечатлила общественность: Imagen с легкостью собирает реалистичные картинки даже на основе сложных текстовых запросов (и целых абзацев из книг!).
Но Imagen и DALL-E 2 не единственные нейросети, способные перевернуть индустрию. Начиная с 2023 года желательно следить за целой серией проектов. Например, за разработкой GauGAN2 от Nvidia, комбинирующей сразу несколько моделей построения иллюстраций, включая семантическую сегментацию и наброски в выбранном стиле, или за развитием искусственного интеллекта, появившегося в TikTok.
И последняя новость не розыгрыш: социальная сеть действительно способна нарисовать задний фон для видеоролика с помощью специального эффекта AI Greenscreen и любого текстового запроса. О нововведении уже рассказали специалисты из The Verge, но эффект до сих пор тестируется и доступен лишь некоторым блогерам.
Последний способ не потеряться среди обновлений — почаще заглядывать на страницы сервиса Stable Diffusion: о нейросети постоянно рассказывают в социальных сетях, а разработчики уже готовят крупное обновление. Но при желании поэкспериментировать никто не мешает уже сейчас — достаточно перейти на страницу Demo и ввести любой текстовый запрос. Важная особенность Stable Diffusion — минимум ограничений и полноценная поддержка «реалистичного стиля».
То есть, нейросеть не пытается абстрагироваться от реальности, скрывая недостатки и шероховатости искусственного интеллекта, а наоборот — выдает результат, приближенный к возможностям цифровой фотографии.
Заключение
Нарисовать картинку с помощью нейросетей легче, чем кажется — в списке выше представлена целая коллекция сервисов, с легкостью превращающих любые слова в иллюстрации. Точнее и выразительнее конкурентов пока со всеми задачами справляется Midjourney: на страницах сервиса ArtStation почти каждый день появляются впечатляющие работы, способные — с точки зрения мастерства — потеснить даже современных художников.
Но Midjourney совсем скоро составят конкуренцию и DALL-E 2, и Imagen, и Stable Diffusion, а потому не время стоять в стороне — пора лично погрузиться в атмосферу искусственного интеллекта и даже попробовать собрать парочку картинок для работы. Почему бы не сконструировать логотип, объявление или картинку для новости в социальных сетях?