Нейросеть Кандинский онлайн:
достойная ли замена Midjourney?

Созданы десятки онлайн-сервисов для обработки существующих и создания новых изображений. В этом сегменте одним из лидеров считается Midjourney. Из продуктов российских разработчиков внимания заслуживает Kandinsky. Всего за полгода своего существования он прошел большой путь и уже демонстрирует хорошие результаты. Мы расскажем, как пользоваться нейросетью Кандинский 2.1, чем она интересна и в каких ситуациях может оказать реальную помощь.

Содержание
  1. Kandinsky — что это?
  2. Технические характеристики
  3. Что нового в версии Кандинский 2.1?
  4. Как работать с Кандинский 2.1: инструкция
  5. Сценарии использования Kandinsky 2.1
#
Редактируйте результат генерации за 1 клик в ФотоМАСТЕР
  • Улучшайте качество изображений
  • Убирайте точечные и более мелкие дефекты
  • Меняйте фон на готовом изображении

Kandinsky — что это?

Нейросеть Kandinsky онлайн — это модель для преобразования текстов в изображения (text-to-image). Она использует удаленные сервера Sber и не нагружает устройство пользователя. Весь функционал доступен даже на дешевых смартфонах и старых ноутбуках.

Исходный код сети находятся в свободном доступе. Если у вас есть соответствующие знания, то можете установить систему на свой ПК. В этом случае стоит учитывать, что нейросети нужна «тренировка». Искусственный интеллект (ИИ, AI) использует ранее изученные образцы. Чем их больше, тем выше качество последующей работы.

Технические характеристики

Лицензия: бесплатная
Версии: 2.1
Количество понимаемых языков: 101 (включая русский)
Разработчик: ПАО «СберБанк»
Доступ: бесплатный и без регистрации

Плюсы и минусы


Плюсы:
  • Не ограничивает количество генераций.
  • Создает рисунки в течение примерно 1 минуты.
  • Доступно более 20 стилей и 5 вариантов разрешения.
  • Удобный и понятный интерфейс.
  • Можно использовать запросы на русском языке.
Минусы:
  • Минимум настроек — только предустановленные варианты разрешения и стиль.
  • Не всегда верно распознает запросы.
  • Нельзя указывать характеристики, которых не должно быть у финального изображения.

Где найти

  • Нейросеть Кандинский 2.1 можно скачать бесплатно на телефон с операционной системой Андроид: Google Play, AppGallery, RuStore.
  • Официальный сайт сервиса.
  • FusionBrain — графический онлайн-редактор на базе нейросетевых технологий. В нем можно убрать лишнее с фото и сгенерировать рисунок на основе референсов.
  • Облачный сервис cloud.ru — доступен профессиональный режим, в котором команды отправляются в виде программного кода и доступно больше настроек.

Что нового в версии Кандинский 2.1?

Разработчики переработали генеративный алгоритм сети. Скорость обработки выросла в несколько раз. Появились пользовательские настройки (разрешение и стили) и альтернативные интерфейсы. Прежде были доступны только основной сайт и мобильное приложение «Салют». Теперь к ним добавились Телеграм-бот, онлайн-редактор и облачная платформа. Качественный скачок нейросети Кандинский 2.1 онлайн, по сравнению с предыдущей версией, заметен сразу.

Кандинский 2.0
Изображение, созданное Кандинский 2.0 по запросу «Персонаж Кот в сапогах».
Кандинский 2.1
Изображение, созданное Кандинский 2.1 по запросу «Персонаж Кот в сапогах».

Повысилась детализация, а явных артефактов стало меньше. Но ухудшилась интерпретация запросов. В нашем случае подразумевался персонаж одноименного произведения Шарля Перро. Прежняя версия ИИ поняла это, тогда как Сбер Кандинский 2.1 «нарисовал» кота, который просто решил примерить ботинки.

Генерация изображения в нейросети
Картинка, созданная в 2.1 по описанию «Кот обут в сапоги, одет в шляпу, держит шпагу».

Как работать с Кандинский 2.1: инструкция

Онлайн-редактор и бот в мессенджере предлагают дополнительные функции и параметры. Облачная версия позволяет обучать систему на собственных данных и менять настройки.

Возможности нейросети

  • Создание рисунков по тексту и в выбранной стилистике.
  • Генерация на базе референсов.
  • Смешение двух изображений.
  • Удаление некоторых частей на фото.
  • Смешивание картинки и текста.
  • Создание вариаций картинки.

Режимы работы

  • Генерация по описанию. Его длина ограничена 252 символами.
Генерация по описанию
Пример генерации по фразе «Кот едет на мотоцикле».
  • Смешивание картинки и текста. ИИ дополняет визуальный референс по описанию.
Смешивание картинки и текста
Пример смешивания картинки и текста. Использовалось предыдущее изображение и описание «Добавить светофор».
  • Смешивание картинок. Искусственный интеллект использует загруженные референсы и создает на их основе новый рисунок.
Смешивание картинок
Пример смешивания картинок. Использовались предыдущие изображения.
  • Вариации картинки. ИИ немного корректирует референс. Изменения вносятся произвольно, но с учетом стилистики оригинала.
Вариации картинки
Пример вариации картинки из предыдущего пункта.
  • Редактирование. Позволяет убирать ненужные фрагменты рисунка и добавлять объекты. Используются описания и референсы.
Редактирование
Изображение из предыдущего пункта, отредактированное нейросетью.

Стили изображений

  • аниме;
  • детальное фото;
  • киберпанк;
Генерация в стиле киберпанк
Генерация в стиле киберпанка, запрос «Кот».
  • Кандинский;
  • Айвазовский;
  • Малевич;
  • Пикассо;
Генерация в стиле Пикассо
Генерация в стиле работ Пабло Пикассо, запрос «Кот».
  • Гончарова;
  • классицизм;
  • ренессанс;
  • картина маслом;
  • рисунок карандашом;
  • цифровая живопись;
  • средневековый стиль;
Генерация в средневековом стиле
Пример генерации в средневековом стиле, запрос «Кот».
  • Новый год;
  • советский мультфильм;
  • 3D-рендер;
  • мультфильм;
  • студийное фото;
  • портретное фото;
  • мозаика;
  • иконопись;
  • хохлома;
Режим «Хохлома»
Режим «Хохлома», запрос «Кот».

Текстовая генерация

Основная функция нейросети СберБанка Kandinsky. Разберем, как ею пользоваться:

  1. Откройте сайт сервиса.
  2. Введите описание результата, которого хотите добиться.

    По условиям лицензионного соглашения, нельзя создавать контент, который нарушает российское законодательство.

  3. Выберите подходящее разрешение.
  4. Укажите стиль генерации.
  5. Нажмите «Отправить», чтобы запустить обработку.
  6. По завершении процесса можно приступить к скачиванию работы, поделиться ею в соцсетях или создать новую картинку.
Текстовая генерация изображения
Изображение по запросу «Кот сажает картофель на огороде» без дополнительной стилизации. Из явных артефактов — неправильный зрачок левого глаза.

Нейронные алгоритмы еще не достигли совершенства — система не понимает пространные описания. Их нужно делать краткими и тезисными.

Что лучше: Кандинский или Миджурней
Генерация по запросу «Солнечным днем кот выходит из своего дома, чтобы отправиться в лес, хорошо отдохнуть и набрать ягод». Результат скорее «Кот в лесу возле ягод».

Много подробностей могут мешать. ИИ игнорирует некоторые детали или не понимает их.

Создание картинки с помощью ИИ
Генерация по запросу «Кот одет в куртку, в лапах корзинка, выходит из деревянного дома, на фоне летний лес». Результат соответствует запросу, однако нейросеть не придумала, как кот должен держать корзину.

Подробные описания некорректно работают со стилизацией. В этом случае лучше ограничиваться коротким словосочетанием.

Создание картинки с помощью Кандинский Онлайн
Стиль «Классицизм» по запросу «Кот создает статую мыши». На изображении нет мышей. За будущую скульптуру можно принять искаженный силуэт другого кота.

Также нейросеть Kandinsky онлайн плохо понимает существительные, которые образованы из двух слов и пишутся через дефис.

Kandinsky онлайн генерирует изображения и фото
Стиль «Классицизм» по запросу «Кот-скульптор». Лапы деформированы, есть лишние пальцы и ничто не указывает на то, что животное занимается скульптурой.

Работа с готовыми генерациями

Этот режим доступен в редакторе Fusion Brain.

  1. Перейдите на сайт сервиса.
  2. Рабочая область обозначается фиолетовой рамкой. Можно регулировать ее размеры и перемещать по холсту.
  3. Основные инструменты расположены на панели в верхнем левом углу. Нажмите третью кнопку и загрузите на сервер исходную картинку. Работа с готовыми генерациями
  4. Выберите ластик, а затем закрасьте области на рисунке, которые нужно обработать. Fusion Brain
  5. При необходимости введите запрос в поле внизу в центре, а затем кликните «Создать», чтобы приступить к обработке. Как создать картинку в нейросети Кандинский
Итоговая работа
ИИ удалил выделенный объект и автоматически скорректировал окружающее пространство.

Нейросеть пока не справляется с более сложной обработкой. Лучше использовать функцию, чтобы убирать ненужное или дорисовывать новые объекты.

Пример сложной генерации
Использовался запрос «Выпрямить лапы, сделать на каждой лапе по 5 пальцев». В результате ИИ дорисовал лишнюю лапу.

Смешивание изображений

Режимом удобнее пользоваться в Telegram-боте.

  1. Перейдите на канал с ботом.
  2. Нажмите «Смешивание картинок». Смешивание изображений в Telegram-боте
  3. По очереди загрузите 2 файла. Бот предупредит, что их нужно отправлять как фотографии.
Смешивание изображений с помощью Кандинского
Результат смешивания изображений с котом-грибником и котом на пьедестале. ИИ дорисовал каменную арку.

Нейросеть допускает явные ошибки, если референсы отличаются по содержанию. Желательно использовать похожие рисунки.

Нейросеть для смешивания фото
Результат смешивания двух ранее созданных картинок с котами-грибниками.
Результат без очевидных ошибок.

Вариация картинок

Этот режим также предоставляет бот в Telegram.

  1. Откройте канал бота.
  2. Нажмите «Вариации картинки».
  3. Отправьте исходный файл. Его нужно пересылать как фотографию.

Качество финального рисунка зависят от оригинала. Нейросеть повторяет общий стиль, оставляет крупные объекты и не исправляет артефакты.

Вариация сгенерированных картинок
Вариация ранее созданного рисунка. ИИ сохранил общий сюжет. На лапах кота по-прежнему остались лишние пальцы.

Сценарии использования Kandinsky 2.1

Нейросеть СберБанка Кандинский можно использовать не только для развлечения. С ее помощью можно обрабатывать фото, создавать коммерческие иллюстрации и логотипы. В графическом редакторе вы легко исправите ошибки, которые допустил ИИ.

Цифровая живопись

Созданные рисунки можно использовать как заготовки для собственных картин или как источник вдохновения. Нейросеть умеет переделывать изображения под определенные техники (иконопись, хохлома и другие) и работы известных художников. Поэтому вы можете подстроить генерацию под собственный стиль.

Векторная графика

ИИ пригодится, чтобы создавать логотипы, ярлыки приложений и графику для элементов интерфейса. Результат генерации потребует ручного редактирования. Однако общие расходы на подготовку контента сокращаются.

Наполнение сайта или блога

Среди стоковых изображений не всегда удается найти подходящие иллюстрации. Каждый раз создавать уникальные материалы — дорого и долго, а в некоторых случаях и невозможно (например, если зимой понадобится летнее фото). Нейросеть решит эти проблемы. Качество контента приближается к работам опытных дизайнеров и художников. Некоторые материалы даже можно спутать со снимками.

Итоги

Мы познакомились с ИИ от СберБанка. Попробовать нейросеть Кандинский можно без регистрации. Существуют версии системы в виде чат-бота, веб-приложения, мобильной программы для Android, онлайн-сервиса и облачной платформы. ИИ упрощает подготовку графического контента для Digital-сферы. Соответствующие задачи отнимают меньше времени и на них не нужно выделять опытных специалистов — достаточно базовых навыков в дизайне.

Часто задаваемые вопросы

Что такое промт для нейросети?
Это текстовые запросы (описания) того результата, который вы хотите получить.
Как улучшить качество сгенерированного изображения?
Некоторые нейросети позволяют редактировать уже созданные изображения за счет дополнительных запросов. Например, система может увеличить разрешение и убрать лишние объекты Если у вас есть навыки графического дизайна, вы можете внести нужные изменения самостоятельно в стороннем редакторе.
Как сформулировать текстовый запрос для нейросети?
Используйте тезисы без лишних подробностей. Каждый элемент рисунка достаточно описать одним словом или коротким словосочетанием. Разделяйте тезисы запятыми. Системы от зарубежных компаний не всегда корректно распознают русский язык, поэтому для них запросы лучше писать по-английски.
Комментарии (0)
Прокомментируйте первым!
Смотреть ещё
Оставить комментарий:
Введено символов: 0 из 1000
Антиспам:
=
Alt