Рейтинги и инструкции Как создавать промты для нейросетей

Гайд: что такое промты для нейросети и какие правила есть для их создания?

Иванцов Захар Фотограф

08.12.2023

10 мин

Комментарии

4.1 Оценок: 317

Тот, кто уже пользовался технологиями машинного обучения (или собирается это сделать в скором времени), сталкивался с термином «промт». Им обозначаются команды на генерацию. В статье мы подробно расскажем, что такое промты для нейросети, и объясним, как их прописать, чтобы искусственный интеллект выдал нужные результаты.

Содержание

Что такое промт в нейросети?
Виды
С чего начать?
Как писать промты для нейросети?
Для кого использование ИИ может быть полезным?
Подведем итоги: краткая инструкция к действию

создание изображений с помощью нейросетей

Искусственный интеллект уже демонстрирует отличные результаты, но допускает мелкие ошибки. Их можно исправить самостоятельно с помощью графического редактора ФотоМАСТЕР. Он прост в использовании, не требует мощного ПК или ноутбука и имеет встроенную нейросеть, которая автоматизирует рутинные операции и повышает точность обработки.

Скачать для Windows

Версия для MacOS

Что такое промт в нейросети?

Промты (от английского «Promt») — это запросы на генерацию. В них пользователь сообщает системе, какой именно контент ему нужен. Например, фотореалистичная иллюстрация, на которой Красная Шапочка сажает картошку, а не Карлсон-регулировщик в мультяшном стиле или любая другая случайная картинка.

Запросы подаются в текстовой форме. Также существуют нейросети, которые принимают референсные изображения, видеозаписи и аудиофайлы. Дополнительно могут назначаться системные команды. Они активируют определенные настройки: варианты стилизации, разрешение, длительность ролика или аудиофрагмента и прочее.

Для текстовых

Чтобы сделать промт для нейросети, которая пишет тексты (ChatGPT и другие), нужно ввести описание задачи. Это может быть вопрос («Сколько сейчас времени?»), просьба дать совет («Что мне сегодня надеть: куртку или пальто?»), написание реферата («Что такое грибы, где они растут и как их можно использовать?») или даже художественное произведение («Сказка про Красную Шапочку, в которой Бабушка побеждает Волка»).

Также ИИ умеет вести продолжительные диалоги. В некоторых системах (например, у Алисы от Яндекса) есть функции преобразования текста в речь и голосовой озвучки. В этом случае запрос можно произнести в микрофон, а затем прослушать ответ через динамики или наушники.

Результаты могут быть неэтичными или потенциально опасными. Нейронная сеть откажется обсуждать определенные темы или давать слишком подробные инструкции, например, как изготовить взрывчатку. Диагностика и лечение заболеваний — сложный процесс, в котором нужно учитывать множество факторов. Если вы спросите ИИ, что принять при боли в животе, алгоритм выдаст общие рекомендации и порекомендует обратиться к врачу.

Для визуального контента

Для создания изображений, анимаций и видео также часто используются письменные (реже — устные) запросы. В них описывается то, что должно находиться в кадре. Некоторые сервисы позволяют загружать референсы — другие иллюстрации или ролики. Прежде чем приступить к генерации по промту, эта нейросеть проанализует добавленный контент. Она попытается определить ключевые объекты и общую стилистику: палитру, пейзаж это или портрет, фотореалистичное изображение или рисунок и прочее. ИИ учтет особенности оригинала в итоговой работе. Если в кадре была собака, то же животное будет и на картинке. Если пользователь даст команду заменить ее на кошку, алгоритм обработает только фрагменты с собакой, а не с растительностью или людьми.

Описания и референсы также автоматически проверяются на этичность и безвредность. ИИ не будет генерировать порнографию, иллюстрированные инструкции по изготовлению наркотиков и подробные визуализации насилия. Однако гнетущая атмосфера, пугающие персонажи, жестокие сцены в стилистике, которая используется в массовой культуре, обычно допускаются.

Виды

Негативные — в них перечисляется то, чего не должно быть в конечном результате (например, определенных объектов или оттенков).
Уточняющие — указывают, какие изменения нужно внести в уже полученный результат (убрать какой-то элемент, поменять палитру или что-то еще).
Технические — специальные команды, которые активируют определенные режимы (стиль рисовки, выбор между скоростью или качеством генерации, разрешение и прочее).
Шаблоны или теги — типовые описания, которые неоднократно вводились пользователями (если функция предусмотрена, обычно сокращаются до короткой фразы).

С чего начать?

Перед тем как написать промт для нейросети онлайн или через специальное приложение, определитесь с тем, что вам нужно получить. Существуют десятки сервисов и программ, но эти решения не универсальны. Один софт предназначен для работы с текстами, другой — с визуальным контентом, третий — со звуком.

Несмотря на то, что в некоторых системах разработчики предусмотрели несколько функций, приемлемое качество обычно обеспечивает только часть инструментов (или даже единственный режим). Это справедливо и для стилизации. Одни алгоритмы хороши для быстрой генерации аниме-артов, другие больше подходят для фотореалистичных изображений. Также существуют узкоспециализированные сервисы, такие как нейросети для создания логотипов. Вам придется попробовать несколько систем, прежде чем вы найдете инструмент под свои задачи.

Продумайте содержание и особенности работы. Например: реалистичное изображение девушки на берегу моря, которая смотрит на взлетающую ракету, или мультяшный кролик с морковкой, нарисованный тушью. Пользователю достаточно сформулировать запрос простыми словами или загрузить картинку на сайт, а не изучать языки программирования или сложные системы команд для составления инструкций. Тем не менее свои особенности имеются и здесь. Ниже мы объясним, как правильно создавать промты для нейросетей.

Как писать промты для нейросети?

Как построить вопрос?

ИИ в целом научился понимать обычную человеческую речь, но не способен распознавать иронию, намеки, метафоры и скрытые смыслы. Постарайтесь формулировать мысль четко и так, чтобы в ней допускалось как можно меньше разных трактовок.

Идеальный вариант — единственное слово или короткая фраза, которая описывает основное содержание, и при необходимости несколько характеристик. Дополнительные слова, уточнения, громоздкие конструкции могут быть частично проигнорированы или испортят генерацию.

Многие сервисы создают несколько иллюстраций за раз, чтобы пользователь смог выбрать ту, которая больше соответствует его задумке. Поэтому лучше вводить меньше тезисов, но в дальнейшем модифицировать один из рисунков уточняющими промтами.

Предпочтительнее отправить запрос «Красная Шапочка едет на мотоцикле», а не «Пожалуйста, создай иллюстрацию, на которой Красная Шапочка едет по шоссе на двухколесном мотоцикле». В последнем случае ИИ проигнорирует проявления вежливости. Далее он может запутаться и выдать странные результаты, например, персонаж будет рисовать картину с мотоциклом или катиться по шоссе, как по горке.

Microsoft Bing. Генерация по запросу «Red Hood rides a motorcycle» («Красная Шапочка едет на мотоцикле»). ИИ изобразил персонажа как девушку-байкера. Есть незначительные
ошибки на руле мотоцикла и одежде.

Избегайте сниженной и табуированной лексики. Алгоритм может отклонить запрос или интерпретировать его буквально, без тех смыслов, которые обычно вкладывают в эти слова.

Какой язык использовать?

Обычно разработчики прямо указывают, какой язык допустим при создании промтов для нейросетей онлайн или в десктопной программе. Если проигнорировать это требование, появится предупреждение. Например, так происходит в Bing от Microsoft.

Если алгоритм изначально не предназначался для локализации текстов, описание может быть автоматически адаптировано под «родной» язык системы. Для этого используется сторонний софт для машинного перевода. Он не всегда демонстрирует приемлемое качество. Часто запросы переводятся буквально, без учета склонений и контекста. По этой причине промты для зарубежных сервисов (например, Stable Diffusion или Midjourney) лучше вводить
по-английски — он считается стандартом.

Русский язык оптимален для российских разработок (Алиса, Шедеврум, Кандинский).

Midjourney. Генерация по запросу «Red Riding Hood a paint by a wall» («Красная Шапочка роспись на стене»). ИИ выдал иллюстрацию со стеной, на которой есть граффити с Красной Шапочкой и Волком. Алгоритм уместно добавил подтеки краски, но над головой волка
они направлены не в ту сторону.

Сколько вопросов лучше задать?

Желательно ограничиваться короткими единичными тезисами. Несколько пространных описаний могут смешаться (даже если вы отделите их знаками препинания), что приведет к непредсказуемым результатам.

Стоит ввести «Красная Шапочка с гитарой», а не «Красная Шапочка в длинном плаще, в руках у нее электрогитара, пустые улицы вечернего города, темное небо с одинокой Луной».

Stable Diffusion. Генерация по запросу «Red Riding Hood with guitar» («Красная Шапочка с гитарой»). ИИ немного исказил руки и глаза, а также не нарисовал вторую ногу.

Стоит ли усердствовать с деталями?

Избыточная детализация тоже может навредить. ИИ предполагает, где должны быть определенные предметы, например, что меч или гитара находятся в руках у персонажа. Если уточнить про гитару в руках, могут появиться артефакты: конечности на заднем плане держат инструмент или нечто подобное.

Подробные описания узоров, добавление мелких элементов часто приводят к ошибкам.
Промпт «музыкант с черной гитарой с росписью под хохлому» может выдать фон или
одежду с характерным узором.

Lexica. «Musician with a black guitar with Khokhloma painting» («Музыкант с черной гитарой с росписью под хохлому»). ИИ немного исказил кисти рук и гитару, а также не понял, где
должна была находиться роспись.

Употребление «ключей» и шаблонов

На системном уровне промты активируют определенные настройки и логические связи. Когда задание на генерацию дается в свободной форме, даже одинаковые описания могут интерпретироваться по-разному. Чтобы избежать этого, в некоторых алгоритмах разработчики предусмотрели модификаторы или шаблоны. Они задают определенные режимы, и нейросеть действует более предсказуемо.

Deep Dream Generator. «Red Riding Hood on the seashore» («Красная Шапочка на берегу моря»), модификаторы «HDR», «Elegant», «Extremely Detailed» (HDR — режим глубокого отображения цвета, «Элегантный», «Экстремальная детализация»). ИИ исказил лицо персонажа и разместил его в лесу, а не возле моря. Иллюстрация действительно имеет много мелких деталей
и яркие насыщенные цвета.

Работает ли стилизация?

Стилизация — одна из разновидностей модификаторов. Она задает технику рисунка, цветовую гамму и общую атмосферу: акварель, работы Ван Гога, картины масляными красками, аниме, пиксель-арт и другие. Часто стилизация выводится в отдельную настройку, но если такой опции нет, приписку можно сделать в Prompt («Девушка возле дерева, рисунок тушью»).

Starryai. «Red Riding Hood» («Красная Шапочка»), режим иллюстраций, стилизация под стикеры. ИИ допустил незначительную ошибку справа на спине под капюшоном.

Как использовать цвета и оттенки?

В промте можно обозначить общую палитру или расцветку определенных элементов. Если не будет лишних деталей, с высокой вероятностью система правильно обработает задание.

DreamStudio. «Red Riding Hood dressed in green hood» («Красная Шапочка в зеленом капюшоне»), стилизация «Digital Art» («Цифровое искусство»). ИИ окрасил плащ в зеленый цвет, но красный платок дает персонажу большую узнаваемость.

Можно ли вставлять имена известных людей?

Когда нейросети стали доступными рядовым пользователям, возросла актуальность вопросов цифровой этики. Внешность и голос — одни из основных «инструментов» заработка для публичных персон. Участие в съемках, как правило, оговаривается контрактом и оплачивается.

Несогласованное использование образа известного человека может спровоцировать серьезные проблемы. Например, будет сгенерировано видео, где политик делает провокационные высказывания или глава крупной корпорации объявляет о закрытии компании.

Разработчики предусматривают блокировку промтов с упоминаниями знаменитостей. Такие запросы могут считаться допустимыми, если представляют собой вариант стилизации.

Шедеврум не запрещает использовать знаменитостей при генерации. «Рианна в образе Красной Шапочки». Сходство с певицей заметно. Есть небольшие искажения на груди и глазах.

Как построить запрос для готового изображения?

ИИ может дополнять исходные изображения. Для этой задачи предназначена система Adobe Firefly, которая встраивается в Photoshop.

После загрузки референса нужно обозначить задачу для нейросети: добавить или убрать какой-то объект, заменить один образ другим, перерисовать картинку в определенном стиле и прочее.

Fusion Brain. ИИ кадрировал референс и дорисовал его в нижней части.
Генерация соответствует оригиналу.

Для кого использование ИИ может быть полезным?

Уже сейчас ИИ можно использовать в повседневных задачах. Достаточно подумать, как правильно составить промт для нейросети в конкретном случае.

Создание логотипов. Брендирование формирует узнаваемый образ предприятия или продукта, но может стоить дорого, если поручить его профессионалам. Благодаря нейросетевым алгоритмам небольшие компании смогут получить интересный
логотип и при этом сэкономить.
Логотип, созданный в LogoAI с пресетом «Ресторан».
Подготовка иллюстраций для статей и блогов. ИИ поможет отретушировать фотографии и сгенерировать новое изображение. Это дешевле, чем нанимать графического дизайнера, и быстрее, чем выполнять работу самостоятельно.
Создание карточек товаров. Нейросеть умеет достаточно аккуратно убирать задний план на снимках и заменять его другим фоном.

Remove.bg. ИИ убрал фон. Вместо него вручную была добавлена градиентная заливка с размытием по контуру наушников.
Генерация интерьеров. Автоматические алгоритмы подберут отделку и декор, а также расставят мебель для проекта квартиры, дома или офиса.

Homestyler. Загружено фото пустой комнаты, указан тип помещения (гостиная) и один из стилей интерьерного дизайна. Затем ИИ подобрал палитру, мебель и декор. На итоговой визуализации много артефактов, но они не мешают понять общую концепцию.

Подведем итоги: краткая инструкция к действию

Мы рассказали, как правильно писать промт для нейросети. Задача должна формулироваться краткими тезисами без неоднозначных формулировок. Текстовые описания дополняют визуальные референсы, настройки стилизации и модификаторы. Для разных задач могут подходить определенные сервисы, к примеру, для фотореалистичных работ или стикеров.

Часто задаваемые вопросы

Для чего нужна обратная связь?

С ее помощью обозначают удачные результаты и тем самым подкрепляют определенные модели. Действия, которые привели к более низкому качеству или неверной интерпретации запроса так же получают соответствующую отметку. В дальнейшем система постарается их избегать.

Что такое надстройки?

Это команды, которые меняют разные системные параметры, например задают соотношение сторон кадра или разрешение. В отличие от обычных запросов, которые можно формулировать в произвольной форме, надстройки должны точно соответствовать требованиям конкретного ИИ.

Что такое артефакты?

Это ошибки ИИ при создании контента. Частая проблема — «лишние» пальцы или искаженные формы конечностей.

Комментарии (0)

Прокомментируйте первым!

Смотреть ещё