- Что такое негативный промт?
- Зачем нужны негативные промты
- Виды
- Что такое токен и на что влияет его вес при генерации?
- Универсальные стоп-слова и стоп-фразы
- Бонус: универсальные негативные промты для Stable Diffusion
- При каких обстоятельствах полезно использовать негативные промты
- Подведем итоги
- Часто задаваемые вопросы
Разбираемся, как писать негативные промты для нейросети: 7 основных правил
Многие нейросети, которые предназначены для генерации или обработки изображений, в качестве исходных данных принимают текстовые описания. При этом в приложениях и онлайн-сервисах часто можно встретить такой параметр «Negative Prompt». Далее вы узнаете, для чего он нужен. Также мы расскажем, как писать негативные промты для нейросети.
Что такое негативный промт?
Для начала нужно понять, что такое промты для нейросети. Искусственный интеллект создавался как инструмент, который поможет человеку решать различные задачи. Поэтому ИИ должен узнать от пользователя, какую работу выполнить. Описание задачи подается в виде промтов. Обычно они представляют собой короткие текстовые запросы («лягушка в магической шляпе»).
«Родным» языком для ИИ является программный код, а не устная или письменная английская (русская) речь. Интерфейс онлайн-сервиса или приложения с нейронной сетью отображает удобные и понятные для человека элементы управления. Полученные через них данные преобразуются в команды для алгоритма.
Для более тонкой настройки системы могут предусматриваться дополнительные параметры. Часто в их число входят негативные промты (Negative Prompt) для нейросети, что это такое в общих чертах должно быть понятно из пояснений, которые мы дали выше.
Негативный (отрицательный, исключающий) запрос — это перечисление характеристик, которых не должно быть у конечного результата. Если в интерфейсе нет соответствующего раздела, нужную информацию можно дать в обычном задании. Например, «лягушка в волшебной, но не остроконечной шляпе» будет означать то же самое, что «лягушка в волшебной шляпе» с отрицательным запросом «остроконечная шляпа».
Легко и быстро отредактируйте результат генерации
Технология машинного обучения быстро развивается, но все еще несовершенна. Впрочем, артефакты генерации можно за несколько кликов исправить вручную. Для этого пригодится фоторедактор с инструментами на базе ИИ ФотоМАСТЕР.
Зачем нужны негативные промты
Негативный промт — это дополнительная гарантия того, что ИИ выдаст результат, нужный пользователю. При обучении нейросетей используется контент, который соответствует будущим задачам. Если алгоритм должен стилизовать изображения под полотна известных художников, в базу данных будут добавляться соответствующие картины.
По итогу такого обучения ИИ получает наборы закономерностей. Например, что у лягушек четыре лапы, два глаза, и они преимущественно зеленые. Поэтому по запросу, в котором упоминается лягушка, система создаст картинку с этим животным и с подходящим контекстом. С большой вероятностью у него будет четыре конечности, два глаза и зеленая кожа.
Без специальной подсказки алгоритм не поймет, что ему нужно отойти от наиболее распространенных образов. Ее можно дать через стандартное описание. Однако это не всегда удобно. Если на иллюстрации должно быть несколько объектов без определенной характеристики, ее каждый раз придется прописывать отдельно: «не зеленый волшебный посох», «не зеленый плащ», «не зеленая шляпа» и так далее. К тому же не всегда удается предсказать результат генерации. Помимо перечисленных атрибутов волшебника, ИИ может добавить магический шар или книгу. Поэтому проще дать описание «лягушка-маг», а в исключающем запросе указать «зеленый цвет».
DreamStudio. Запрос — «Mage Frog in Magician Hat» («лягушка-маг в шляпе волшебника»). Негативный промт — «Star, Green Color» («звезда, зеленый цвет»). Искуственный интеллект не всегда точно следует дополнительным описаниям или может интерпретировать их по-своему. Например, здесь алгоритм не стал раскрашивать плащ, посох и шляпу в зеленый, но использовал этот цвет для лап и головы лягушки.
Виды
При генерации можно брать готовые запросы или вводить все описания самостоятельно. Оба подхода имеют свои особенности.
Готовые
Пользователи часто делятся результатами удачной генерации и прикладывают к ним запросы. У вас есть возможность скопировать те же описания, чтобы получить похожую иллюстрацию.
Готовые промты делают работу алгоритма более предсказуемой. Это удобно, когда нужна картинка со строго определенным набором характеристик.
Некоторые сервисы с ИИ предлагают собственные соцсети. Базу изображений, созданных пользователями, можно использовать в качестве референсов. Достаточно найти подходящий рисунок и запустить повторную генерацию с теми же параметрами.
Craiyon. Запрос «gandalf dwarf in light blue and orange robes»
(«Гендальф-гном в светло-синей и оранжевой робе»).
Индивидуальные
Собственные описания можно ввести, когда не удалось найти подходящий референс или требуется уникальная иллюстрация. Вы получите интересный результат, но предсказать, что именно окажется на рисунке, будет сложнее.
Craiyon. Запрос «Frog Medium With Magic Ball» («Лягушка-медиум с магическим шаром»), негативный промт «Green» («зеленый»).
Что такое токен и на что влияет
его вес при генерации?
В некоторых системах есть настройка, которая указывает, насколько четко ИИ должен следовать пользовательскому описанию. Она дает разный эффект. При обработке специфических промтов («рыба едет на велосипеде», «космический корабль “Буран” ест торт») из-за строгого соблюдения запроса могут появляться артефакты. Меньшее значение параметра позволит нейросети обойти сложные фрагменты.
Stable Diffusion Online. Запрос «Frog Archer» («лягушка-лучник»), негативный промт «Crossbow» («арбалет»). Слева параметр «Guidance Scale» (отвечает за точность, с которой ИИ следует описанию от пользователя) установлен на 4 из 20. Лягушка не похожа на лучника, но на картинке минимум артефактов. Справа тот же параметр установлен на 20. Многочисленные артефакты заметны сразу, но в лапах у лягушки есть нечто, похожее на лук.
Также некоторые алгоритмы, например, Midjourney, позволяют распределять приоритеты (веса) для разных характеристик в запросе. Значение указывается в виде числа после двойного двоеточия. В описании «yellow::.3 frog::.7» («желтая» — 0,3, «лягушка» — 0,7) для ИИ больший приоритет имеет объект «лягушка», а не его цвет. После обработки алгоритм выдаст иллюстрацию с синим земноводным, если посчитает ее более удачной, чем рисунок с желтой лягушкой, на котором обнаружит артефакты.
Универсальные стоп-слова и стоп-фразы
Опытным путем пользователи определили ключевые фразы и слова, на которые алгоритмы обращают внимание с большей вероятностью. Так можно исключить частые артефакты.
Для людей
Искусственный интеллект часто искажает пропорции людей, деформирует конечности и ошибается с количеством пальцев. Стандартные негативные промты для рук и другие описания избавляют от этих проблем.
- bad anatomy — плохая анатомия;
- disfigured — изуродованный;
- deformed — деформированный;
- double heads — двойные головы;
- extra feet — дополнительные ноги;
- extra fingers — дополнительные пальцы;
- extra hands — дополнительные руки;
- long neck — длинная шея.
Playground. Запрос «Old Mage» («старый маг»). Справа — с перечисленными ранее негативными промтами, слева — без них. На иллюстрации без исключающих описаний деформированы пальцы. Голова отзеркалена и смотрится неестественно. На результате с дополнительными характеристиками нет явных искажений.
Для лица
Лучший негативный промт для лица уберет искаженную форму черепа, деформированные губы, неправильное кадрирование и другие артефакты.
- blurry — размытый;
- cloned face — клонированное лицо;
- mutated — мутировавший;
- out of frame — вне кадра (ИИ при генерации часто размещает людей так, что часть лица находится за границами изображения);
- ugly — уродливый.
Playground. Запрос «Face of Woman Witch» («Лицо женщины-ведьмы»). Справа — с перечисленными ранее негативными промтами, слева — без них. На результате без отрицательных описаний не вся голова попала в кадр. На лице есть странные искажения. Уточненный запрос позволил добиться результата без артефактов.
Для пейзажей
На пейзажах может быть недостаточная резкость, контрастность, экспозиция и детализация. Иногда ИИ подбирает странные ракурсы камеры.
- blurry — размытый;
- details are low — низкая детализация;
- distorted details — искаженные детали;
- eerie — жуткий;
- low contrast — низкий контраст;
- low quality — низкое качество;
- lowres — низкое разрешение;
- multiple angles — несколько ракурсов.
Playground. Запрос «Land of Frogs» («Земля лягушек»). Справа — с перечисленными ранее негативными промтами, слева — без них. На изображении без негативных промтов недостаточная резкость на заднем плане. В целом композиция перегружена хаотичным расположением объектов и яркими цветами.
Для животных
С животными у нейросетей возникают те же проблемы, что и с людьми. Поэтому можно использовать универсальный негативный промт для человека. Он избавит от лишних пальцев, искаженных пропорций и других мутаций.
- cropped — обрезанный (убирает неверное кадрирование);
- extra fingers — дополнительные пальцы;
- extra legs — дополнительные ноги;
- malformed limbs — деформированные конечности;
- mutation — мутация;
- ugly — уродливый.
Playground. Запрос «Frog Rides Horse» («Лягушка едет на лошади»). Справа — с перечисленными ранее негативными промтами, слева — без них. Отрицательные описания повысили детализацию, но точной интерпретации запроса добиться не удалось.
Для иллюстраций и векторной графики
В этом случае запрос зависит от содержания рисунка. Для изображений с людьми, животными и персонажами нужно исключать деформацию анатомии. Специфическими настройками могут стать описания, которые убирают определенные варианты стилизации.
- bad art — плохое искусство;
- b&w — черно-белый;
- blurry — размытый;
- disgusted — отвратительный;
- watermark — водяной знак (иногда нейросеть вставляет случайные надписи и логотипы).
DreamStudio. Запрос «Frog Near a Castle» («Лягушка рядом с замком»). Справа — с перечисленными ранее негативными промтами, слева — результат без них. Без исключающих промтов ИИ деформировал лапы лягушки, сделал неправильное кадрирование и в целом сформировал неудачную композицию.
Прочее
Некоторое ПО на базе нейросетей позволяет редактировать полученные результаты при помощи дополнительных запросов. В этом случае отрицательные промты помогут избавиться от ненужных деталей или уберут артефакты.
DreamStudio. Запрос «Frog with Spear» («Лягушка с копьем»). Справа — после повторной обработки с негативным промтом «extra fingers» («дополнительные пальцы»). Дополнительная генерация с исключающим описанием убрала лишние пальцы.
Бонус:
список негативных промтов для Stable Diffusion
Особенности Stable Diffusion мы подробно разбирали в отдельной статье. В этой нейронной сети можно задать отрицательные описания. Они есть в десктопных и онлайн-версиях. Алгоритм позволяет менять вес характеристик при помощи скобок. Каждая пара круглых («(» и «)») повышает значение на 10%, а квадратных («[» и «]») — понижает на те же 10%. Например, в описании «(morbid), [[red eyes]]» вес характеристики «morbid» («болезненный») увеличен на 10%, а «red eyes» («красные глаза») — уменьшен на 20%.
В универсальный негативный промт для Stable Diffusion можно включить:
- blurry — размытый;
- bad anatomy — плохая анатомия;
- deformed — деформированный;
- extra arms — дополнительные руки;
- extra heads — дополнительные головы;
- extra legs — дополнительные ноги;
- long neck — длинная шея;
- mutation — мутация;
- too many fingers — слишком много пальцев;
- ugly — уродливый.
Stable Diffusion Online. Генерация по запросу «Frog Queen» («лягушка-королева») без негативных промтов. Заметны слишком яркие цвета.
Stable Diffusion Online. Генерация по запросу «Frog Queen» («лягушка-королева») с негативными промтами. Палитра стала приятнее, а анатомия — интереснее, но ИИ так и не смог определиться с правильным количеством пальцев.
При каких обстоятельствах полезно
использовать негативные промты
На контент, который распространяется публично, например, в книгах, приложениях или на сайтах, действуют возрастные ограничения. Эротические материалы и натуралистичные сцены насилия повышают рейтинг. В результате соответствующие изображения, видео, тексты и аудиозаписи запрещено демонстрировать детям и подросткам. Такой контент может быть неуместным и для взрослых.
Вручную цензурировать готовые материалы слишком утомительно. Запускать новые генерации в попытке получить более пристойные результаты — затратно (многие сервисы не бесплатны). Однако вместо этого можно задавать ограничения через негативные описания.
Подведем итоги
Вы познакомились с негативными промтами и теперь можете их использовать в работе или творчестве. Эта опция поможет убрать из генерации ненужные характеристики или объекты. Если настройки нет в вашем приложении или веб-сервисе, дополнительное условие можно прописать в обычном запросе. Также существуют каталоги и сайты с готовыми описаниями для разных ситуаций: генерации людей, отдельных частей тела, животных и прочего.