Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1433503 если писать заглавными, то чаще лучше пишет. Еще желательно чтобы не так много текста в целом было, тогда норм пишет. На квен edit с lightning вообще была жопа с текстом, может base модель вообще будет идеальна у Z image в этом плане.
>>1433551 Два чаю, написано, что дистилят можно в 16гб врама впихнуть, но там суммарный вес трех сейфтензоров 25гб, остально в оперативку загрузится или как?
>>1433535 в общем не очень выходит, тебе лучше контролнет использовать. но логика в том чтобы насыпать побольше шума на картинку, чтобы от нее мало что осталось (а для этого нужно значение денойза повыше) и потом сгенерить на ее основе новую. должно быть достаточно любого дефолтного img2img воркфлоу.
Влезает fp16 даже в 8 ГБ на RTX 3070 - 2048x2048 картинка за 100 сек. Но если хочется скорость замедлить, то можно наверное и поставить gguf.
>>1433583 >>1433585 нет, по тому что они написали на хаггинфейсе турбо это просто дистиль по типу лайтнинга - для генерации за меньшее количество шагов. То есть жрать будет стольо же, но генерить медленнее.
>>1433587 >нет, по тому что они написали на хаггинфейсе турбо это просто дистиль по типу лайтнинга - для генерации за меньшее количество шагов. То есть жрать будет стольо же, но генерить медленнее. Спасибо за разъяснение, анон! Правда в таком случае я не совсем понимаю, зачем откладывать выход базовой модели?
>>1433587 Классная ссылка на комфи воркфлоу, но как мне запихать это даже в 12гб? Там энкодер и модель вместе намного больше весят. Или я что-то не понимаю?
>>1433610 врам почит полностью отводится под генерацию, рам под модели, те куски моделей которые не влезают в рам скидываются на диск и потом подгружаются оттуда (но подгрузка с диска это долго) поэтому все упирается именно в размер оперативы, расчитывай чтобы в нее все влезало
>>1433610 как бэ ComfyUI автоматически использует оперативную память для закрытия той части модели, которая не вмещается в VRAM.
>>1433628 Да, сделай так чтобы ноды на генерацию и апскейла были в одном ворклфоу и чтобы результат первичной генерации в виде выхода шел входом в первую ноду для апскейла.
>>1433610 >Или я что-то не понимаю? Ключ запуска --normalvram - и comfy сам разберется с памятью. Главное чтобы обычной оперативки хватило под свап блоков, а то со свапом на диск будет реально грустно. А encoder и модель вообще грузятся и работают последовательно, по отдельности, а не вместе.
>>1433610 >Или я что-то не понимаю? Во первых они работают последовательно. Сначала текст в латент отрабатывает на гпу, потом в врам грузится модель и этот латент кодируется в картинку. Просто понаблюдай за этим в диспетчере задач. А во вторых работает расшаривание врам в рам.
Господа аноны, я дико извиняюсь, а где собственно pussy у моей 1girl standing?
1 >heavy pixelated full body art of a cute girl with massive fluffy fennec ears and a big fluffy tail blonde messy long hair blue eyes she is nude and barefeet and holds her hands behind her back, she has heavy blush on her face and she looks shy. A beautiful city at sunset on the background
2 >heavy pixelated full body art of a cute girl with massive fluffy fennec ears and a big fluffy tail blonde messy long hair blue eyes. she is nude and showing her pussy to the viewer, also she is standing barefeet and holds her hands behind her back, she has heavy blush on her face and she looks shy. A beautiful city at sunset on the background
2048х2048, euler simple, 9 steps, 1cfg, енкодер и моделька в полных весах.
>>1433634 > автоматически У меня это не работает. Ни разу не видел чтобы работало, сижу с двумя картами по 24 гига, может из-за этого. Всегда просто падает в ООМ когда кончается память, даже с lowvram. Говорят блоксвап ещё есть автоматический, тоже ни разу не видел чтоб работал, только ручной.
>>1433664 >>1433651 >>1433634 >>1433624 Победа, спасибо мужики. Но пердит он заметно дольше того, что на той же Illustrious было, как я понимаю там и энкодера нет и сама модель просто меньше
>>1433691 скорее всего ты когда-то вырубил настройку sysmem fallback у себя в панели NVIDIA. Раньше люди предпочитали out of memory вместо замедления в генерации, но сейчас особенно с новыми моделями лучше медленно генерить чем никак.
>>1433697 Модель только вышла чел, разговоры были про то, что она может нативно в 2K хотя с размером она с SDXL.
>>1433656 Очень, блин, показательно сравнивать возможности модели с разным энкодером на одном промпте. Давайте уточним - мы сравниваем чисто понимание промпта, или возможности модели достичь желаемого результата? Если все же второе - вот тебе твой кролик от zimage:
Craft the detailed oil painting with the scene where a rabbit. This rabbit holding a handsaw in left forward paw and sawing with it his own right forward paw. Saw is covered with blood dots, and blood following from the wounded paw.
Она не "игнорит необычное". Она требует детального описания для него, т.к. китаец. А у них - "мы вам построим что угодно, вы только объясните - как?". :) А русский она понимает хуже, чем английский, увы. На русском объяснить не получилось.
>>1433712 >Модель только вышла Значит голые пиксельные 1girl'ы не селебы откладываются до лучших времён. Но фотореализм достойно генерит, тут соглашусь однако тоже со шрамом вместо pussy. Хотя, честно, ожидал почему-то большего, даже учитывая что это дистилл базовой модели. Чтож, буду ждать базовой модели и нсфв файнтюнов.
>>1433722 Специально стиль использовал такой, чтобы натурального реализма было поменьше - не люблю подобное гуро. detailed oil painting - дает крупные мазки кистью с маслом, аж выступы наложенной краски по холсту видно.
>>1433601 >зачем откладывать выход базовой модели? мне кажется они выкатили турбо версию тупо чтобы сбить Flux 2 со своих лавров и не дать времени ему набрать хайп (хотя его и так мало кто запустит). Может они еще дотренируют чутка свою базовую модель. Читал что они планируют иметь несколько базовых моделей - сейчас тренируется та, которая с закосом на реалистик фото. Потом будет чисто на аниме а потом хер знает.
Гы. Хейтерам на заметку - нашел, чего zimage реально не знает/не умеет. Концепт "кентавр" ей никак не знаком. Добиться не получается никак. Ни в фото, ни в рисунке.
>>1434043 Так, серединка на половинку: анатомию знает, сиськи рисовать может, а вот что между ног, тем более подробно - нет. Впринципе было бы странно, выпусти разработчики NSFW модель сразу сами. ИМХО, конечно.
>>1434054 Лучше уж одн из кумер-тюнов SDXL поставь да вздрочни. 1girl они более менее стабильно без изъёбств генерят же. А зимаж для чего-то более осмысленного. Ну или Lora подождать, вроде там что-то для тренировки уже подкрутили.
>>1434056 Ну это тест пока. В принципе осмысленную сцену для дрочки придумать тоже можно, лол. Щас чисто тест возможностей, без апскейлов и прочих изъёбств. Потенциал у неё просто бомбический.
>>1434094 С одинаковостью генераций решение очень простое. Берём Qwen Instruct 4B и переписываем промпт им, секунда времени. Я так ещё на Qwen Image делал, чтоб рандомило. Работает как сиды на XL.
>>1434094 Охуенная техника, увелчивающая время гена раза в 3 из-за всасывания токенизатора каждый раз при одном и том же промпте. Плацебо солюшен уровня "мне показалось лучше будет сделать кроспроцесс у фоточки".
>>1434094 Почитай комменты по твоей же ссылке и сделай как там советуют: В промежутке на пути подачи LATENT, вставь один промежуточный узел пикрил. Всё.
>>1434102 Анон, можешь чуть подробнее? А лучше скинь маленький воркфлоу с ллм и ссылку на модель, что ты упомянул? Я так-то не совсем нуб в ллм, но запускал их отдельно, в кобольде. Можно в принципе и отдельно так и запускать? А что писать?
Анонсы, кто пользуется ComfyUI, причем пользуется на уровне не скачал чужой workflow, тут выбора почти нет - будешь скачивать кастомные ноды, что предложено в нем. А те кто сам своим вф разрабатывает, вы скачивате монстро-паки ессентил, ргтрее и подобные квалити оф лайф? Спрашиваю потому, что у меня неизменно в итоге приводит в опуханию Комфи и тормозам. Приходится заново ставить и опять выборочно ставить ноды. И снова.
>>1434165 Стараюсь ничего не «разрабатывать», а брать, по возможности, всё готовое. Разбираться и модифицировать. Собирать франкенштейнов, складывая workflow из удачных кусков других workflow.
Но для этого нужно немножко вникать в то, как это использовать. Хотя бы поверхностно. Вот тебе простой пример: Задача — добавить «вариативности» генерациям z-image.
>>1434094 По ссылке предлагают два раза протягивать от токенизатора и использовать узел advanced KSampler для разбиения на два этапа (как в Wan). >>1434105 правильно указал на недостатки.
>>1434102 Предлагает отдельно переписывать prompt.
Я почитал то, что по ссылке (сейчас повёлся, играю в z-image, в целом пока не особо доволен). В комментах было написано, что вместо этого нужно просто немного «подшумить» LATENT. Гуглим узел для «подшумления» (Inject Latent Noise), вставляем. В целом задача решена. Вот, примерно так и с остальным ковыряюсь.
>вы скачивате монстро-паки ессентил, ргтрее и подобные квалити оф лайф?
Скачал rghtree, essentials, RES4LYF, для Wan немножко. Согласен с тобой, чем меньше мусора, тем лучше. Бездумно лучше ничего не ставить. Можно накачать конфликтующего мусора, ещё и устаревших legacy костылей и ещё интерфейс засрать с помощью васянских UI плагинов.
Вместо этого, с помощью ComfyUI-Manager можно посмотреть то, что требуется для workflow и выборочно поставить то, что реально нужно.
Ну и не вредно делать снэпшоты рабочей конфигурации, если склонен к экспериментам или боишься, что после очередного апдейта сломается вообще всё разом.
>Спрашиваю потому, что у меня неизменно в итоге приводит в опуханию Комфи и тормозам.
В ComfyUI-Manager есть функция отображения конфликтующих узлов и функция отключения (disable). Всё лишнее можно временно отключать, на всякий случай.
>>1434165 Очень ограничено. По сути, у меня только эти два и стоят из больших пакетов подобного общего назначения. Я чужие workflow практически не использую без переработки. И если там куча разных паков используется - такой обычно сразу отправляется в /dev/null Потому, что это частый признак того, что автор не понимал что делает, и продвигался методом тыка = получилась перегруженная ненужным фигня. Толковые авторы, обычно, ограничиваются одним-двумя любимыми паками и из остального добавляют только то, без чего нельзя обойтись (уникальные функции). Так то большие паки друг-друга сильно повторяют, потому и смысла держать их большую кучу нет, если понимаешь что к чему.
Какая же гадость в сравнении c моей любимой sd3.5. Цвета нет, композиция проебана. Мешанина вместо цельной картинки. Для редактуры в будущем сойдет, но не больше.
>>1434220 У тебя ещё хоть какие-то цвета есть. После Qwen-Image, с promptами тут просто беда. Пытался другой text encoder подключить, qwen_2.5_vl_7b_fp8_scaled.safetensors, не заработал. Promptы надо писать совсем по-другому. И при этом половина promptа просто выбрасывается. Как ты освещение сделал на последнем пике справа на z-image, это вообще любопытно. Кроме того, на этом z-image полезли опять деформированные конечности, лишние пальцы, многоножие и подобные косяки.
Ещё, если кому надо, euler/beta работает неплохо. А мой привычный res_2s/bong_tangent ещё больше всирают картинку (кожу).
Сделай в ней что-то удобоваримое, кроме сел медведь в машину@сгорел это пытка.
>>1434248 Да многое не так. А ещё пока ты SDшкой, то, что слепил в z-image, полировал, эта самая SDшка с Tile ControlNet тебе цвета ещё больше вшатала и оттенок добавила.
>>1434043 чел, абсолютно во всех нефайнтюненых моделях есть голые сиськи, но вагины и члены замазаны. и здесь то же самое. тебе сгенерило заблюренную темную полоску между ног и тебе кажется что там реально пизда голая.
>>1434268 Вот нет ни одной нахуй причины это делать, кроме как шиза трясущихся за плодячку старых пидоров у которых уже не стоит, значит можно запрещать секс в интернете
>>1434268 если бы не пиздел тут, а генерил, то знал бы, что вульва там есть, нет только вагины потрохов пиздёнки , закрытая нормально выглядит как и должна
>>1434271 А вдруг подросток 16летний зайдет в интернет, сгенерит голую женщину и увидит незацензуренную пизду? Вы знаете что может случиться?! Вы себе отдаете отчет???
эйприл на фотке кста. Ну прикольно, но некоторые промты вообще не понимает, просишь свифт в одежде чун ли, он либо то, либо то генерит, пробовал и косплей писать и т.д., это фиксится описанием костюма просто, но банана все промты понимает, я жопу с пальцем сравнил, да
>>1434165 именно монстрпаков сильно много не нужно rgtree, was, res4lyf, kjnodes, impact pack, reactor и т.д. - самая дефолтная база для энтузиастов. помимо них имею еще ряд мелких.
у меня было такое что комфи опух и стал лагать, но так как я переустановил обратно все вышеописанные паки а лагать перестало, то подозреваю что дело было в каких-то более старых паках времен sdxl, я уже не помню каких так как не использовал
Поставил комфи настроил все запустилось, но генерация занимает 40 секунд 1024x1024 на 3060. Никогда до этого комфи не пробовал, может там какие то оптимизаторы или параметры нужны? Или это нормально?
>>1434323 попробуй поставить gguf квен и/или fp8 основной модели, чтобы у тебя короче суммарно влезало всё в твои 16 врама, кфг ещё сильно влияет на скорость, всё что выше 1
Господа генераты, не подскажете начинающему Генерату, как можно убрать фон и сделать его прозрачным?
Я попробовал генерировать анимации - получил видео. Разбить видео на набор кадров проблем нет. А вот как просто и массово сделать прозрачный фон, чтобы не возиться вручную с каждым отдельным кадром? Ведь наверняка есть простой и удобный способ!
A comic book page, in a classic 5-panel layout: 1 wide horizontal panel on top, 4 equal square panels aligned in a row at the bottom. Clean white gutters. Thick, clean black ink outlines. Flat, readable comic coloring with a balanced minimal palette: sky blue, park grass green, neutral warm skin tones, everyday clothing colors, and one bright red accent for comedic focus. Characters are highly expressive, with simple backgrounds. Text is hand-lettered in a classic comic font. The humor is coherent, grounded, and punchline-driven, with panel imagery escalating logically.
Panel 1 (TOP – wide) Scene: A man stands in a sunny park, arms out like a documentary host. A tiny furious Chihuahua is held up in his hand like a wildlife specimen. Text (man speech bubble, top-left quadrant, pointed at man): “Behold! The rare Chihuahua Angrius…” Text (small label below dog like a name tag, centered under dog): “Danger: 4 lbs”
Panel 2 (BOTTOM 1 – square, far left) Scene: The dog hits the ground with a tiny dust poof, paws spread like it just superhero-landed, face pure fury. Text (large dog speech bubble, centered, pointed at dog): “FEAR ME, GRASS!”
Panel 3 (BOTTOM 2 – square, middle left) Scene: The man crouches calmly pointing at the perfectly harmless lawn. The dog continues screaming at it. Text (man bubble, bottom center, pointed at man): “Jeff. It’s literally just… grass.”
Panel 4 (BOTTOM 3 – square, middle right) Scene: Dramatic zoom-in on Jeff the Chihuahua, face filling 40% of the panel, eyes shaking with determination, little tail visible behind him like a stiff antenna. Text (dog bubble, top-center of panel, jagged border, pointed at dog): “It knows what it did.”
Panel 5 (BOTTOM 4 – square, far right) Scene: Jeff now sits in a tiny red donut dog-bed on the grass, blanket tucked, still staring at the lawn suspiciously. The man stands above him sipping coffee, unsurprised. Text (man bubble, top-right of panel, pointed at man): “He declared war on the lawn again.” Text (dog bubble, bottom-center, small, pointed at Jeff): “And I’ll do it tomorrow.”
GLOBAL STYLE NOTES (short, clean, matching content)
Visual focus on characters’ expressions and poses.
Flat colors, minimal soft shadow only under characters.
No random props or unrelated text.
Every line visually corresponds exactly to what is shown.
>>1434477 >как можно убрать фон и сделать его прозрачным? Моделями - никак. Они про "прозрачность пикселя" не знают, т.к. не с пикселями работают. Оная прозрачность - это свойство формата хранения готовой картинки, которая создается сильно позже, чем модель работает.
>>1434477 >Ведь наверняка есть простой и удобный способ! Post-processing и batch обработка готовых картинок - тебе туда. В принципе - в comfy есть расширения для этого, но подробностей не скажу, сам не делал, надобности не было. Возможный принцип - "замена цвета на прозрачность".
>>1434479 Ок. Скачаю. >>1434490 Слышал давным-давно про модуль на а1111 или Форже на видео от Христа, что вроде как пачку картинок помещал и что-то делал с ними там. Не помню точно что, но вроде редактировал как-то скопом.
>>1434583 >разница небольшая Ещё, так как модель может в текст, сделай несколько тестов с различным текстом, в разных местах картинки и размеров. По тексту сразу видно будет косяки. Я так семплеры тестировал. Подобрал вроде "самый лучший", а он в текст вообще не смог. Прикол.
>>1434617 >1024x1024 за секунду генерится В Krita с плагином в виде ComfyUI есть режим рисования life, когда рисуешь набросок и Комфи в реалтайме генерит отдельно картинку по твоим линиям. Крутая штука, но из-за скорости приходилось ставить 512х512 на sd1.5. надеюсь скоро запилят z turbo image в плагин.
>>1434692 Я не особо старался Anime milf European woman with short blonde hair mistress wearing beautiful silk red dress smiling holding a sign that saying "My dad cooks some seriously awesome dishes. Here's a rough recipe, because there are tons of variations. He takes some soup, doesn't heat it up—heating things up isn't my dad's thing. He takes the soup, dumps it into a pan, and starts frying it. He adds a huge amount of onions, garlic, black and red pepper, and FLOUR! for viscosity, and tomato paste on top. All this is fried until it smokes. Then it is removed from the heat and cooled on the balcony. Then my dad brings it in and, generously pouring mayonnaise on top, starts eating. He eats it straight from the pan, scraping it with a spoon. He eats and mutters under his breath, “Oh, fuck.” Sweat beads on his forehead. He kindly offers me some sometimes, but I refuse. Needless to say, the farts that follow are wild. The stench is so bad that the wallpaper peels off the walls"
>>1434705 а почему вы пишете промты на инглише, если модель русский язык понимает в разы лучше? ваши промты приходится гуглопереводчиком переводить чтобы использовать...
>>1434711 Соевый куколд либерашка потому что. Ну и потому что в модели прямо написано, что она текст пишет на английском и китайском. Русский тоже может, но это как-то не совсем честно тестить на других языках. Ну и привычка, локальные ллмки практически все значительно хуже на русском работают (большие модели уже особо не отличаются на разных языках, там прямо в размышлениях видно, как тот же гемини переключается на английский пока думоет). По поводу перевода, я бы рекомендовал deepl вместо гугл переводчика, он намного точнее переводит европейские языки По идее ты можешь в том же комфи вывести текст после декодера, у тебя пиздюк qwen 4b вполне может потеть дополнительно и переводит сверху, но это из головы я взял, хз как там на самом деле
>>1434662 >Длинный текст везде как говно Пишу инфу для всего треда. Хотите мелкие детали правильно - используйте большую разрядность бит. Вот генериции Z image (не совсем стандартные настройки, но отражают суть) 1пик bf16 2пик fp8 3пик fp8 fast
>>1434806 Совпадает со сравнением на реддите bf16 и fp8, там как раз заметен проёб мелких деталей, было бы у меня 16 гб врама, я бы первую конечно поставил, а чё такое fp8 fast?
я помню примерно пол года год назад был какой то интеррогатор на обнимиморде который смотрел теги с картинки и выдавал результаты в районе 95%-97% аккуратности и это пока все еще в альфа версии, мог хоть данбору тегами хоть прозой хоть еще как и даже хитмапу картинки составлял но я забыл имя, напомните
>>1434816 Скажем, на 3060 (12 vram) - fp8 медленее чем fp16! Процентов на 5, но сам факт. Для zimage имеет смысл fp16 пробовать всегда, даже если она целиком в карту не лезет.
>>1434854 я чето думал что вд таггер потому что нашел его в закладках и он выдает идеально после сравнения я даже скажу что вд лучше и полнее джой даже персонажа не узнал и назвал другим именем в то время как вд выдал 99.9% уверенность и сделал это аккуратно
>а почему вы пишете промты на инглише, если модель русский язык понимает в разы лучше? Напишу для всего треда и конкретно для самых умных >>1434711 Вот к этой картинке промпт на китайском https://civitai.com/images/111972250 В промпте челик поднимает гёрл за ОДНУ ногу и только на китайском это генерится правильно. На остальных языках он тащит ее за обе ноги.
>>1434866 лучше когда меньше нагаторооты В общем хер знает с какого хуя проблемы у Z-ки с инглишом. Когда пишешь raising her skirt to reveal sexy panties не поднимает платье полностью, а если пишешь raising her skirt revealing sexy panties то поднимает.
>>1434978 Там любая версия 4B подойдёт, я тестил. Всякие Instruct, Thinking, Embedding - по моему артефачат, особенно последний. А вот разные версии обычного 4B - вроде бы без проблем. Так что по идее должно завестись. Вот только не факт, что цензура и в базовой версии в таком режиме работы присутствует.
>>1434939 >В общем хер знает с какого хуя проблемы у Z-ки с инглишом. Это у тебя, а не у нее проблемы с английским. "raising her skirt to reveal" в этой фразе, при таком ее построении, оно именно и значит, что действие еще выполняется (поднятие сейчас в процессе) для того, чтобы "показать в финале". Но сам финал еще не наступил, он в будущем относительно момента. Потому юбка "в процессе". А "raising her skirt revealing" - прошедшее время для всего, "она поднимала чтобы показать" - и действие уже как бы закончилось, и логично отображать его финал - полностью поднятую юбку.
Времена в английском - это особая уличная магия, мало что их не три как в русском, так еще и небольшое изменение меняет весь смысл. :)
>>1435039 Как поменять прмомпт чтобы было не как на пике, а понятно как хотим: On a path in the woods a girl of 25 years old dressed in a skirt and black T-shirt shows red panties on herself
>>1435064 >Как поменять прмомпт чтобы было не как на пике, а понятно как хотим Не сочти за троллинг, но скажи прямо - что именно ты от нее хочешь? Т.к. пик идеально соответствует написанному тексту - сказано было: показать трусы на себе, будучи одетой в то-то и то-то - она и показывает (примеряет на себя, как в магазине). А телепатией, я увы, не владею (как и энкодер). Но все же, если тебе хотелось чтобы трусы на ней были, и она юбку задрала чтобы их показать, то начинать примерно с такого:
On a path in the woods a 25 years old girl dressed in a black T-shirt and black skirt with a red panties under it shows her panties by raising the skirt.
>>1435088 Лично я - не против. Говори как удобно. Но на английском получается точнее, более мелкие/вторичные детали изображения контролируются лучше-быстрее-удобнее. Вроде нюансов того кролика с пилой выше по треду. А лично мне - без разницы на каком языке писать, вот и пишу сразу на английском. Хватает русского - так на здоровье.
>>1435106 Но там не совсем получилось же, с кроликом. Ну и нормальные модельки типа нана бананы или квена без ебли с промтами все хорошо понимают. А тут конечно не так.
>>1435066 >>1435068 Странно в менеджере гуфов установленных не было хотя по факту ноды были установлены, кароч обновил до 1.1.8. Теперь такое пишет! Ставил Q и UD-I, всё одно.
>>1435081 попробуй обновить через менеджер в comfyui, если уже пробовал обновлять через git pull в кастом ноде. Напиши в поиске gguf в менеджере и обнови, что найдешь.
>>1435112 Так ты сравнил - корпу и модель с энкодером 7b и модель где энкодер всего лишь 4b. Если ты никогда текстовые модели не пускал - 7b - это "грань разумности". Ниже нее текстовая модель, по сути, нормально может лишь выполнять механические задачи - вроде дословного перевода, или чего-то подобного. 4b - это достаточно, чтобы механически разобрать текст следуя синтаксису и правилам языка, но совершенно недостаточно, чтобы что-то угадывать по косвенным признакам. Так что здесь писать надо правильно и подробно, со всеми нюансами, которые желаешь увидеть. Что напишешь - то и получишь.
>>1435135 >щас анон будет джва часа писать хитровыебанный промт Не, дальше мне уже не интересно. Я вообще не брался доказывать, что zimage лучше понимает запросы или превосходит что-то просто потому, что zimage. Я просто показывал, как с ней обращаться, чтобы сравнимый результат получить. Трех раз хватит для примеров, кому это надо. А модели сравнивать "какая больше ебет" - это мне не интересно. Я просто буду использовать то, что больше под ситуацию подходит. :)
пацаны, qwen image 8fp жрет около 70 гигов рам, поставил файл подкачки. вроде робит и даже не сказать что долго считает. но пиздец бесит что пока считает комп тормозит начинает что не свернутся даже двач любимый не полистать. мб как то можно пофиксить на уровне винды, разбирался кто?
>>1435142 Ты ее через git clone ставил, или просто архив с гитхаба скачал? Если второе - нихрена ты ее через менеджер не обновишь, т.к. механизм обновления через git работает рассчитывая что это локальная копия репы, а не просто файлы в каталоге.
>>1435179 Тут вообще некоторые делулу тотальные, один на русском пишет так, будто ему приказ дал из могилы лично Пушкин и никак иначе, другой модели сравнивает отличающиеся по размеру в разы, третий ныл что модель хуйня нельзя позы точно делать и может то и это, модель, которые двое суток и к которой руки не надрочены во всех смыслах, лор нет нормальных
Анон, посоветуй нубу нормальный гайд по комфи. Может в треде кто-то делал уже? Желательно для самых даунов чтоб точно ничего не упустить, с максимальным разжевыванием. После обновления пк решил перекатиться на локалки, до этого юзал онлайн-нейронки по типу пиксаи, причем для работы, выжимал из этого анимешного кала все что мог
>>1435147 >>1435175 Да, дело было в комфи, обновил, заработало, спасибо! Я не знаю как надо гитхаб версию правильно обновлять, попробовал через менеджер абдейт комфи но в логах пишет фейл и всё тут. Тупо удалил папку, и из корневой вызвал клон, чето там поставилось, теперь работает.
>>1435251 Совсем нубу все также надо сразу начинать разбираться с обычным комфи. Просто гуглить возникающие вопросы. А то так и будет на матриксе сидеть. Не познает всю радость пердолинга зависимостей и ёбки с ебучим питоном.
>>1435272 А нахуя это надо? Если ты не линуксоид и у тебя от этого шишка не привстаёт сильнее любой 1girl. Матрикс сам обновит всё что нужно, оттуда же можно расширения ставить и не будет ёбки как у чела выше
>>1434261 >Что происходит на пикче? Это очевидная ничтожная и провальная попытка повторить дегенеративные DALL-E генерации индусов, летающих на струях поноса. Даже сиситивифишайдашкам на месте, который в далитредах использовали для обхода цензуры, орнул с такого каргокультизма.
Я чё зашёл. Оказалось старые апскейлеры, что все юзают всегда - нихуя не годятся для зетки. Она генерит сразу хорошую картинку, но апскейлеры сглаживают детализацию и не работают как хайрезфикс именно с зеткой. Может кто уже подобрал что-то годное, чтоб апскейл улучшал и делал картинку чётче? Иди забить и генерить сразу в высоком разрешении?
Раскачегарил свою 7900gre 16gb до 4it/s в SDXL, задавайте ответы лол. Попробовал wan2.2, конечно пиздец тухло, 300 секунд на шаг. По итогу 15 минут генерил и не дождался.
Не сказал бы. Скорее, довольно посредственную, при этом слабо воспринимает prompt, по сравнению с другими моделями.
В конце-концов, можно сказать, что Z-Image выдаёт терпимый результат для своего размера. При этом не на настройках workflow, предлагаемых по умолчанию. (Пикрил 1)
>Может кто уже подобрал что-то годное, чтоб апскейл улучшал и делал картинку чётче?
Как и для всего остального теперь, использую SeedVR2. (Пикрил 2).
>>1435592 >SeedVR2 Попробовал. Сильный перешарп, если и сурса апскейлить. Вот если сурс уменьшить в 2 раза и потом через сидвр апскейлить до размера сурса, то чуть лучше. Но всё это слишком рандомно. Сидвр не фиксит косяки, т.к. в нём нет понимания промпта и он делает апскейл тупо очень.
>>1435598 Тебе «шашечки» или «ехать». Тебе апскейлер или рефайнер? Ты определись.
>Сильный перешарп, если и сурса апскейлить. Смотри настройки.
>Сидвр не фиксит косяки >делает апскейл тупо очень.
Апскейлер делает апскейл. Вот это неожиданность. SEEDVR2 не рефайнер, а апскейлер по своему основному сценарию использования. Некоторые малозаметные детали текстур он может привнести (в зависимости от значения denoise). Каждый инструмент под свою задачу.
>>1435611 Апскейлер всегда нужен только для одной цели - качественный хайрезфикс. Кому нужно вообще это разрешение 2к и выше для кого, смысл? Цель была у всех одна - нормальная картинка без косяков типа кривых глаз и проводов и т.п. В Z-image turbo эти самые дефолтные настройки идеальны и не нужно менять ни кфг, который 1, ни шаги увеличивать, которые 9. Иногда как плацебо - шифт покрутить, но только чтоб отличалась композиция. У него и так всё с качеством и детализацией хорошо. Я к тому писал выше, что в редких случаях нужен фикс, сам апскейл нахер не нужен как таковой - это бред. Хз что ты там про НЕ_СТАНДАРТНЫЕ настройки пишешь. Да можно сде с ддим и будет как на 2м пикреле, но по времении это в 10 раз дольше, чем дефолт 1й пикрел. Смысла нет.
Что-то начало получаться с «FLUX.2». (Жалко было выбрасывать скачанное, после первого неудовлетворительного опыта использования). После изучения черрипикнутных примеров из гайда для промптинга «FLUX.2» с целью выявления их особенностей, пришёл к следующим выводам:
1) Генерировать в выходном разрешении не менее 1440x1440 пикселей; 2) Установить guidance в 3.5; 3) Перейти на JSON структуру promptов (с использованием соответствующих custom nodes типа «ComfyUI-FLUX2-JSON» для корректного построения JSON-размеченного prompt).
Тогда получается подобие того самого заявленного следования promptу и его деталям, и результаты, отдалённо напоминающие черрипикнутые примеры «FLUX.2».
>>1435153 >Я просто показывал, как с ней обращаться, чтобы сравнимый результат получить. Трех раз хватит для примеров, кому это надо От меня спасибо, Анон. Знай, что здесь есть люди кто благодарен за помощь.
>>1434275 Как же ору со всей это тряски реддит/4ч где не просто восхваляют z image, а хейтят флакс при этом. Буквально нищета мозга, модель хуйня лишь потому, что я не могу её запустить, а вот з имаге могу, значит оно ебет флакс
Не в службу, а в дружбу. Нужен сын маминой подруги с большой видеокартой. Можете апскейльнуть до 2к, и чтоб она выглядела более естественно? Ещё чуть бубисы побольше. Ничего страшного если лицо чуть пофиксится. Мне не дрочить Нужен качественный исходник для дальнейшей работы.
>>1435764 Чтобы апскейлнуть нормально нужен исходник т.к сначала идет генерация самой картинки и потом прогон через еще одну генерацию для апскейла А то что ты ищешь это нейрохрючево апскейл до 1ккк которого навалом онлайн
>>1435784 Не знаю что у тебя там за кал, но я уже изображений 30 сравнил на китайском через переводчик и на ру/инглиш. Почти всегда китайский через переводчик побеждает.
>>1435165 О, жиза, но не прям зависает и не всегда, а немного лагает во время переключения между моделями, если находиться в окне комфи. У тебя подкачка на системном ссд? У меня на втором, там же где модели. Может, если ставить на тот, где нет системы и нет моделей, то не будет лагать. Ну или попробовать пожрать гуффов. Я пару раз затестил, сходу не увидел разницы в производительности, обратно поставил фп8. 16V+64R+32 подкачки
>>1435719 Чувак я хз из каких источников ты его брал! Я нашел только гуфы и бф16, больше ничего нет, scaled версии не нашел. В мэйн репозитории вообще какой то понос лежит, хуй знает для кого.
>>1433480 (OP) И че как вам этот Я имейдж? Лучше сдохли? Он может в контролнеты, инпеинты, в генерацию анимедевок, в буру теги и так далее и так далее?
>>1435827 >Эту хуйню давно убили эдиты. Ну не скажи. Вот если мне нужна какая-то прям специфическая поза, которую словами легко не описать, а вот контролнет заюзать с референс позой вообще изи. Или что ты имеешь ввиду? Что за эдиты?
>>1435842 Потужно. Всё равно референс поза проще, чем надеятся, что ИИ поймет по словам что ты от него хочешь. Или можно в фотошопе отредактировать картинку, а потом прогнать её через апскейл с коэффициентом апскейла 1.
Уже сейчас в турбо вложен какой-то едит или референс генерация скорее. Очень трудно промптить так как возможно енкодер не заточен в такое. На пиках не стандартное и2и.
>>1435819 >Я имейдж? Лучше сдохли? Он может в контролнеты, инпеинты, в генерацию анимедевок, в буру теги и так далее и так далее? >>1435869 >сдхл это Включи в своей рабочей модели sdxl лору dmd2 с весом 1 в обязательном порядке и попробуй всё, что ты перечислил. Или ты так и делаешь? Сейчас Z image turbo это dmd2
Латентное пространство Z Image совместимо с Flux Shcnell пик2, Chroma пик3, Krea пик4! Или наоборот, можно рефайнить генки от Зет на Хроме. А уж хрома-то побольше понимает в голых телах.
Моя любимая нейронка Yuri Image. Первый промпт на английском, второй на китайском. Броня чуть лучше стала и освещение тоже, но нужно тестить на больших запросах с кучей персонажей, с текстом оба с русского переведены
>>1435987 > рефайнить генки от Зет на Хроме идея неплохая, но пока все упирается в почти полное отсутствие вариаций. я лучше изначально на хроме буду генерить с меньшим количеством степов и разрешением, а потом рефайнить.
Народ кто-нибудь в курсе как запромптить whale tail? Получается все время полностью обнажение, а нужно чуть-чуть Z-IMAGE, дада знаю, что через edit qwen можно, но хочется нативно через промптинг пердолинг, МБ у кого есть база на how to prompt like a boss для ZZZ?
промпт: "A professional digital photo of a girl, from behind. The girl is 18 years old, Russian, blonde, a long single braid on her shoulder, hazel eyes, thick puffy lips. She is wearing white strapless crop-top, white g-string panties with thin lace straps, pink sweatpants, big silver hoop earrings. Naked upper glutes seen. Royal ancient Greek style decoration on the background. Magazine style background with a stylized neon title says "2CH.HK" above her head."
Далее: ControlNet: нет; Inpaint: нет; Edit: нет; I2I: нет; Только T2I. Следование promptу на английском: посредственное/удовлетворительное с переходом в неудовлетворительное. Использование JSON-размеченных promptов (которые Z-Image поддерживает на манер FLUX.2) не особо помогает.
>>1435819 Это как sd3.5 который должен был выйти тогда, но не смог, можно генерить красиво в 1600x1200 (Я бы выложил, но там сплошные бабы). Умеет в текст и даже русский и даже хорошо, пока вышла турбо модель, генерить можно за 17 секунд. Кайф? Да пиздец, после флюксокалов на 96гб врам, это будто бы последняя надежда.
>>1436232 Ну мне баб голых именно надоедает делать быстро, а чтобы сценка какая-та была, идея, тогда можно долго ковыряться, с Z имеджом может даже не только баб буду делать, хотя все мужики одинаковые выходят совсем уж, какие-то дефолтные Джоны, Олеги и Чжаны
>>1436249 Мне нравится делать magazine cover style залупу, типа эротики, а лица получается немного зарандомить, если описывать черты лица, в противном случае будет default face 1
>>1436259 Z к этому не особо чувствителен будто и нельзя ебануть (big nose:2) как в SD модельке. Вроде как можно несколько раз повторить разными словами будто деду деменциозному рассказываешь и станет эффект сильнее. Или лицо в самом начале промпта описать попробовать
>>1436209 >Анончик, разобрался с Qwen и Compy >Но, где взять вот те нунчаку модели? >Нужно брать сразу VAE, Checkpoint и Clip?
Значит, не разобрался. Иначе бы такое не спрашивал. Вникай глубже, иначе хлебнёшь. Примеры только для того, чтобы показать, что всё работает. Workflow всё равно придётся допиливать, если хочешь какие-то приемлемые результаты получить.
Nunchuku я бы не рекомендовал. Ускорение вывода не стоит совместимости с многими неподдерживаемыми LoRAs.
ИНПАИНТ в Z. В промпте нуде гёрл. Настройки предварительные. Играть количеством шагов и подбирать семплер. Швы вообще ни к черту может подскажите решение?
>>1436316 Я не знаю о чём ты. На красивую женщину смотреть просто приятно (кому-то и на парня). Какие-то сцены разыграть, разные позы подбирать. Необязательно своего вилли теребонькать
>>1436373 Думаю тебе проще будет дождаться релиза Z-edit, на нее гарантированно появится сразу лора на раздевание как и на Qwen, только по примерам уже выпущенных лор на Гойда-имедж турбо, думаю они будут получше.
>>1436402 Капец он милый и да разумеется смотреть приятно, то что мы находимся в рабстве кума не делает из на людей не способных чувствовать, но кум не волк в лес не убежит...
>>1436402 На этого конкретно так себе, какой-то криповый анфас и слишком близко, а в целом норм. Хотя я котоман больше Вообще кум надоедает в целом, может потому что у меня вычислительные мощностя не очень большие, не могу ебейший комбайн собрать из текстового и картиночнового кума, но первый раз когда разобрался было прикольно, хуй себе чуть не оторвал, но быстро сошло на нет, а картинки делать всякие воркфлоу перебирать, лоры, хуё-моё, этим долго можно себя развлекать. А как когда я по молодости линукс теребил, только результат намного веселее
>>1436511 Вроде как sdxl никто из интернетов не удалял, опять же только дистил потрогали, щас будет база и эдит. Реально впервые за годы плюс минус легковесная модель вышла, которая что-то может, а вони поднялось.
>>1436528 Лично для меня прорывом стал именно qwen edit особенно последняя итерация (очень жду новую, говорят вот вот на днях). Да там с реализмом слабо, но вот именно понимание промпта на крайне высоком уровне. А вот зимаг именно дал тот старый вайб быстрых генов sdxl, да дистил накладывает свои ограничения, но на фоне мертворожденных, на мой взгляд, флюхов - глоток свежего воздуха, просто не для всех задач.
>>1436511 >>1436528 Есть подозрение, что цветовая гамма - "вина" её vae. Так натренирован. Но если это так - можно ждать альтернативные варианты. Ну и вообще-то, постпроцессинг никто не отменял. Неужели так сложно добавить в хвост workflow одну ноду для коррекции яркость-контраст-гамма по вкусу?
Сап, есть где-нибудь гайд для тренировки лоры? Хочу натренить лору на основе иллюстриуса на стиль художника, не хочу обосраться с описанием картинкок. Если есть просто советы тоже был бы благодарен