/ai/ - Stable Diffusion тред X+174

Stable Diffusion тред X+174 /sd/ Аноним 28/11/25 Птн 15:28:58 № 1433480 1

Тред локальной генерации

Z-image EDITION

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

ЧТО НОВОГО АКТУАЛЬНОГО ЗА ГОД

• Z-Image-Turbo
• Flux 2
• Qwen Image и Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза. Пример: 4-8 шагов, CFG 1. https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)

► Предыдущий тред >>1423811 (OP) ► https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03

Аноним 28/11/25 Птн 15:33:08 № 1433489 2

>Stable Diffusion тред X+173 /sd/

Аноним 28/11/25 Птн 15:46:09 № 1433502 3

как сделать оптическую иллюзию без кьюар монстра а в идеале без контрол нета вообще?

Аноним 28/11/25 Птн 15:46:13 № 1433503 4

Z в русский может, но некоторые буквы почему-то в упор не видит, например "Ч".

Аноним 28/11/25 Птн 15:53:22 № 1433520 5

зимаг не понимает половину того что знает квен. например насилие. или персонажей диснея. не умеет в мутации. в сложную фантазию. в бред.

очень ограниченная штука. мож для эдита будет норм

Аноним 28/11/25 Птн 15:53:30 № 1433521 6

>>1433502
img2img с небольшим денойзом.

>>1433503
если писать заглавными, то чаще лучше пишет. Еще желательно чтобы не так много текста в целом было, тогда норм пишет.
На квен edit с lightning вообще была жопа с текстом, может base модель вообще будет идеальна у Z image в этом плане.

Аноним 28/11/25 Птн 15:55:02 № 1433527 7

Аноним 28/11/25 Птн 15:58:02 № 1433535 8

>>1433521
>img2img с небольшим денойзом.
ну вот есть картинка хочу ее сделать иллюзией чтобы затерялась горах в цветах в мечтах, что именно денойзить?

Аноним 28/11/25 Птн 16:03:55 № 1433551 9

Как вы ZVГойда! модель заводите? Я просто новичок. Написано в ггуф версии что можно комфи ггуф использовать

Аноним 28/11/25 Птн 16:11:28 № 1433573 10

>>1433551
Два чаю, написано, что дистилят можно в 16гб врама впихнуть, но там суммарный вес трех сейфтензоров 25гб, остально в оперативку загрузится или как?

Аноним 28/11/25 Птн 16:16:07 № 1433583 11

>>1433521
>пик2
Поясните, а вот эти бейз и имадж-эдит модели будут намного больше жрать, чем текущая турбо?

Аноним 28/11/25 Птн 16:20:10 № 1433585 12

>>1433583
А никто ещё не знает, официальных сведений нет. Будем всё же надеяться, что не сильно больше будет есть.

Аноним 28/11/25 Птн 16:21:56 № 1433587 13

>>1433535
в общем не очень выходит, тебе лучше контролнет использовать.
но логика в том чтобы насыпать побольше шума на картинку, чтобы от нее мало что осталось (а для этого нужно значение денойза повыше) и потом сгенерить на ее основе новую. должно быть достаточно любого дефолтного img2img воркфлоу.

>>1433551
>>1433573
Хз откуда вы такие беретесь, используйте вот этот воркфлоу
https://comfyanonymous.github.io/ComfyUI_examples/z_image/

сама модель весит всего 12 гб в fp16 (или 6 гб в fp8)
https://huggingface.co/Comfy-Org/z_image_turbo/blob/main/split_files/diffusion_models/z_image_turbo_bf16.safetensors

Влезает fp16 даже в 8 ГБ на RTX 3070 - 2048x2048 картинка за 100 сек.
Но если хочется скорость замедлить, то можно наверное и поставить gguf.

>>1433583
>>1433585
нет, по тому что они написали на хаггинфейсе турбо это просто дистиль по типу лайтнинга - для генерации за меньшее количество шагов. То есть жрать будет стольо же, но генерить медленнее.

Аноним 28/11/25 Птн 16:29:54 № 1433601 14

>>1433587
>нет, по тому что они написали на хаггинфейсе турбо это просто дистиль по типу лайтнинга - для генерации за меньшее количество шагов. То есть жрать будет стольо же, но генерить медленнее.
Спасибо за разъяснение, анон! Правда в таком случае я не совсем понимаю, зачем откладывать выход базовой модели?

Аноним 28/11/25 Птн 16:38:38 № 1433610 15

>>1433587
Классная ссылка на комфи воркфлоу, но как мне запихать это даже в 12гб? Там энкодер и модель вместе намного больше весят. Или я что-то не понимаю?

Аноним 28/11/25 Птн 16:40:56 № 1433614 16

>>1433610
у меня на 8 врам работает

Аноним 28/11/25 Птн 16:49:11 № 1433624 17

>>1433610
врам почит полностью отводится под генерацию, рам под модели, те куски моделей которые не влезают в рам скидываются на диск и потом подгружаются оттуда (но подгрузка с диска это долго)
поэтому все упирается именно в размер оперативы, расчитывай чтобы в нее все влезало

Аноним 28/11/25 Птн 16:50:59 № 1433628 18

Аноны первый раз пользуюсь вашим КомфиУИ .Можно ли сделать так что бы генерилась картинка потом я нажимал на кнопку и она апскейлилась ?

Аноним 28/11/25 Птн 16:53:11 № 1433634 19

>>1433610
как бэ ComfyUI автоматически использует оперативную память для закрытия той части модели, которая не вмещается в VRAM.

>>1433628
Да, сделай так чтобы ноды на генерацию и апскейла были в одном ворклфоу и чтобы результат первичной генерации в виде выхода шел входом в первую ноду для апскейла.

Аноним 28/11/25 Птн 16:59:09 № 1433651 20

>>1433610
>Или я что-то не понимаю?
Ключ запуска --normalvram - и comfy сам разберется с памятью. Главное чтобы обычной оперативки хватило под свап блоков, а то со свапом на диск будет реально грустно.
А encoder и модель вообще грузятся и работают последовательно, по отдельности, а не вместе.

Аноним 28/11/25 Птн 17:01:29 № 1433656 21

ComfyUItempglix[...].png 1730Кб, 1536x768

image.png 19Кб, 745x267

Вот простой пример. Хоть промт и плохот написан, но квен его понял.

1. Zimage
2. Квен.

Зимиж просто игнорирует все необычное. Никаких странных сопоставлений. Ой, я не умею!!1

Аноним 28/11/25 Птн 17:04:32 № 1433662 22

Хоспадя, это прорыв. Скорей бы зетку файнтюнули и лора наштамповали. Со времён полторах так не трясся в ожидании чуда.

Аноним 28/11/25 Птн 17:05:06 № 1433664 23

>>1433610
>Или я что-то не понимаю?
Во первых они работают последовательно. Сначала текст в латент отрабатывает на гпу, потом в врам грузится модель и этот латент кодируется в картинку. Просто понаблюдай за этим в диспетчере задач.
А во вторых работает расшаривание врам в рам.

Аноним 28/11/25 Птн 17:06:22 № 1433666 24

>>1433664
Точнее говоря есть третий этам латент через вае в картинку.

Аноним 28/11/25 Птн 17:14:04 № 1433678 25

>>1433656
Весь тред знает какой у тебя там кролик

Аноним 28/11/25 Птн 17:16:47 № 1433680 26

>>1433678
Прости, если нанес тебе психотравму!

Аноним 28/11/25 Птн 17:20:06 № 1433685 27

Господа аноны, я дико извиняюсь, а где собственно pussy у моей 1girl standing?

1 >heavy pixelated full body art of a cute girl with massive fluffy fennec ears and a big fluffy tail blonde messy long hair blue eyes she is nude and barefeet and holds her hands behind her back, she has heavy blush on her face and she looks shy. A beautiful city at sunset on the background

2 >heavy pixelated full body art of a cute girl with massive fluffy fennec ears and a big fluffy tail blonde messy long hair blue eyes. she is nude and showing her pussy to the viewer, also she is standing barefeet and holds her hands behind her back, she has heavy blush on her face and she looks shy. A beautiful city at sunset on the background

2048х2048, euler simple, 9 steps, 1cfg, енкодер и моделька в полных весах.

Аноним 28/11/25 Птн 17:23:21 № 1433689 28

>>1433656
слегка в ахуе с тестов на русском, но чем дальше тем я меньше удивляюсь тому что здесь происходит

Аноним 28/11/25 Птн 17:24:39 № 1433690 29

>>1433685
пусси в сделку не входила
максимум заблюренная полоска мяса

Аноним 28/11/25 Птн 17:25:05 № 1433691 30

>>1433634
> автоматически
У меня это не работает. Ни разу не видел чтобы работало, сижу с двумя картами по 24 гига, может из-за этого. Всегда просто падает в ООМ когда кончается память, даже с lowvram. Говорят блоксвап ещё есть автоматический, тоже ни разу не видел чтоб работал, только ручной.

Аноним 28/11/25 Птн 17:27:38 № 1433697 31

>>1433690
Это тот самая незацензуренная моделька, я так понимаю? А разговоров то было, Z, Z, Z, а тут вот оно как...

Аноним 28/11/25 Птн 17:31:57 № 1433704 32

>>1433691
пробуй с одной картой, хз
блоксвап автоматический, да

Аноним 28/11/25 Птн 17:32:12 № 1433705 33

>>1433664
>>1433651
>>1433634
>>1433624
Победа, спасибо мужики. Но пердит он заметно дольше того, что на той же Illustrious было, как я понимаю там и энкодера нет и сама модель просто меньше

Аноним 28/11/25 Птн 17:36:48 № 1433712 34

>>1433691
скорее всего ты когда-то вырубил настройку sysmem fallback у себя в панели NVIDIA. Раньше люди предпочитали out of memory вместо замедления в генерации, но сейчас особенно с новыми моделями лучше медленно генерить чем никак.

>>1433697
Модель только вышла чел, разговоры были про то, что она может нативно в 2K хотя с размером она с SDXL.

Аноним 28/11/25 Птн 17:40:28 № 1433717 35

>>1433656
Очень, блин, показательно сравнивать возможности модели с разным энкодером на одном промпте.
Давайте уточним - мы сравниваем чисто понимание промпта, или возможности модели достичь желаемого результата?
Если все же второе - вот тебе твой кролик от zimage:

Craft the detailed oil painting with the scene where a rabbit. This rabbit holding a handsaw in left forward paw and sawing with it his own right forward paw. Saw is covered with blood dots, and blood following from the wounded paw.

Она не "игнорит необычное". Она требует детального описания для него, т.к. китаец. А у них - "мы вам построим что угодно, вы только объясните - как?". :)
А русский она понимает хуже, чем английский, увы. На русском объяснить не получилось.

Аноним 28/11/25 Птн 17:43:12 № 1433720 36

>>1433712
>Модель только вышла
Значит голые пиксельные 1girl'ы не селебы откладываются до лучших времён. Но фотореализм достойно генерит, тут соглашусь однако тоже со шрамом вместо pussy. Хотя, честно, ожидал почему-то большего, даже учитывая что это дистилл базовой модели. Чтож, буду ждать базовой модели и нсфв файнтюнов.

Аноним 28/11/25 Птн 17:43:36 № 1433721 37

я вообще отказываюсь использовать то что не илластриас

Аноним 28/11/25 Птн 17:44:12 № 1433722 38

>>1433717
картинку ну очень сложно понять. типа правую отпилил. а где она? превратилась в кровь?

>с разным энкодером
там по идее еще покруче энкодер

Аноним 28/11/25 Птн 17:52:10 № 1433725 39

>>1433722
Специально стиль использовал такой, чтобы натурального реализма было поменьше - не люблю подобное гуро.
detailed oil painting - дает крупные мазки кистью с маслом, аж выступы наложенной краски по холсту видно.

Аноним 28/11/25 Птн 18:01:27 № 1433729 40

Поставил и энкодер GGUF, хуй знает насколько быстрее стало

Аноним 28/11/25 Птн 18:25:25 № 1433735 41

В Z имаге в клип ноде надо ставить qwen3 или qwen3 VL ? И где можно скачать qwen VL, которая подойдет?

Аноним 28/11/25 Птн 18:29:37 № 1433740 42

>>1433721
раскол в церкви вангерлстендингов....

Аноним 28/11/25 Птн 18:34:43 № 1433744 43

>>1433735
https://huggingface.co/Comfy-Org/z_image_turbo/blob/main/split_files/text_encoders/qwen_3_4b.safetensors

Аноним 28/11/25 Птн 18:38:52 № 1433751 44

>>1433744
Да, это обычгая квин. А можно ли впихнуть квин VL. И есть ли смысл вообще.

Может это бредовый вопрос

Аноним 28/11/25 Птн 18:40:39 № 1433752 45

>>1433751
Геймини говорит нужно использовать конкретные модели, а не любой квен, которые могут преобразовать запрос в понятный

Аноним 28/11/25 Птн 18:46:23 № 1433757 46

>>1433752
Окей, тогда не буду париться

Аноним 28/11/25 Птн 19:13:49 № 1433773 47

ComfyUItempopde[...].png 5123Кб, 1856x1088

ComfyUItempopde[...].png 3765Кб, 1088x1792

зетка нормально может в русик, очень непривычно. Falut 4 помните такую игру?

Аноним 28/11/25 Птн 19:52:50 № 1433807 48

>>1433601
>зачем откладывать выход базовой модели?
мне кажется они выкатили турбо версию тупо чтобы сбить Flux 2 со своих лавров и не дать времени ему набрать хайп (хотя его и так мало кто запустит).
Может они еще дотренируют чутка свою базовую модель.
Читал что они планируют иметь несколько базовых моделей - сейчас тренируется та, которая с закосом на реалистик фото. Потом будет чисто на аниме а потом хер знает.

Аноним 28/11/25 Птн 20:21:32 № 1433832 49

гойда имейдж

Аноним 28/11/25 Птн 22:18:40 № 1433935 50

Гойда имедж ахуй

Аноним 28/11/25 Птн 22:19:42 № 1433936 51

176435756526665[...].png 12Кб, 941x168

Зачем-то, видимо для тех у кого 2 ГБ VRAM, скоро выйдет поддержка Z-image на nunchaku
https://github.com/nunchaku-tech/nunchaku/issues/809

Аноним 28/11/25 Птн 22:23:08 № 1433937 52

>>1433935
Но может ли она в славянские доспехи и платья?

Аноним 28/11/25 Птн 22:28:39 № 1433942 53

>>1433937
Ну чёто типа похожее. Я не шарю за исторические доспехи у славян

Аноним 28/11/25 Птн 22:36:00 № 1433950 54

1й пик с сайта комфи модель там в воркфлоу фп16
2й пик z-image-turbo-fp8-e4m3fn.safetensors по ссылке на хф с прошлого треда.

Аноним 28/11/25 Птн 22:36:46 № 1433952 55

>>1433950
2й пик отклеилось

Аноним 28/11/25 Птн 22:38:09 № 1433953 56

>>1433950
>>1433952
Погрешность сида (с)
Зато это генерилось на 8врам днокарте за 9 сек, т.е. 1 шаг - 1 сек = 9 шагов

Аноним 28/11/25 Птн 22:41:55 № 1433956 57

>>1433936
>поддержка Z-image на nunchaku
Будет генерить более-менее управляемую картинку за 10 сек, збс. Наконец-то к ролплею генку прикручу.

Аноним 28/11/25 Птн 22:49:50 № 1433963 58

>>1433953
как ты это делаешь? просто карточка быстрая? у меня на 3060 глину месит стабильно секунд 25

Аноним 28/11/25 Птн 22:52:10 № 1433965 59

Бля, она что в сиськи может? Думал с цензурой....
>>1433963
4060ти, может из-за этого
Ну и это фп8 e4m3fn

Аноним 28/11/25 Птн 22:55:55 № 1433966 60

Гы. Хейтерам на заметку - нашел, чего zimage реально не знает/не умеет.
Концепт "кентавр" ей никак не знаком. Добиться не получается никак. Ни в фото, ни в рисунке.

Аноним 28/11/25 Птн 22:57:15 № 1433969 61

>>1433965
Погуглил, fp8 будет лучше работать на 4000 серии и выше, по качеству примерно как Q8, хотя сравнений я не нашёл

Аноним 28/11/25 Птн 22:59:24 № 1433971 62

>>1433966
При этом, скажем, грифонов - знает. :)

Аноним 28/11/25 Птн 23:01:57 № 1433973 63

>>1433942
Хмм. Это конечно не они, но выглядит неплохо в качестве гибрида с платьем

Аноним 28/11/25 Птн 23:03:35 № 1433975 64

image.png 13Кб, 430x31

Бегло потестил и я в ахуе в общем.
>>1433963
Ну напиздел мальца, бывает и 12 сек

Аноним 28/11/25 Птн 23:08:33 № 1433981 65

Еббааать, оно поняло этот промпт:

girl, long braid brown hair, soviet_pioneer, red_neckerchief, saluting, white_shirt, dark_skirt, serious_expression, ussr_flag_background, anime_style, cel-shading

Аноним 28/11/25 Птн 23:16:52 № 1433988 66

>>1433981
Но сможет ли она сделать Лену?

Они уже выпустили эдит модель, которая может принимать референсные картинки?

Аноним 28/11/25 Птн 23:32:44 № 1433995 67

>>1433988
Без понятия, я только что скачал Z, до этого полгода не генерил из-за застоя в развитии нейронок.

Аноним 29/11/25 Суб 00:01:07 № 1434019 68

Ананасы, стоит снова вкатываться в картиночную генерацию с зимаджем?

Аноним 29/11/25 Суб 00:02:37 № 1434023 69

>>1434019
Если тебе нравится, то почему нет?
Я обычно начинаю генерировать, когда игры надоедают

Аноним 29/11/25 Суб 00:11:52 № 1434030 70

Там выкатили тренировку лор для Зимаджа

https://www.reddit.com/r/StableDiffusion/comments/1p957k2/lora_training_for_z_image_turbo_on_12gb_vram/

Аноним 29/11/25 Суб 00:12:28 № 1434031 71

Аноним 29/11/25 Суб 00:35:54 № 1434041 72

>>1434030
> ai-toolkit
Лучше обоссыте.

Аноним 29/11/25 Суб 00:36:37 № 1434043 73

А что, Z без цензуры? Как так?

Аноним 29/11/25 Суб 00:43:42 № 1434048 74

>>1434043
Квин тоже без цензуры был. Но тут нормально натренировали, а там забили

Аноним 29/11/25 Суб 00:44:30 № 1434051 75

>>1434043
Так, серединка на половинку: анатомию знает, сиськи рисовать может, а вот что между ног, тем более подробно - нет. Впринципе было бы странно, выпусти разработчики NSFW модель сразу сами.
ИМХО, конечно.

Аноним 29/11/25 Суб 00:45:46 № 1434054 76

>>1434048
>>1434051
Я вот какого добился. В принципе для подрочить сойдёт.

Аноним 29/11/25 Суб 00:48:34 № 1434056 77

>>1434054
Лучше уж одн из кумер-тюнов SDXL поставь да вздрочни. 1girl они более менее стабильно без изъёбств генерят же.
А зимаж для чего-то более осмысленного. Ну или Lora подождать, вроде там что-то для тренировки уже подкрутили.

Аноним 29/11/25 Суб 00:51:28 № 1434057 78

>>1434056
Ну это тест пока. В принципе осмысленную сцену для дрочки придумать тоже можно, лол. Щас чисто тест возможностей, без апскейлов и прочих изъёбств. Потенциал у неё просто бомбический.

Аноним 29/11/25 Суб 00:57:21 № 1434061 79

Алибаба щас себе карму и соцкредиты до небес подняла.

Аноним 29/11/25 Суб 01:05:20 № 1434067 80

Любезные, 3.2it\s это норм скорость? sdxl, карта 9070xt, cfg8 1024на1024

Аноним 29/11/25 Суб 01:06:49 № 1434069 81

>>1434057

Аноним 29/11/25 Суб 01:15:53 № 1434075 82

>>1434069
Хватит, я и так от шока не отошёл. Какая же она охуенная...

Аноним 29/11/25 Суб 01:21:50 № 1434078 83

Аноним 29/11/25 Суб 01:24:29 № 1434082 84

>>1434069

Аноним 29/11/25 Суб 02:00:09 № 1434094 85

https://www.reddit.com/r/StableDiffusion/comments/1p94z1y/get_more_variation_across_seeds_with_z_image_turbo/
Если кого-то результат не устраивает, то бишь кажется одинаковым.

Аноним 29/11/25 Суб 02:20:07 № 1434102 86

>>1434094
С одинаковостью генераций решение очень простое. Берём Qwen Instruct 4B и переписываем промпт им, секунда времени. Я так ещё на Qwen Image делал, чтоб рандомило. Работает как сиды на XL.

Аноним 29/11/25 Суб 02:37:10 № 1434105 87

>>1434094
Охуенная техника, увелчивающая время гена раза в 3 из-за всасывания токенизатора каждый раз при одном и том же промпте. Плацебо солюшен уровня "мне показалось лучше будет сделать кроспроцесс у фоточки".

Аноним 29/11/25 Суб 02:49:40 № 1434109 88

>>1434094
Почитай комменты по твоей же ссылке и сделай как там советуют:
В промежутке на пути подачи LATENT, вставь один промежуточный узел пикрил. Всё.

Аноним 29/11/25 Суб 03:27:38 № 1434152 89

>>1434102
Анон, можешь чуть подробнее? А лучше скинь маленький воркфлоу с ллм и ссылку на модель, что ты упомянул? Я так-то не совсем нуб в ллм, но запускал их отдельно, в кобольде. Можно в принципе и отдельно так и запускать?
А что писать?

Аноним 29/11/25 Суб 03:35:32 № 1434165 90

Анонсы, кто пользуется ComfyUI, причем пользуется на уровне не скачал чужой workflow, тут выбора почти нет - будешь скачивать кастомные ноды, что предложено в нем. А те кто сам своим вф разрабатывает, вы скачивате монстро-паки ессентил, ргтрее и подобные квалити оф лайф?
Спрашиваю потому, что у меня неизменно в итоге приводит в опуханию Комфи и тормозам. Приходится заново ставить и опять выборочно ставить ноды. И снова.

Аноним 29/11/25 Суб 03:54:04 № 1434181 91

>>1434165
Стараюсь ничего не «разрабатывать», а брать, по возможности, всё готовое.
Разбираться и модифицировать. Собирать франкенштейнов, складывая workflow из удачных кусков других workflow.

Но для этого нужно немножко вникать в то, как это использовать. Хотя бы поверхностно.
Вот тебе простой пример:
Задача — добавить «вариативности» генерациям z-image.

>>1434094
По ссылке предлагают два раза протягивать от токенизатора и использовать узел advanced KSampler для разбиения на два этапа (как в Wan). >>1434105 правильно указал на недостатки.

>>1434102
Предлагает отдельно переписывать prompt.

Я почитал то, что по ссылке (сейчас повёлся, играю в z-image, в целом пока не особо доволен). В комментах было написано, что вместо этого нужно просто немного «подшумить» LATENT. Гуглим узел для «подшумления» (Inject Latent Noise), вставляем.
В целом задача решена.
Вот, примерно так и с остальным ковыряюсь.

>вы скачивате монстро-паки ессентил, ргтрее и подобные квалити оф лайф?

Скачал rghtree, essentials, RES4LYF, для Wan немножко. Согласен с тобой, чем меньше мусора, тем лучше.
Бездумно лучше ничего не ставить. Можно накачать конфликтующего мусора, ещё и устаревших legacy костылей и ещё интерфейс засрать с помощью васянских UI плагинов.

Вместо этого, с помощью ComfyUI-Manager можно посмотреть то, что требуется для workflow и выборочно поставить то, что реально нужно.

Ну и не вредно делать снэпшоты рабочей конфигурации, если склонен к экспериментам или боишься, что после очередного апдейта сломается вообще всё разом.

>Спрашиваю потому, что у меня неизменно в итоге приводит в опуханию Комфи и тормозам.

В ComfyUI-Manager есть функция отображения конфликтующих узлов и функция отключения (disable). Всё лишнее можно временно отключать, на всякий случай.

Аноним 29/11/25 Суб 03:58:44 № 1434185 92

>>1434165
Очень ограничено. По сути, у меня только эти два и стоят из больших пакетов подобного общего назначения.
Я чужие workflow практически не использую без переработки. И если там куча разных паков используется - такой обычно сразу отправляется в /dev/null
Потому, что это частый признак того, что автор не понимал что делает, и продвигался методом тыка = получилась перегруженная ненужным фигня. Толковые авторы, обычно, ограничиваются одним-двумя любимыми паками и из остального добавляют только то, без чего нельзя обойтись (уникальные функции).
Так то большие паки друг-друга сильно повторяют, потому и смысла держать их большую кучу нет, если понимаешь что к чему.

Аноним 29/11/25 Суб 05:43:30 № 1434220 93

Какая же гадость в сравнении c моей любимой sd3.5. Цвета нет, композиция проебана. Мешанина вместо цельной картинки. Для редактуры в будущем сойдет, но не больше.

Аноним 29/11/25 Суб 06:00:32 № 1434230 94

>>1434220
У тебя ещё хоть какие-то цвета есть.
После Qwen-Image, с promptами тут просто беда.
Пытался другой text encoder подключить, qwen_2.5_vl_7b_fp8_scaled.safetensors, не заработал.
Promptы надо писать совсем по-другому. И при этом половина promptа просто выбрасывается.
Как ты освещение сделал на последнем пике справа на z-image, это вообще любопытно.
Кроме того, на этом z-image полезли опять деформированные конечности, лишние пальцы, многоножие и подобные косяки.

Ещё, если кому надо, euler/beta работает неплохо. А мой привычный res_2s/bong_tangent ещё больше всирают картинку (кожу).

Сделай в ней что-то удобоваримое, кроме сел медведь в машину@сгорел это пытка.

Аноним 29/11/25 Суб 06:36:50 № 1434239 95

>>1433981
>anime_style, cel-shading
не поняло

Аноним 29/11/25 Суб 06:48:13 № 1434243 96

>>1433956
она и так за 10 сек генерит

Аноним 29/11/25 Суб 06:49:24 № 1434244 97

>>1433995
или все-таки застоя в собственном развитии?

Аноним 29/11/25 Суб 07:17:44 № 1434248 98

>>1434220
>Цвета нет
А что не так с цветом?

Аноним 29/11/25 Суб 07:19:06 № 1434249 99

Ну и где там новый qwen ie?

Аноним 29/11/25 Суб 07:29:23 № 1434253 100

>>1434248
Да многое не так.
А ещё пока ты SDшкой, то, что слепил в z-image, полировал, эта самая SDшка с Tile ControlNet тебе цвета ещё больше вшатала и оттенок добавила.

Аноним 29/11/25 Суб 07:45:47 № 1434254 101

Крутая моделька от слова совсем

Аноним 29/11/25 Суб 08:21:53 № 1434261 102

>>1434254
Что происходит на пикче?

Аноним 29/11/25 Суб 08:28:34 № 1434264 103

Так а чего вы от Z-Image визжите, когда там новейший Кандинский в опен-сорс вышел. Пробуйте, показывайте, SOTA лучше чем Flux 3.

Аноним 29/11/25 Суб 08:34:13 № 1434266 104

>>1434264
Может потому что генерация занимает вечность?

Аноним 29/11/25 Суб 08:43:23 № 1434268 105

>>1434043
чел, абсолютно во всех нефайнтюненых моделях есть голые сиськи, но вагины и члены замазаны. и здесь то же самое. тебе сгенерило заблюренную темную полоску между ног и тебе кажется что там реально пизда голая.

Аноним 29/11/25 Суб 08:45:10 № 1434269 106

пошла жара. 32 дим/альфа весит 162.2 MiB
надо будет попробовать 256 )))))))))))))))))))))))))

Аноним 29/11/25 Суб 08:46:01 № 1434270 107

>>1434268
Половые губи в такой позе так и выглядят, даже полноценные порно-аниме модели тебе подобное нарисуют

Аноним 29/11/25 Суб 08:46:53 № 1434271 108

>>1434268
Вот нет ни одной нахуй причины это делать, кроме как шиза трясущихся за плодячку старых пидоров у которых уже не стоит, значит можно запрещать секс в интернете

Аноним 29/11/25 Суб 08:48:35 № 1434273 109

>>1434268
если бы не пиздел тут, а генерил, то знал бы, что вульва там есть, нет только вагины потрохов пиздёнки , закрытая нормально выглядит как и должна

Аноним 29/11/25 Суб 08:51:39 № 1434274 110

>>1434271
А вдруг подросток 16летний зайдет в интернет, сгенерит голую женщину и увидит незацензуренную пизду? Вы знаете что может случиться?! Вы себе отдаете отчет???

Аноним 29/11/25 Суб 08:53:56 № 1434275 111

На цивитае уже лоры на зимаг стали выкладывать. Уже пару лор на сисекиписек есть.

Аноним 29/11/25 Суб 09:06:49 № 1434277 112

эйприл на фотке кста. Ну прикольно, но некоторые промты вообще не понимает, просишь свифт в одежде чун ли, он либо то, либо то генерит, пробовал и косплей писать и т.д., это фиксится описанием костюма просто, но банана все промты понимает, я жопу с пальцем сравнил, да

Аноним 29/11/25 Суб 09:16:13 № 1434278 113

>>1434270
ну я и говорю что кажется. подразумевая что при другом освещении и ракурсе иллюзия пропадет.

>>1434273
пиздеть и не генерить это удел скуфов которые до выхода зетки лежали афк в спячке, скипнув все новые модели после сдохли

Аноним 29/11/25 Суб 09:47:46 № 1434292 114

>>1433520
> не понимает половину того что знает квен. например насилие. или персонажей диснея. не умеет в мутации. в сложную фантазию. в бред.

Короче, как нана-банана, только с сиськами.

Аноним 29/11/25 Суб 10:32:42 № 1434309 115

>>1434278
ой как жопка у тебя засверебила-то, скорей таблетосы прими, а то желчь хуярит во все стороны

Аноним 29/11/25 Суб 10:39:35 № 1434314 116

>>1433587
16 Vram 32 ram + 24 файл подкачки на ссд.
Эта хуйня санчала грузит клип енкодер квена а потом выдает
pause
Press any key to continue . . .

Пытался менять в ноде device с дефолт на цпу, не помогло...

Аноним 29/11/25 Суб 10:40:37 № 1434317 117

>>1434269
хуйня получилась, попробую ещё раз через месяц

Аноним 29/11/25 Суб 10:42:29 № 1434319 118

image.png 9Кб, 856x81

>>1434314
не понял

Аноним 29/11/25 Суб 10:43:27 № 1434320 119

>>1434319
>Пытался менять в ноде device с дефолт на цпу, не помогло...

Аноним 29/11/25 Суб 10:48:01 № 1434321 120

>>1434320
Комфи обновлял? Места на дисках много?

Аноним 29/11/25 Суб 10:48:50 № 1434323 121

>>1434314
>>1434319

Окей. повысил файл подкачки с 24 до 32, и вернул cpu до default, завелось.
Картинка делается 25 секунд если меняь промт
15 если оставить старый

ddr4 2666, 5060ti

Аноним 29/11/25 Суб 10:49:42 № 1434324 122

Попробовал апскейл с z, ну хз такое себе, сука он мальца херит. Нужен апскейл нового поколения имено для апскейла, а не реставрационные калы как все.

Аноним 29/11/25 Суб 10:57:41 № 1434328 123

>>1434165
именно монстрпаков сильно много не нужно
rgtree, was, res4lyf, kjnodes, impact pack, reactor и т.д. - самая дефолтная база для энтузиастов. помимо них имею еще ряд мелких.

у меня было такое что комфи опух и стал лагать, но так как я переустановил обратно все вышеописанные паки а лагать перестало, то подозреваю что дело было в каких-то более старых паках времен sdxl, я уже не помню каких так как не использовал

Аноним 29/11/25 Суб 11:00:49 № 1434330 124

>>1434309
а все, иди свое ебало отмывай теперь

Аноним 29/11/25 Суб 11:17:35 № 1434339 125

Аноним 29/11/25 Суб 11:24:17 № 1434340 126

>>1434339
навальнята....

Аноним 29/11/25 Суб 11:28:47 № 1434341 127

Аноним 29/11/25 Суб 11:29:07 № 1434342 128

>>1434152
Вот так. Он каждый раз генерит немного разный промпт, но смысл не меняет.

Аноним 29/11/25 Суб 11:59:35 № 1434364 129

Попробовал сразу в таком разрешении генерить без апскейла.

Аноним 29/11/25 Суб 12:02:13 № 1434366 130

Аноним 29/11/25 Суб 12:20:37 № 1434380 131

Аноним 29/11/25 Суб 12:41:32 № 1434393 132

Поставил комфи настроил все запустилось, но генерация занимает 40 секунд 1024x1024 на 3060. Никогда до этого комфи не пробовал, может там какие то оптимизаторы или параметры нужны? Или это нормально?

Аноним 29/11/25 Суб 12:47:26 № 1434397 133

>>1434393
Генерация на какой модели? Каким сэмплером? Сколько шагов?

Аноним 29/11/25 Суб 12:51:56 № 1434401 134

>>1434397
Забыл добавить, пример для Z модели, >>1433587 отсюда. Вае и энкодер тоже оттуда. 9 шагов, эулер.

Аноним 29/11/25 Суб 12:53:34 № 1434403 135

>>1434401
Тогда слишком долго, что-то не так.

Аноним 29/11/25 Суб 13:06:52 № 1434420 136

>>1434314
>>1434323
Может у тебя оперативная память скипается? в 32 ГБ точно не может не влезть.

Посмотри в настройках NVIDIA control panel у тебя включен System memory fallback policy или нет.

>>1434364
Вообще это вроде его дефолтное разрешение.

Аноним 29/11/25 Суб 13:19:26 № 1434441 137

Аноним 29/11/25 Суб 13:33:31 № 1434464 138

>>1434220
no way модель на 8 миллиардов лучше турбо модели на 6, особенно когда дело касается сухого промпта без детального описания

Аноним 29/11/25 Суб 13:39:21 № 1434475 139

>>1434323
попробуй поставить gguf квен и/или fp8 основной модели, чтобы у тебя короче суммарно влезало всё в твои 16 врама, кфг ещё сильно влияет на скорость, всё что выше 1

Аноним 29/11/25 Суб 13:39:48 № 1434477 140

24,11,202500001.mp4 527Кб, 640x640, 00:00:05

Господа генераты, не подскажете начинающему Генерату, как можно убрать фон и сделать его прозрачным?

Я попробовал генерировать анимации - получил видео.
Разбить видео на набор кадров проблем нет.
А вот как просто и массово сделать прозрачный фон, чтобы не возиться вручную с каждым отдельным кадром?
Ведь наверняка есть простой и удобный способ!

Подскажите пожалуйста!
Заранее благодарен!

Аноним 29/11/25 Суб 13:41:00 № 1434479 141

>>1434477
after effects точно умеет на лету вырезать фон

Аноним 29/11/25 Суб 13:41:46 № 1434482 142

Проверяйте, сколько процентов промта проебано

A comic book page, in a classic 5-panel layout: 1 wide horizontal panel on top, 4 equal square panels aligned in a row at the bottom. Clean white gutters. Thick, clean black ink outlines. Flat, readable comic coloring with a balanced minimal palette: sky blue, park grass green, neutral warm skin tones, everyday clothing colors, and one bright red accent for comedic focus. Characters are highly expressive, with simple backgrounds. Text is hand-lettered in a classic comic font. The humor is coherent, grounded, and punchline-driven, with panel imagery escalating logically.

Panel 1 (TOP – wide)
Scene: A man stands in a sunny park, arms out like a documentary host. A tiny furious Chihuahua is held up in his hand like a wildlife specimen.
Text (man speech bubble, top-left quadrant, pointed at man):
“Behold! The rare Chihuahua Angrius…”
Text (small label below dog like a name tag, centered under dog):
“Danger: 4 lbs”

Panel 2 (BOTTOM 1 – square, far left)
Scene: The dog hits the ground with a tiny dust poof, paws spread like it just superhero-landed, face pure fury.
Text (large dog speech bubble, centered, pointed at dog):
“FEAR ME, GRASS!”

Panel 3 (BOTTOM 2 – square, middle left)
Scene: The man crouches calmly pointing at the perfectly harmless lawn. The dog continues screaming at it.
Text (man bubble, bottom center, pointed at man):
“Jeff. It’s literally just… grass.”

Panel 4 (BOTTOM 3 – square, middle right)
Scene: Dramatic zoom-in on Jeff the Chihuahua, face filling 40% of the panel, eyes shaking with determination, little tail visible behind him like a stiff antenna.
Text (dog bubble, top-center of panel, jagged border, pointed at dog):
“It knows what it did.”

Panel 5 (BOTTOM 4 – square, far right)
Scene: Jeff now sits in a tiny red donut dog-bed on the grass, blanket tucked, still staring at the lawn suspiciously. The man stands above him sipping coffee, unsurprised.
Text (man bubble, top-right of panel, pointed at man):
“He declared war on the lawn again.”
Text (dog bubble, bottom-center, small, pointed at Jeff):
“And I’ll do it tomorrow.”

GLOBAL STYLE NOTES (short, clean, matching content)

Visual focus on characters’ expressions and poses.

Flat colors, minimal soft shadow only under characters.

No random props or unrelated text.

Every line visually corresponds exactly to what is shown.

Аноним 29/11/25 Суб 13:46:04 № 1434487 143

Аноним 29/11/25 Суб 13:47:43 № 1434490 144

>>1434477
>как можно убрать фон и сделать его прозрачным?
Моделями - никак. Они про "прозрачность пикселя" не знают, т.к. не с пикселями работают. Оная прозрачность - это свойство формата хранения готовой картинки, которая создается сильно позже, чем модель работает.

>>1434477
>Ведь наверняка есть простой и удобный способ!
Post-processing и batch обработка готовых картинок - тебе туда. В принципе - в comfy есть расширения для этого, но подробностей не скажу, сам не делал, надобности не было. Возможный принцип - "замена цвета на прозрачность".

Аноним 29/11/25 Суб 13:56:15 № 1434502 145

>>1434253
>ыSDшкой
Не угадал, SeedVR2Refiner, он не про цвет. Оттенок здесь из-за промта "photo Polaroid"

Аноним 29/11/25 Суб 14:43:11 № 1434544 146

Q8 против fp8 соответсвенно. Я хз что выбрать на видеокартах где нет разницы в скорости (3000 и древнее)

Аноним 29/11/25 Суб 14:55:59 № 1434564 147

>>1434544
>Я хз что выбрать
Выбор очевиден - fp8. Ты слепой что ли?

Аноним 29/11/25 Суб 14:56:39 № 1434567 148

>>1434475
А ссылочку писечку на ггуф квена и/или квант зимаджа можно?

Аноним 29/11/25 Суб 15:08:15 № 1434581 149

>>1434479
Ок. Скачаю.
>>1434490
Слышал давным-давно про модуль на а1111 или Форже на видео от Христа, что вроде как пачку картинок помещал и что-то делал с ними там.
Не помню точно что, но вроде редактировал как-то скопом.

Аноним 29/11/25 Суб 15:09:10 № 1434582 150

>>1434482
Вот Флюкс.

Аноним 29/11/25 Суб 15:10:10 № 1434583 151

>>1434567
https://huggingface.co/jayn7/Z-Image-Turbo-GGUF
https://huggingface.co/unsloth/Qwen3-4B-GGUF
>>1434544
Ну чёт есть да разница небольшая, ещё вроде как лоры лучше работают с fp8

Аноним 29/11/25 Суб 15:14:56 № 1434585 152

>>1434582
ну тут хотя бы почти всё понятно

Аноним 29/11/25 Суб 15:29:36 № 1434605 153

>>1434490
есть wan alpha модель которая генерит с прозрачностью (если сильно нужно именно так)

Аноним 29/11/25 Суб 15:30:59 № 1434607 154

>>1434544
q4 гугуф выбирай не прогадаешь по советам из треда
даже если 24 врам и 128 рам, твой лучший выбор

Аноним 29/11/25 Суб 15:41:53 № 1434617 155

>>1434544
Для Ады и новее fp8 обязателен, в фасте почти в два раза быстрее fp16. 1024x1024 за секунду генерится.

Аноним 29/11/25 Суб 15:44:04 № 1434621 156

>>1434583
>разница небольшая
Ещё, так как модель может в текст, сделай несколько тестов с различным текстом, в разных местах картинки и размеров. По тексту сразу видно будет косяки. Я так семплеры тестировал. Подобрал вроде "самый лучший", а он в текст вообще не смог. Прикол.

Аноним 29/11/25 Суб 15:49:21 № 1434631 157

>>1434617
>1024x1024 за секунду генерится
В Krita с плагином в виде ComfyUI есть режим рисования life, когда рисуешь набросок и Комфи в реалтайме генерит отдельно картинку по твоим линиям. Крутая штука, но из-за скорости приходилось ставить 512х512 на sd1.5. надеюсь скоро запилят z turbo image в плагин.

Аноним 29/11/25 Суб 16:06:31 № 1434649 158

>>1434631
ну так оно на sd 1.5 и было рассчитано изначально

Аноним 29/11/25 Суб 16:14:03 № 1434662 159

>>1434621
Длинный текст везде как говно будет выглядеть, а небольшой нормально везде (если покрутить ещё сиды разные). (fp8 и Q8 соответственно).

Аноним 29/11/25 Суб 16:29:55 № 1434682 160

>>1433480 (OP)
Пацаны, а что за Z-image новый? Это очередной файнтюн SDXL или нечто совершенно иное?

Аноним 29/11/25 Суб 16:31:51 № 1434687 161

>>1434482
Z image пик1,
Z i2i пик2 prompt: erotic comics, girls, dogs
Что происходит на пик2?

Аноним 29/11/25 Суб 16:33:47 № 1434692 162

>>1434662
>Длинный текст
Дай промпт.

Аноним 29/11/25 Суб 16:36:59 № 1434705 163

>>1434692
Я не особо старался
Anime milf European woman with short blonde hair mistress wearing beautiful silk red dress smiling holding a sign that saying "My dad cooks some seriously awesome dishes. Here's a rough recipe, because there are tons of variations. He takes some soup, doesn't heat it up—heating things up isn't my dad's thing. He takes the soup, dumps it into a pan, and starts frying it. He adds a huge amount of onions, garlic, black and red pepper, and FLOUR! for viscosity, and tomato paste on top. All this is fried until it smokes. Then it is removed from the heat and cooled on the balcony. Then my dad brings it in and, generously pouring mayonnaise on top, starts eating. He eats it straight from the pan, scraping it with a spoon. He eats and mutters under his breath, “Oh, fuck.” Sweat beads on his forehead. He kindly offers me some sometimes, but I refuse. Needless to say, the farts that follow are wild. The stench is so bad that the wallpaper peels off the walls"

Аноним 29/11/25 Суб 16:37:58 № 1434707 164

image.png 25Кб, 237x82

>>1434687
что-то про кал

Аноним 29/11/25 Суб 16:39:19 № 1434711 165

>>1434705
а почему вы пишете промты на инглише, если модель русский язык понимает в разы лучше? ваши промты приходится гуглопереводчиком переводить чтобы использовать...

Аноним 29/11/25 Суб 16:40:19 № 1434712 166

>>1434711
Ну мы долбоебы просто, для нас все американское автоматически лучше

Аноним 29/11/25 Суб 16:47:57 № 1434733 167

>>1434711
Соевый куколд либерашка потому что. Ну и потому что в модели прямо написано, что она текст пишет на английском и китайском. Русский тоже может, но это как-то не совсем честно тестить на других языках. Ну и привычка, локальные ллмки практически все значительно хуже на русском работают (большие модели уже особо не отличаются на разных языках, там прямо в размышлениях видно, как тот же гемини переключается на английский пока думоет). По поводу перевода, я бы рекомендовал deepl вместо гугл переводчика, он намного точнее переводит европейские языки
По идее ты можешь в том же комфи вывести текст после декодера, у тебя пиздюк qwen 4b вполне может потеть дополнительно и переводит сверху, но это из головы я взял, хз как там на самом деле

Аноним 29/11/25 Суб 16:55:03 № 1434749 168

>>1434682
SD1.5 выкопали и дотюнили. Теперь все в ахуе.

Аноним 29/11/25 Суб 17:12:16 № 1434775 169

>>1434477
>>1434581
>>1434490
В комфи есть десяток нод паков, куда запихнули имплементацию простого RemBG.

К примеру, тут https://github.com/yolain/ComfyUI-Easy-Use есть easy imageRemoveBG

Вроде в WAS нод паке тоже есть такое же

Аноним 29/11/25 Суб 17:17:12 № 1434786 170

>>1434479
А этот Афтер эффект может покадрово сохранять или только видео?

Аноним 29/11/25 Суб 17:18:16 № 1434789 171

>>1434775
О! Надо попробовать!
Спасибо!

Аноним 29/11/25 Суб 17:18:54 № 1434791 172

>>1434477
Вот так с помощью remove bg получается. Ещё можно с помощью clipseg такое провернуть.

Аноним 29/11/25 Суб 17:28:00 № 1434800 173

>>1434791
О! Круто!
А можешь Воркфлоу скинуть?
Это сильно сэкономит время!

Аноним 29/11/25 Суб 17:34:33 № 1434805 174

z - хуйня. может когда базовую версию выпустят будет норм обучение, но пока на том, что есть, нормально лору еот не обучить

Аноним 29/11/25 Суб 17:36:58 № 1434806 175

>>1434662
>Длинный текст везде как говно
Пишу инфу для всего треда. Хотите мелкие детали правильно - используйте большую разрядность бит.
Вот генериции Z image (не совсем стандартные настройки, но отражают суть)
1пик bf16
2пик fp8
3пик fp8 fast

Аноним 29/11/25 Суб 17:39:43 № 1434812 176

>>1434800

Аноним 29/11/25 Суб 17:41:48 № 1434816 177

>>1434806
Совпадает со сравнением на реддите bf16 и fp8, там как раз заметен проёб мелких деталей, было бы у меня 16 гб врама, я бы первую конечно поставил, а чё такое fp8 fast?

Аноним 29/11/25 Суб 17:44:38 № 1434821 178

>>1434816
>чё такое fp8 fast?
Это.

Аноним 29/11/25 Суб 17:45:22 № 1434823 179

>>1434812
Благодарю!
Буду осваивать.

Аноним 29/11/25 Суб 17:48:40 № 1434830 180

я помню примерно пол года год назад был какой то интеррогатор на обнимиморде который смотрел теги с картинки и выдавал результаты в районе 95%-97% аккуратности и это пока все еще в альфа версии, мог хоть данбору тегами хоть прозой хоть еще как и даже хитмапу картинки составлял
но я забыл имя, напомните

Аноним 29/11/25 Суб 17:48:52 № 1434832 181

>>1434816
Скажем, на 3060 (12 vram) - fp8 медленее чем fp16! Процентов на 5, но сам факт. Для zimage имеет смысл fp16 пробовать всегда, даже если она целиком в карту не лезет.

Аноним 29/11/25 Суб 17:51:52 № 1434839 182

>>1434832
У меня просто вьетнамские флешбеки после попытки ллмку здоровую запихать в 3060, что комп повис намертво.
Там вышел сладкий сисек и писек лора но с нюансом
https://civitai.com/models/2174081/photoreal-betternudes-z-image-turbo?modelVersionId=2448574

Аноним 29/11/25 Суб 18:02:52 № 1434854 183

>>1434830
https://huggingface.co/spaces/fancyfeast/joy-caption-alpha-two
или ноды https://github.com/fpgaminer/joycaption

Аноним 29/11/25 Суб 18:08:44 № 1434861 184

>>1434854
я чето думал что вд таггер потому что нашел его в закладках и он выдает идеально
после сравнения я даже скажу что вд лучше и полнее джой даже персонажа не узнал и назвал другим именем в то время как вд выдал 99.9% уверенность и сделал это аккуратно

Аноним 29/11/25 Суб 18:09:51 № 1434863 185

>>1434821
Где ты его взял и в чём отличие от просто fp8 той же версии?

Аноним 29/11/25 Суб 18:13:42 № 1434866 186

Как же хочется норм лор для зетки на сисик-писик. Потому что писика считай нет, а сисик унылый, ореолы стрёмные какие-то...

Аноним 29/11/25 Суб 18:15:02 № 1434871 187

>>1434477
birefnet
Для аниме есть отдельный файтюн

Аноним 29/11/25 Суб 18:23:11 № 1434878 188

>>1434871
Спасибо.
Почитаю что это.

Аноним 29/11/25 Суб 18:23:18 № 1434879 189

>>1434806
Между fp16 и fp8 гораздо больший провал в качестве, чем между fp16 и Q8 (или даже Q4_K_M).

>>1434863
ты еще вот эту хуйню не видел https://huggingface.co/Kijai/Z-Image_comfy_fp8_scaled/tree/main
тоже не ясно зачем

Аноним 29/11/25 Суб 18:38:20 № 1434902 190

>>1434711
> модель русский язык понимает в разы лучше?
верим

Аноним 29/11/25 Суб 18:40:05 № 1434906 191

>а почему вы пишете промты на инглише, если модель русский язык понимает в разы лучше?
Напишу для всего треда и конкретно для самых умных >>1434711
Вот к этой картинке промпт на китайском https://civitai.com/images/111972250
В промпте челик поднимает гёрл за ОДНУ ногу и только на китайском это генерится правильно. На остальных языках он тащит ее за обе ноги.

Аноним 29/11/25 Суб 18:41:55 № 1434911 192

>>1434879
> или даже Q4_K_M
бляяять гугуф мафия опять дурит народ абсурдными небылицами

Аноним 29/11/25 Суб 18:59:51 № 1434939 193

>>1434866
лучше когда меньше нагаторооты
В общем хер знает с какого хуя проблемы у Z-ки с инглишом.
Когда пишешь raising her skirt to reveal sexy panties не поднимает платье полностью, а если пишешь raising her skirt revealing sexy panties то поднимает.

Аноним 29/11/25 Суб 19:24:39 № 1434978 194

Кто-нить пробовал привинтить вместо обычного qwen3 4b например abliterated версию? Если работает, то видна ли разница?

Аноним 29/11/25 Суб 19:31:02 № 1434980 195

>>1434978
Там любая версия 4B подойдёт, я тестил. Всякие Instruct, Thinking, Embedding - по моему артефачат, особенно последний. А вот разные версии обычного 4B - вроде бы без проблем.
Так что по идее должно завестись.
Вот только не факт, что цензура и в базовой версии в таком режиме работы присутствует.

Аноним 29/11/25 Суб 19:45:07 № 1435001 196

https://www.reddit.com/r/StableDiffusion/comments/1p9m78k/humans_of_zimage_how_many_celebrities_can_you_fit/

челик затестил зетку на понимании селеб

Аноним 29/11/25 Суб 19:49:32 № 1435005 197

>>1434939
ну как минимум в первом случае предложение грамматически неправильно составлено, а во втором правильно

Аноним 29/11/25 Суб 20:01:34 № 1435039 198

>>1434939
>В общем хер знает с какого хуя проблемы у Z-ки с инглишом.
Это у тебя, а не у нее проблемы с английским.
"raising her skirt to reveal" в этой фразе, при таком ее построении,
оно именно и значит, что действие еще выполняется (поднятие сейчас в процессе) для того, чтобы "показать в финале". Но сам финал еще не наступил, он в будущем относительно момента. Потому юбка "в процессе".
А "raising her skirt revealing" - прошедшее время для всего, "она поднимала чтобы показать" - и действие уже как бы закончилось, и логично отображать его финал - полностью поднятую юбку.

Времена в английском - это особая уличная магия, мало что их не три как в русском, так еще и небольшое изменение меняет весь смысл. :)

Аноним 29/11/25 Суб 20:07:04 № 1435057 199

>>1433480 (OP)
Ну не работает и всё тут!!!
Вроде все из воркфоу по ссылкам забрал, что нужно я хз.

Аноним 29/11/25 Суб 20:12:47 № 1435064 200

>>1435039
Как поменять прмомпт чтобы было не как на пике, а понятно как хотим:
On a path in the woods a girl of 25 years old dressed in a skirt and black T-shirt shows red panties on herself

Аноним 29/11/25 Суб 20:13:08 № 1435065 201

>>1435057
мне кажется связанно с твоим гуфом, попробуй не I квантованную модель, а просто Q, как у тебя бля в записке указано

Аноним 29/11/25 Суб 20:13:24 № 1435066 202

>>1435057
Обнови ноду гуфа.

Аноним 29/11/25 Суб 20:13:56 № 1435068 203

>>1435057
и обнови Comfy-GGUF

Аноним 29/11/25 Суб 20:21:43 № 1435081 204

>>1435065
>>1435066
>>1435068
Поставил обычный Q, обновил ггуфы, то же самое!

Аноним 29/11/25 Суб 20:27:08 № 1435086 205

>>1435064
>Как поменять прмомпт чтобы было не как на пике, а понятно как хотим
Не сочти за троллинг, но скажи прямо - что именно ты от нее хочешь? Т.к. пик идеально соответствует написанному тексту - сказано было: показать трусы на себе, будучи одетой в то-то и то-то - она и показывает (примеряет на себя, как в магазине). А телепатией, я увы, не владею (как и энкодер).
Но все же, если тебе хотелось чтобы трусы на ней были, и она юбку задрала чтобы их показать, то начинать примерно с такого:

On a path in the woods a 25 years old girl dressed in a black T-shirt and black skirt with a red panties under it shows her panties by raising the skirt.

Аноним 29/11/25 Суб 20:29:52 № 1435088 206

>>1435086
>>1435064
Проигрываю с вас постоянно. Почему бы по русски не сказать, лол.

Аноним 29/11/25 Суб 20:30:32 № 1435089 207

Еще в словах копаются, точную грамматику ищут лол

Аноним 29/11/25 Суб 20:40:51 № 1435100 208

>>1435088
Он неправильно мысль сформулировал, там нихуя не было про поднятие подола

Аноним 29/11/25 Суб 20:45:42 № 1435106 209

>>1435088
Лично я - не против. Говори как удобно.
Но на английском получается точнее, более мелкие/вторичные детали изображения контролируются лучше-быстрее-удобнее. Вроде нюансов того кролика с пилой выше по треду. А лично мне - без разницы на каком языке писать, вот и пишу сразу на английском.
Хватает русского - так на здоровье.

Аноним 29/11/25 Суб 20:49:28 № 1435112 210

>>1435106
Но там не совсем получилось же, с кроликом. Ну и нормальные модельки типа нана бананы или квена без ебли с промтами все хорошо понимают. А тут конечно не так.

Аноним 29/11/25 Суб 20:49:54 № 1435114 211

>>1435066
>>1435068
Странно в менеджере гуфов установленных не было хотя по факту ноды были установлены, кароч обновил до 1.1.8.
Теперь такое пишет!
Ставил Q и UD-I, всё одно.

Аноним 29/11/25 Суб 20:50:16 № 1435115 212

>>1435081
попробуй обновить через менеджер в comfyui, если уже пробовал обновлять через git pull в кастом ноде. Напиши в поиске gguf в менеджере и обнови, что найдешь.

Аноним 29/11/25 Суб 20:57:19 № 1435123 213

>>1435115
Из папки удалил гуфы и заново поставил через менеджере.
>>1435114
Такое теперь.

Аноним 29/11/25 Суб 20:58:15 № 1435124 214

>>1435114
бля а ты выбрал lumina2 в CLIP Loader? Какого-то хера он у тебя про лламу пишет

Аноним 29/11/25 Суб 20:59:48 № 1435129 215

По моему тут весь comfyui нужно обновлять.
И да: если desktop версия, то она обновления позже получает, чем portable.

Аноним 29/11/25 Суб 20:59:52 № 1435130 216

>>1435088
> image.png
> кондиционирование
Ну ты и латентный конечно...

Аноним 29/11/25 Суб 21:03:17 № 1435135 217

промт

>девушка. ее тело сделано из гамбургеров

Первый пик квен. Второй пик зимаг.

Зимаг выебан со свистом. инбф фотореализьм

щас анон будет джва часа писать хитровыебанный промт, учитывая вес каждой запятой, чтобы модель повторила

Аноним 29/11/25 Суб 21:04:44 № 1435136 218

>>1435130
Про двачефобию пнг еще с /p/ знаю. Но там сидят психически больные. Причем реально больные, со справками. Сюда тоже добрались?

Аноним 29/11/25 Суб 21:04:46 № 1435137 219

>>1435124
Конечно

Аноним 29/11/25 Суб 21:06:01 № 1435139 220

>>1435112
Так ты сравнил - корпу и модель с энкодером 7b и модель где энкодер всего лишь 4b.
Если ты никогда текстовые модели не пускал - 7b - это "грань разумности". Ниже нее текстовая модель, по сути, нормально может лишь выполнять механические задачи - вроде дословного перевода, или чего-то подобного. 4b - это достаточно, чтобы механически разобрать текст следуя синтаксису и правилам языка, но совершенно недостаточно, чтобы что-то угадывать по косвенным признакам.
Так что здесь писать надо правильно и подробно, со всеми нюансами, которые желаешь увидеть. Что напишешь - то и получишь.

Аноним 29/11/25 Суб 21:06:33 № 1435140 221

>>1435114
Скачал Qwen3-4B-UD-IQ3_XXS.gguf затестить, и он у меня тоже не пашет, выдаёт ошибку.
Qwen_3_4b-Q8_0.gguf работает без проблем

Аноним 29/11/25 Суб 21:07:35 № 1435142 222

zzzzz555.png 10Кб, 672x136

>>1435129
У меня гитхаб версия, я нажал абдейт в менеджере, и перезагрузился. Толку нет.

Аноним 29/11/25 Суб 21:10:13 № 1435145 223

>>1435136
Речь шла про "переведенные" надписи на нодах.

Аноним 29/11/25 Суб 21:10:15 № 1435147 224

>>1435114
>>1435140
>>1435142
>>1435137

у меня пик
короче твоя комфи не обновилась.

Аноним 29/11/25 Суб 21:11:26 № 1435149 225

>>1435135
и хули

Аноним 29/11/25 Суб 21:11:51 № 1435150 226

>>1435145
мне передать твой привет переводчикам (чату гпт)? я прекрасно знаю английский, меня не смущает. фобии нет.

Аноним 29/11/25 Суб 21:13:35 № 1435153 227

>>1435135
>щас анон будет джва часа писать хитровыебанный промт
Не, дальше мне уже не интересно. Я вообще не брался доказывать, что zimage лучше понимает запросы или превосходит что-то просто потому, что zimage.
Я просто показывал, как с ней обращаться, чтобы сравнимый результат получить. Трех раз хватит для примеров, кому это надо. А модели сравнивать "какая больше ебет" - это мне не интересно. Я просто буду использовать то, что больше под ситуацию подходит. :)

Аноним 29/11/25 Суб 21:15:05 № 1435156 228

>>1435150
Хоть в спортлото передай. Я просто развеселился с твоего интерфейса, выдохни.

Аноним 29/11/25 Суб 21:17:23 № 1435159 229

>>1435149
Оказывается для нее большая разница консист и мэйд. Говорю же - понимание на уровне sd 1.5. Точность нужна неимоверная. Для квена нет.

>>1435153
Забей.

Аноним 29/11/25 Суб 21:18:02 № 1435160 230

>>1435156
уфф.. я уж собрался таблетки пить.

Аноним 29/11/25 Суб 21:19:57 № 1435163 231

то есть по русски не поняла. совсем. понятно. вы правы все были.

Аноним 29/11/25 Суб 21:20:50 № 1435165 232

пацаны, qwen image 8fp жрет около 70 гигов рам, поставил файл подкачки. вроде робит и даже не сказать что долго считает. но пиздец бесит что пока считает комп тормозит начинает что не свернутся даже двач любимый не полистать. мб как то можно пофиксить на уровне винды, разбирался кто?

Аноним 29/11/25 Суб 21:22:53 № 1435170 233

>>1435159
это который на 20 миллиардов квен? круче z v гойда имедж на 6 милилардов? да ну нахуй? не может быть

Аноним 29/11/25 Суб 21:23:14 № 1435174 234

Запустил квен3 4б в кобольде. В запросе на русском выдает каламбур из трёх языков в перемешку (русский, английский и китайский). Вот и думайте.

Аноним 29/11/25 Суб 21:23:19 № 1435175 235

>>1435142
Ты ее через git clone ставил, или просто архив с гитхаба скачал? Если второе - нихрена ты ее через менеджер не обновишь, т.к. механизм обновления через git работает рассчитывая что это локальная копия репы, а не просто файлы в каталоге.

Аноним 29/11/25 Суб 21:25:11 № 1435179 236

Это такие рофлы в треде или что? От 4B модели от китайцев ожидать отличного (или хотя бы хорошего) понимания русского. Пздц.

Аноним 29/11/25 Суб 21:29:42 № 1435186 237

>>1435179
Тут вообще некоторые делулу тотальные, один на русском пишет так, будто ему приказ дал из могилы лично Пушкин и никак иначе, другой модели сравнивает отличающиеся по размеру в разы, третий ныл что модель хуйня нельзя позы точно делать и может то и это, модель, которые двое суток и к которой руки не надрочены во всех смыслах, лор нет нормальных

Аноним 29/11/25 Суб 21:37:23 № 1435196 238

>>1434805
> нормально лору еот не обучить
Все уже второй день обучают на твою еот. Только правильно конвертить надо:
>>1435072 →

Аноним 29/11/25 Суб 21:37:24 № 1435197 239

Прогнал простенький промпт на четырёх сидах подряд.
Расцензуривание текстового энкодера походу роляет.

Аноним 29/11/25 Суб 21:46:54 № 1435213 240

>>1435196
не надо ничего конвертить, в комфи уже всё пофиксили, нужно только пару файлов заменить

Аноним 29/11/25 Суб 21:47:53 № 1435218 241

>>1435197
Что это за шаурма?
Уж лучше поняша, никакие расцензуривания нахуй не нужны.

Аноним 29/11/25 Суб 21:50:59 № 1435226 242

>>1435218
>NSFW Fine-tune
>Turbo Distill, которому меньше недели. Даже не базовая версия. И без LoRa.
>Сравнивать их.
Чё?..

Аноним 29/11/25 Суб 21:56:59 № 1435230 243

Анон, посоветуй нубу нормальный гайд по комфи. Может в треде кто-то делал уже? Желательно для самых даунов чтоб точно ничего не упустить, с максимальным разжевыванием.
После обновления пк решил перекатиться на локалки, до этого юзал онлайн-нейронки по типу пиксаи, причем для работы, выжимал из этого анимешного кала все что мог

Аноним 29/11/25 Суб 21:58:17 № 1435232 244

>>1435147
>>1435175
Да, дело было в комфи, обновил, заработало, спасибо!
Я не знаю как надо гитхаб версию правильно обновлять, попробовал через менеджер абдейт комфи но в логах пишет фейл и всё тут. Тупо удалил папку, и из корневой вызвал клон, чето там поставилось, теперь работает.

Аноним 29/11/25 Суб 22:11:16 № 1435251 245

>>1435230
Совсем нубасику я бы Stability Matrix посоветовал, там и комфи есть и можно качать модели прям оттуда же

Аноним 29/11/25 Суб 22:20:32 № 1435272 246

>>1435251
Совсем нубу все также надо сразу начинать разбираться с обычным комфи. Просто гуглить возникающие вопросы. А то так и будет на матриксе сидеть. Не познает всю радость пердолинга зависимостей и ёбки с ебучим питоном.

Аноним 29/11/25 Суб 22:32:25 № 1435292 247

>>1435272
А нахуя это надо? Если ты не линуксоид и у тебя от этого шишка не привстаёт сильнее любой 1girl. Матрикс сам обновит всё что нужно, оттуда же можно расширения ставить и не будет ёбки как у чела выше

Аноним 29/11/25 Суб 22:37:29 № 1435301 248

>>1434261
>Что происходит на пикче?
Это очевидная ничтожная и провальная попытка повторить дегенеративные DALL-E генерации индусов, летающих на струях поноса. Даже сиситивифишайдашкам на месте, который в далитредах использовали для обхода цензуры, орнул с такого каргокультизма.

Аноним 29/11/25 Суб 23:32:36 № 1435376 249

Татарочка с деревушке

Аноним 29/11/25 Суб 23:34:02 № 1435378 250

>>1435376
Че за швабра с подсолнухом сверху в гуся воткнута?

Аноним 29/11/25 Суб 23:48:38 № 1435397 251

>>1435137
ЧТО ТЫ ЗА ЧЕЛОВЕК ЧТО ТЕБЕ Q3 ГУГУФ И БЕЗ ТОГО ПЯТИГИГОВОЙ МОДЕЛИ ПОТРЕБОВАЛСЯ, ЧТО БЛЯТЬ СО ВСЕМИ ВАМИ НЕ ТАК

Аноним 29/11/25 Суб 23:51:05 № 1435401 252

>>1435186
ад пуст все черти здесь

Аноним 29/11/25 Суб 23:52:31 № 1435403 253

>>1435376
На разделку забили, обычного дело в деревне.

Аноним 29/11/25 Суб 23:54:06 № 1435405 254

>>1435403
ебать животные нпс, попробуй им эмоций добавить

Аноним 30/11/25 Вск 00:15:35 № 1435430 255

>>1435397
>>ПЯТИГИГОВОЙ МОДЕЛИ
Где ты 5 гигов увидел?
Те же Q8_0 весят 7.22 GB
не говоря уже о не квантованной модели.

Аноним 30/11/25 Вск 00:22:00 № 1435440 256

>>1435397
Да забей хуй ты на них. Видишь гуф ебаный сразу скрывай пост. Поехавшие кукухой не могут как нормальные люди генерить.

Аноним 30/11/25 Вск 02:07:37 № 1435539 257

Хуя гуфоговноедов прорвало. Ору с того, что они защищают явно кал.
мимошёл

Аноним 30/11/25 Вск 02:11:31 № 1435543 258

Я чё зашёл. Оказалось старые апскейлеры, что все юзают всегда - нихуя не годятся для зетки. Она генерит сразу хорошую картинку, но апскейлеры сглаживают детализацию и не работают как хайрезфикс именно с зеткой. Может кто уже подобрал что-то годное, чтоб апскейл улучшал и делал картинку чётче? Иди забить и генерить сразу в высоком разрешении?

Аноним 30/11/25 Вск 02:13:49 № 1435544 259

в

Аноним 30/11/25 Вск 02:50:26 № 1435563 260

Раскачегарил свою 7900gre 16gb до 4it/s в SDXL, задавайте ответы лол.
Попробовал wan2.2, конечно пиздец тухло, 300 секунд на шаг. По итогу 15 минут генерил и не дождался.

Аноним 30/11/25 Вск 03:08:30 № 1435578 261

>>1435563
изи, генеришь в 512, апскейлишь сидвром, получаешь хайрез за наносек с цпу оффлоад

Аноним 30/11/25 Вск 03:31:47 № 1435590 262

Аноним 30/11/25 Вск 03:35:49 № 1435592 263

>>1435543
>Она генерит сразу хорошую картинку

Не сказал бы. Скорее, довольно посредственную, при этом слабо воспринимает prompt, по сравнению с другими моделями.

В конце-концов, можно сказать, что Z-Image выдаёт терпимый результат для своего размера. При этом не на настройках workflow, предлагаемых по умолчанию. (Пикрил 1)

>Может кто уже подобрал что-то годное, чтоб апскейл улучшал и делал картинку чётче?

Как и для всего остального теперь, использую SeedVR2. (Пикрил 2).

Аноним 30/11/25 Вск 03:39:23 № 1435598 264

>>1435592
>SeedVR2
Попробовал. Сильный перешарп, если и сурса апскейлить. Вот если сурс уменьшить в 2 раза и потом через сидвр апскейлить до размера сурса, то чуть лучше. Но всё это слишком рандомно. Сидвр не фиксит косяки, т.к. в нём нет понимания промпта и он делает апскейл тупо очень.

Аноним 30/11/25 Вск 04:02:19 № 1435611 265

>>1435598
Тебе «шашечки» или «ехать». Тебе апскейлер или рефайнер? Ты определись.

>Сильный перешарп, если и сурса апскейлить.
Смотри настройки.

>Сидвр не фиксит косяки
>делает апскейл тупо очень.

Апскейлер делает апскейл. Вот это неожиданность.
SEEDVR2 не рефайнер, а апскейлер по своему основному сценарию использования. Некоторые малозаметные детали текстур он может привнести (в зависимости от значения denoise).
Каждый инструмент под свою задачу.

Аноним 30/11/25 Вск 04:30:28 № 1435632 266

>>1435611
Апскейлер всегда нужен только для одной цели - качественный хайрезфикс. Кому нужно вообще это разрешение 2к и выше для кого, смысл? Цель была у всех одна - нормальная картинка без косяков типа кривых глаз и проводов и т.п.
В Z-image turbo эти самые дефолтные настройки идеальны и не нужно менять ни кфг, который 1, ни шаги увеличивать, которые 9. Иногда как плацебо - шифт покрутить, но только чтоб отличалась композиция.
У него и так всё с качеством и детализацией хорошо. Я к тому писал выше, что в редких случаях нужен фикс, сам апскейл нахер не нужен как таковой - это бред.
Хз что ты там про НЕ_СТАНДАРТНЫЕ настройки пишешь. Да можно сде с ддим и будет как на 2м пикреле, но по времении это в 10 раз дольше, чем дефолт 1й пикрел. Смысла нет.

Аноним 30/11/25 Вск 04:57:05 № 1435644 267

>>1435159
>понимание на уровне sd 1.5
Как сделать чтоб он понял (camel toe) ?

Аноним 30/11/25 Вск 05:03:48 № 1435648 268

Что-то начало получаться с «FLUX.2». (Жалко было выбрасывать скачанное, после первого неудовлетворительного опыта использования).
После изучения черрипикнутных примеров из гайда для промптинга «FLUX.2» с целью выявления их особенностей, пришёл к следующим выводам:

1) Генерировать в выходном разрешении не менее 1440x1440 пикселей;
2) Установить guidance в 3.5;
3) Перейти на JSON структуру promptов (с использованием соответствующих custom nodes типа «ComfyUI-FLUX2-JSON» для корректного построения JSON-размеченного prompt).

Тогда получается подобие того самого заявленного следования promptу и его деталям, и результаты, отдалённо напоминающие черрипикнутые примеры «FLUX.2».

Аноним 30/11/25 Вск 06:58:46 № 1435719 269

image.png 9Кб, 324x99

>>1435430

Аноним 30/11/25 Вск 07:12:01 № 1435722 270

>>1435153
>Я просто показывал, как с ней обращаться, чтобы сравнимый результат получить. Трех раз хватит для примеров, кому это надо
От меня спасибо, Анон. Знай, что здесь есть люди кто благодарен за помощь.

Аноним 30/11/25 Вск 07:27:14 № 1435729 271

>>1435197
О, я аблитерейтед сразу на релизе Z скачал и много тестил. Иногда оно изображение херит, так что это фифти фифти

Аноним 30/11/25 Вск 07:48:55 № 1435732 272

Аноним 30/11/25 Вск 08:28:57 № 1435736 273

>>1434275
Как же ору со всей это тряски реддит/4ч где не просто восхваляют z image, а хейтят флакс при этом.
Буквально нищета мозга, модель хуйня лишь потому, что я не могу её запустить, а вот з имаге могу, значит оно ебет флакс

Аноним 30/11/25 Вск 08:55:35 № 1435741 274

>>1435736
Оно местами и ебёт флюкс если промпт на китайском писать.

Аноним 30/11/25 Вск 08:55:45 № 1435742 275

>>1435736
А нам ты это нахуй здесь пишешь, долбоёь

Аноним 30/11/25 Вск 09:17:29 № 1435758 276

>>1435742
кому "нам"?

Аноним 30/11/25 Вск 09:22:08 № 1435762 277

>>1435758
,мне себе и ему

Аноним 30/11/25 Вск 09:24:30 № 1435764 278

Не в службу, а в дружбу.
Нужен сын маминой подруги с большой видеокартой.
Можете апскейльнуть до 2к, и чтоб она выглядела более естественно? Ещё чуть бубисы побольше. Ничего страшного если лицо чуть пофиксится.
Мне не дрочить
Нужен качественный исходник для дальнейшей работы.

Аноним 30/11/25 Вск 09:28:55 № 1435766 279

>>1435764
Чтобы апскейлнуть нормально нужен исходник т.к сначала идет генерация самой картинки и потом прогон через еще одну генерацию для апскейла
А то что ты ищешь это нейрохрючево апскейл до 1ккк которого навалом онлайн

Аноним 30/11/25 Вск 09:31:18 № 1435768 280

По поводу русика: промпт одинаковый, но на русском вместо шпица почему-то странный йорк.

Крупный план милого, очень пушистого шпица на белом фоне
Close-up of a cute, very fluffy Spitz on a white background

Аноним 30/11/25 Вск 09:38:35 № 1435779 281

>>1435768
Теперь на китайском попробуй. По моим тестам на китайском модель в 10 раз лучше работает.

Аноним 30/11/25 Вск 09:42:31 № 1435782 282

Аноним 30/11/25 Вск 09:44:13 № 1435783 283

>>1435779
Нормально. Но в пушистость не очень умеет.

Аноним 30/11/25 Вск 09:47:25 № 1435784 284

>>1435779
Ага, ща тока быстренько китайский выучу.
Если ты про переводчики - они все кал, не просто так это сложнейший язык

Аноним 30/11/25 Вск 09:47:25 № 1435785 285

>>1435779
>>1435783
Алсо, на китайском он очень стремиться показать сисик, даже если сцена абсолютно нейтральная. Хз почему, использую DeepL.

Аноним 30/11/25 Вск 09:49:12 № 1435786 286

>>1435784
Не знаю что у тебя там за кал, но я уже изображений 30 сравнил на китайском через переводчик и на ру/инглиш. Почти всегда китайский через переводчик побеждает.

Аноним 30/11/25 Вск 09:50:56 № 1435788 287

>>1435165
> мб как то можно пофиксить
да, скачай ГГУФ версию модели

Аноним 30/11/25 Вск 10:01:18 № 1435790 288

>>1435766
ну вот она, картика для прогона через апскейл
ты думаешь латент из семплера и латент из вае энкод чем-то отличаются?

Аноним 30/11/25 Вск 10:38:48 № 1435798 289

>>1435788
чё с ебалом? Какой нахуй 2к

Аноним 30/11/25 Вск 10:42:58 № 1435801 290

>>1435165
О, жиза, но не прям зависает и не всегда, а немного лагает во время переключения между моделями, если находиться в окне комфи. У тебя подкачка на системном ссд? У меня на втором, там же где модели. Может, если ставить на тот, где нет системы и нет моделей, то не будет лагать. Ну или попробовать пожрать гуффов. Я пару раз затестил, сходу не увидел разницы в производительности, обратно поставил фп8.
16V+64R+32 подкачки

Аноним 30/11/25 Вск 10:44:49 № 1435802 291

>>1435719
Чувак я хз из каких источников ты его брал!
Я нашел только гуфы и бф16, больше ничего нет, scaled версии не нашел. В мэйн репозитории вообще какой то понос лежит, хуй знает для кого.

Аноним 30/11/25 Вск 10:47:40 № 1435804 292

>>1435802
> scaled версии не нашел
От Киджая есть нормальная.

Аноним 30/11/25 Вск 10:48:51 № 1435805 293

zzzz777777.png 14Кб, 749x155

>>1435804
Я думал это клипы!
Как понять это клипы или диффузия?

Аноним 30/11/25 Вск 11:11:48 № 1435819 294

>>1433480 (OP)
И че как вам этот Я имейдж? Лучше сдохли? Он может в контролнеты, инпеинты, в генерацию анимедевок, в буру теги и так далее и так далее?

Аноним 30/11/25 Вск 11:23:54 № 1435827 295

>>1435819
В быдло контент может хорошо. На большее не способен. Поэтому мастхев для анона.

>контролнеты
Эту хуйню давно убили эдиты.

Аноним 30/11/25 Вск 11:25:01 № 1435828 296

Анончики протестируйте флюкс 2 для image edit

Аноним 30/11/25 Вск 11:31:04 № 1435835 297

>>1435828
Протестируй на LMarena

Аноним 30/11/25 Вск 11:42:37 № 1435839 298

>>1435827
>Эту хуйню давно убили эдиты.
Ну не скажи. Вот если мне нужна какая-то прям специфическая поза, которую словами легко не описать, а вот контролнет заюзать с референс позой вообще изи. Или что ты имеешь ввиду? Что за эдиты?

Аноним 30/11/25 Вск 11:44:22 № 1435842 299

>>1435839
> если мне нужна какая-то прям специфическая поза, которую словами легко не описать
то стоит научиться выражать ясно свои мысли.

Аноним 30/11/25 Вск 11:48:17 № 1435844 300

>>1435842
Потужно. Всё равно референс поза проще, чем надеятся, что ИИ поймет по словам что ты от него хочешь. Или можно в фотошопе отредактировать картинку, а потом прогнать её через апскейл с коэффициентом апскейла 1.

Аноним 30/11/25 Вск 11:54:18 № 1435849 301

Уже сейчас в турбо вложен какой-то едит или референс генерация скорее. Очень трудно промптить так как возможно енкодер не заточен в такое. На пиках не стандартное и2и.

Аноним 30/11/25 Вск 11:56:49 № 1435855 302

>>1435835
попробовал. такое себе

Аноним 30/11/25 Вск 12:11:52 № 1435869 303

Короче ясно, сдхл это реально посланый богами свыше инструмент, который до сих пор никто так и не смог превзойти не смотря на прогресс в ИИ.

Аноним 30/11/25 Вск 12:22:24 № 1435881 304

>>1435819
>Я имейдж? Лучше сдохли? Он может в контролнеты, инпеинты, в генерацию анимедевок, в буру теги и так далее и так далее?
>>1435869
>сдхл это
Включи в своей рабочей модели sdxl лору dmd2 с весом 1 в обязательном порядке и попробуй всё, что ты перечислил. Или ты так и делаешь? Сейчас Z image turbo это dmd2

Аноним 30/11/25 Вск 12:41:21 № 1435916 305

>>1435798
> 768x1024

Аноним 30/11/25 Вск 12:45:30 № 1435922 306

>>1435805
какие нахуй клипы

Аноним 30/11/25 Вск 12:48:32 № 1435924 307

>>1435827
нахуя эдиты если генеришь с нуля

>>1435842
высрал кринж

Аноним 30/11/25 Вск 13:50:05 № 1435987 308

Латентное пространство Z Image совместимо с Flux Shcnell пик2, Chroma пик3, Krea пик4!
Или наоборот, можно рефайнить генки от Зет на Хроме. А уж хрома-то побольше понимает в голых телах.

Аноним 30/11/25 Вск 13:55:36 № 1435995 309

Моя любимая нейронка Yuri Image. Первый промпт на английском, второй на китайском. Броня чуть лучше стала и освещение тоже, но нужно тестить на больших запросах с кучей персонажей, с текстом оба с русского переведены

Аноним 30/11/25 Вск 13:56:10 № 1435996 310

>>1435987
> рефайнить генки от Зет на Хроме
идея неплохая, но пока все упирается в почти полное отсутствие вариаций. я лучше изначально на хроме буду генерить с меньшим количеством степов и разрешением, а потом рефайнить.

Аноним 30/11/25 Вск 13:58:17 № 1435998 311

>>1435995
Это просто разные сиды из за промпта, чел.
На втором просто солнышко выглянуло, хватит коупить

Аноним 30/11/25 Вск 13:59:29 № 1436000 312

>>1435998
> разные сиды
> из за промпта

Аноним 30/11/25 Вск 14:00:14 № 1436002 313

>>1435998
Любитель ЗАПРОСА на русском, ты?

Аноним 30/11/25 Вск 14:03:44 № 1436008 314

>>1436000
Ну ты же коупишь сравнением, значит это один сид.
Но генерация меняется с промптом, считай это другой сид.

Аноним 30/11/25 Вск 14:44:06 № 1436057 315

>>1434441
Не хуйно? Это роллинг стоунс типо?

Аноним 30/11/25 Вск 14:46:49 № 1436063 316

>>1435987
Ого, а вот это уже интересно!

Аноним 30/11/25 Вск 14:50:49 № 1436074 317

>>1436002
я любитель ПОДСКАЗКИ, а ты???

Аноним 30/11/25 Вск 14:52:26 № 1436078 318

>>1436008
промпт это промпт
сид это сид

Аноним 30/11/25 Вск 16:08:28 № 1436126 319

Народ кто-нибудь в курсе как запромптить whale tail?
Получается все время полностью обнажение, а нужно чуть-чуть Z-IMAGE, дада знаю, что через edit qwen можно, но хочется нативно через промптинг пердолинг, МБ у кого есть база на how to prompt like a boss для ZZZ?

промпт:
"A professional digital photo of a girl, from behind. The girl is 18 years old, Russian, blonde, a long single braid on her shoulder, hazel eyes, thick puffy lips. She is wearing white strapless crop-top, white g-string panties with thin lace straps, pink sweatpants, big silver hoop earrings. Naked upper glutes seen. Royal ancient Greek style decoration on the background. Magazine style background with a stylized neon title says "2CH.HK" above her head."

Аноним 30/11/25 Вск 16:28:20 № 1436152 320

>>1435819
Как земля.
Про маняме ничего не знаю.

Далее:
ControlNet: нет;
Inpaint: нет;
Edit: нет;
I2I: нет;
Только T2I.
Следование promptу на английском: посредственное/удовлетворительное с переходом в неудовлетворительное.
Использование JSON-размеченных promptов (которые Z-Image поддерживает на манер FLUX.2) не особо помогает.

Аноним 30/11/25 Вск 16:40:57 № 1436165 321

>>1435819
Это как sd3.5 который должен был выйти тогда, но не смог, можно генерить красиво в 1600x1200 (Я бы выложил, но там сплошные бабы). Умеет в текст и даже русский и даже хорошо, пока вышла турбо модель, генерить можно за 17 секунд. Кайф? Да пиздец, после флюксокалов на 96гб врам, это будто бы последняя надежда.

Аноним 30/11/25 Вск 16:57:33 № 1436179 322

>>1436126
>2CH.HK
Двач, который мы потеряли.

Аноним 30/11/25 Вск 17:13:07 № 1436209 323

Анончик, разобрался с Qwen и Compy
Нашел вот тут кучу примеров
https://github.com/comfyanonymous/ComfyUI_examples

Но, где взять вот те нунчаку модели?
Нужно брать сразу VAE, Checkpoint и Clip?

Аноним 30/11/25 Вск 17:13:57 № 1436213 324

>>1436209
И у меня картинка на RTX 5060 16Gb рендерится с минуту.
Это можно ускорить?

Аноним 30/11/25 Вск 17:14:18 № 1436214 325

>>1436165
>Я бы выложил, но там сплошные бабы
Есть те, кто что-то другое генерят?

Аноним 30/11/25 Вск 17:21:08 № 1436232 326

4592b21ef113e7e[...].jpg 104Кб, 1000x562

>>1436214
Ну я порой зайду на цивит, а там и котики и всякая милота и в моменте такой мразью себя ощущаю, но потом снова берусь за дело...

EAT --- SLEEP --- GEN NSFW

Аноним 30/11/25 Вск 17:23:27 № 1436235 327

>>1434477
Спасибо всем кто откликнулся и помог!
Вы молодцы!

Вот что получается!

Аноним 30/11/25 Вск 17:25:26 № 1436243 328

>>1436235
брух
https://massgrave.dev/

Аноним 30/11/25 Вск 17:27:26 № 1436246 329

>>1436243
В powershell от админа
irm https://get.activated.win | iex

Аноним 30/11/25 Вск 17:27:53 № 1436249 330

>>1436232
Ну мне баб голых именно надоедает делать быстро, а чтобы сценка какая-та была, идея, тогда можно долго ковыряться, с Z имеджом может даже не только баб буду делать, хотя все мужики одинаковые выходят совсем уж, какие-то дефолтные Джоны, Олеги и Чжаны

Аноним 30/11/25 Вск 17:31:00 № 1436259 331

>>1436249
Мне нравится делать magazine cover style залупу, типа эротики, а лица получается немного зарандомить, если описывать черты лица, в противном случае будет default face 1

Аноним 30/11/25 Вск 17:45:40 № 1436288 332

>>1436259
Z к этому не особо чувствителен будто и нельзя ебануть (big nose:2) как в SD модельке. Вроде как можно несколько раз повторить разными словами будто деду деменциозному рассказываешь и станет эффект сильнее. Или лицо в самом начале промпта описать попробовать

Аноним 30/11/25 Вск 17:56:27 № 1436328 333

>>1436209
>Анончик, разобрался с Qwen и Compy
>Но, где взять вот те нунчаку модели?
>Нужно брать сразу VAE, Checkpoint и Clip?

Значит, не разобрался. Иначе бы такое не спрашивал. Вникай глубже, иначе хлебнёшь. Примеры только для того, чтобы показать, что всё работает. Workflow всё равно придётся допиливать, если хочешь какие-то приемлемые результаты получить.

Nunchuku я бы не рекомендовал. Ускорение вывода не стоит совместимости с многими неподдерживаемыми LoRAs.

Если очень хочется, то бери отсюда:
https://github.com/nunchaku-tech/ComfyUI-nunchaku

Качай их svdq кванты, устанавливай их custom nodes (проще всего через ComfyUI-manager), затем
их workflow и разбирайся с ним.

Аноним 30/11/25 Вск 18:11:17 № 1436373 334

ИНПАИНТ в Z. В промпте нуде гёрл. Настройки предварительные. Играть количеством шагов и подбирать семплер. Швы вообще ни к черту может подскажите решение?

Аноним 30/11/25 Вск 18:37:04 № 1436397 335

>>1436373
>Швы
Блюр маски. А что нода импаинт кондиционер не пашет с зет?

Аноним 30/11/25 Вск 18:48:43 № 1436401 336

>>1436373
Думаю тебе проще будет дождаться релиза Z-edit, на нее гарантированно появится сразу лора на раздевание как и на Qwen, только по примерам уже выпущенных лор на Гойда-имедж турбо, думаю они будут получше.

Аноним 30/11/25 Вск 19:43:29 № 1436473 337

Аноним 30/11/25 Вск 20:00:01 № 1436511 338

2024-04-1500-06[...].png 5941Кб, 2760x1344

А помните два года назад сдхл была. Пикрил генерила мне с инпейнта.

А теперь только на зимаге унылое серое мыло остается генерировать. Цвет пропадает из наших глаз и сердец.

Аноним 30/11/25 Вск 20:08:39 № 1436522 339

>>1436511
Вроде как sdxl никто из интернетов не удалял, опять же только дистил потрогали, щас будет база и эдит. Реально впервые за годы плюс минус легковесная модель вышла, которая что-то может, а вони поднялось.

Аноним 30/11/25 Вск 20:12:17 № 1436526 340

>>1436243 >>1436246

Аноним 30/11/25 Вск 20:13:00 № 1436528 341

>>1436522
>не удалял,
ну это да

А вот зимаг турба. Серенькое такое, атмосферы нет. Как будто модель говорит мне: да пошел ты нахуй, отъебись от меня.

Ничего не говорю, интересная модель для инста-реализма. Но не для всех сюжетов просто нужен реализм. Мне он редко нужен. Держу пальчики за z-эдит.

Аноним 30/11/25 Вск 20:21:45 № 1436545 342

>>1436528
Лично для меня прорывом стал именно qwen edit особенно последняя итерация (очень жду новую, говорят вот вот на днях). Да там с реализмом слабо, но вот именно понимание промпта на крайне высоком уровне. А вот зимаг именно дал тот старый вайб быстрых генов sdxl, да дистил накладывает свои ограничения, но на фоне мертворожденных, на мой взгляд, флюхов - глоток свежего воздуха, просто не для всех задач.

Аноним 30/11/25 Вск 20:27:14 № 1436552 343

>>1436545
>жду новую,
Тоже жду.

Аноним 30/11/25 Вск 20:35:25 № 1436566 344

С жипег-мылом вроде начинает получаться бороться в Z, уже поприятнее выглядит. Какой же пердолинг, пиздец просто.

Аноним 30/11/25 Вск 20:52:09 № 1436593 345

>>1436511
>>1436528
Есть подозрение, что цветовая гамма - "вина" её vae. Так натренирован. Но если это так - можно ждать альтернативные варианты.
Ну и вообще-то, постпроцессинг никто не отменял. Неужели так сложно добавить в хвост workflow одну ноду для коррекции яркость-контраст-гамма по вкусу?

Аноним 30/11/25 Вск 21:17:31 № 1436618 346

Сап, есть где-нибудь гайд для тренировки лоры? Хочу натренить лору на основе иллюстриуса на стиль художника, не хочу обосраться с описанием картинкок. Если есть просто советы тоже был бы благодарен

Аноним 30/11/25 Вск 21:21:57 № 1436625 347

Чел сделал x\y plot с разными параметрами для Z моджели
https://www.reddit.com/r/StableDiffusion/comments/1paj4pj/zimage_turbo_parameter_megagrid/

Аноним 30/11/25 Вск 21:24:57 № 1436630 348

>>1436625
>Z моджели
геймченджер?)

Аноним 30/11/25 Вск 21:30:57 № 1436635 349

Аноним 30/11/25 Вск 22:07:28 № 1436658 350

>>1436593
VAE там от Флюкса без изменений. Это просто стиль такой зачем-то китайцы прибили по умолчанию.

Аноним 30/11/25 Вск 22:18:47 № 1436663 351

новый стиль нодов такой уродский. и нормальной тёмной темы теперь нет :(

Аноним 30/11/25 Вск 22:25:26 № 1436665 352

>>1436658
Читал на реддитах, что это последствия дистила

Аноним 30/11/25 Вск 22:55:12 № 1436677 353

Насколько там десктоп по скорости обновлений отстает от портативки? А то без обновы ГойдаИмейдж не работает.

Аноним 01/12/25 Пнд 00:38:54 № 1436739 354

Сап, жив ли Forge? Просто убрали из шапки тот гайд на него ещё.
И почему сейчас в основном все ComfyUI используют?

Аноним 01/12/25 Пнд 00:44:08 № 1436743 355

>>1436739
Комфи используют в первую очередь потому что в нем быстрее всего доступны выходящие новые свистоперделки.

Аноним 01/12/25 Пнд 00:44:50 № 1436744 356

>>1436743
А фордж теперь не принято упоминать?

Аноним 01/12/25 Пнд 00:48:56 № 1436748 357

>>1436744
SDXL стыдно в 2025 году использовать. Поэтому и форджеговно не нужно.

Аноним 01/12/25 Пнд 00:51:13 № 1436749 358

>>1436748
А что сейчас используют? В чём основное преимущество нового от старого?

Аноним 01/12/25 Пнд 00:53:24 № 1436751 359

>>1436749
А что сейчас используют?
Z Image, Flux 2, Qwen.

Аноним 01/12/25 Пнд 00:58:17 № 1436754 360

>>1436751
Иллюстриус будет с ними работать? Или это как попросить?

Аноним 01/12/25 Пнд 01:15:53 № 1436762 361

>>1436754
А? Это разные модели, ты о чём.
Люстра это вообще тюн SDXL, если забыл.
Нет, их можно как апскейлер юзать кто запрещает, но чуствуют вопрос не про это был.
Z-Image-Turbo - дестилл, 8 шагов. Базовой версии и Edit-версии пока нет. Качество и следование промпту... ну нормально. 6B модель и 4B энкодер: собственно для таких размером очень даже.
Flux 2 - жирномодель. Мощная, но у скольки % есть на него память? Хотя бы RAM. Плюс зацензурена по самые помидоры, у разрабов даже "манифест пуританства" есть на HF.
Qwen-Image-Edit - хм. По идее лучше ZIT, но не уверен. Доступно куда большему числу пользователей, я вот на 8 ГБ VRAM и 40 ГБ RAM запускал, но мне чёт не зашло. И дело не в скорости.

Аноним 01/12/25 Пнд 01:49:39 № 1436772 362

>>1436663
Ну отключи в настройках, чего страдаешь?

Аноним 01/12/25 Пнд 02:02:23 № 1436775 363

>>1436748

Аноним 01/12/25 Пнд 02:42:09 № 1436799 364

>>1436328
>>Если очень хочется, то бери отсюда:
>>https://github.com/nunchaku-tech/ComfyUI-nunchaku

Анон, любишь гит и ебаться с колесами питона? Нахуй ты это вообще советуешь. Там в Compfy есть кнопочка - модули. Нажимаешь, и там библиотека - ищешь нужно, ставишь чекбоксик и всё.

А питоноебство это вы себе оставте с его пятью версиями енвов и 10 форматами пакетов.

Аноним 01/12/25 Пнд 02:44:04 № 1436802 365

flux 2 упорно отказывается генерить букву ж. Хотя все еще лучше чем квен, который вместо кириллицы абракадабру пишет (по крайней мере под лорами).

Аноним 01/12/25 Пнд 02:44:18 № 1436803 366

Чет этот Qwen и Z-Image зацензурины, пиздец. Даже не сфапнуть.

Аноним 01/12/25 Пнд 02:53:46 № 1436807 367

Nunchuku-instal[...].png 103Кб, 1885x1073

>>1436799
Не успел дочитать пост, сразу отвечать побежал?

Там написано было:
>устанавливай их custom nodes (проще всего через ComfyUI-manager)

Где там хоть слово про:
>любишь гит и ебаться с колесами питона? Нахуй ты это вообще советуешь
>А питоноебство это вы себе оставте с его пятью версиями енвов и 10 форматами пакетов.

А с колёсами, вероятность всё равно есть попердолиться, когда через ComfyUI-Manager встанет косо. У них специальный узел есть для скачивания нужного, прямо из ComfyUI.

Покормил. (Хотелось бы, чтобы поменьше было таких, кто до конца не читает, а сразу рвётся блеснуть своими псевдо-познаниями).

Аноним 01/12/25 Пнд 02:58:39 № 1436812 368

>>1436807
Причем что гарантированно сломается - так это нумпай. Буквально половина кастомных нод стремиться выкачать вторую версию, хотя работает и на первой, а первая половина требует первую версию. Как я уже заебался вручную его откатывать обратно.

Аноним 01/12/25 Пнд 03:15:31 № 1436831 369

>>1436803
Это такой завуалированный реквест?
Кумерство на сгенерированные картинки — довольно жалкое занятие.
Но если тебя интересует предметно, то:

Z-image turbo из коробки может выдавать пикрил (полная хтонь в «предметных областях».

А для Qwen-Image (Edit, Edit-2509) есть LoRAs типа Qwen_Snofs_1_2.safetensors
Они частенько вызывают искажение анатомии, но это уже другая история.

Аноним 01/12/25 Пнд 03:17:32 № 1436834 370

>>1436807
Так, ещё раз перечитал твой пост.
Упоминание Менеджера:0
Упоминание гитзаба как источника откуда брать:1
Ну и кто тут не читает?

Если серьезно, поставил с гита, ток потом разобрался менеджером. Просто этот пухтон бесит пиздец. Уже три версии стоят в разных энвах, из-за других проектов.

Аноним 01/12/25 Пнд 03:20:14 № 1436835 371

>>1436831
Я ток вкатился. Дай прочувствовать момент.
За Лору - спасибо, скачаю.

Аноним 01/12/25 Пнд 03:26:59 № 1436840 372

>>1436834

Ты не читаешь, походу. Try again.
С этого момента я даже комментировать не могу.

>>1436328
Цитата:
>Качай их svdq кванты, устанавливай их custom nodes (проще всего через ComfyUI-manager), затем
их workflow и разбирайся с ним.

Nunchuku я не пользуюсь. Они ущербные и работают не со всеми LoRAs. Даже при использовании сторонних узлов для работы с LoRAs для Nunchuku.

Ставил я их через ComfyUI-Manager. Из коробки оказались нерабочие. Пришлось гуглить и запускать узел из пикрила в моём предыдущем посте для загрузки корректного колеса.
Заработало.
А потом, где-то месяц назад или около того, они ещё что-то поломали при обновлении (фикс закинули в nightly).

Голый Qwen-Image (Edit, Edit-2509) без полноценной поддержки нужных LoRAs неинтересен.

Аноним 01/12/25 Пнд 03:52:45 № 1436848 373

Чёт у этого z-image консистентность инференса на высоте. Если мы берём промпт, то она генерит по нему композицию и последующие сиды меняют только окружение, но сохраняется именно те же предметы этого окружения без изменений в своей форме почти. Это что-то некстгенное.

Аноним 01/12/25 Пнд 03:56:48 № 1436849 374

Ну т.е. если очень детально описать этот предмет, то ты получишь именно ожидаемый результат и он не меняется потому, что описан подробно и сиды не меняют.
>>1436848

Аноним 01/12/25 Пнд 03:58:55 № 1436850 375

>>1436848
>Это что-то некстгенное.

Вообще, это бедность, ограниченность (или некоторая заточенность под Edit) вылезают.

Узел из вот этого поста >>1434109 добавь и посмотри как будет себя вести.

Аноним 01/12/25 Пнд 05:36:21 № 1436863 376

>>1436522
>Реально впервые за годы плюс минус легковесная модель вышла
По сути шнель. Бомжи просто даже не пробовал pixelwave тот же.

Аноним 01/12/25 Пнд 06:19:09 № 1436874 377

>>1436775

Аноним 01/12/25 Пнд 07:34:03 № 1436883 378

>>1433480 (OP)

Аноним 01/12/25 Пнд 08:25:37 № 1436890 379

>>1436663
Тоже попробовал и ахуел, нахуй эта "красота не нужна", вернул старое.

Аноним 01/12/25 Пнд 08:42:22 № 1436894 380

Блин как с помощью qwen edit 2509 аниме картинку в риал лайф превратить? Как не промчу, эффекта 0 на изображении. Воркфлоу из комфи стандартный.

Аноним 01/12/25 Пнд 10:40:30 № 1436927 381

>>1436863
>pixelwave тот же
Чювак, черипуки с цивита сосут буквально у каждой первой генки на зимаге.

Аноним 01/12/25 Пнд 11:11:07 № 1436950 382

>>1436850
>заточенность под Edit
Пишут там будет охуенно. Пиксельшифт все дела. Вообще не будет трогать то, что не положено. Как этот ебучий квен перерисовывает сурс тварь - так не будет.

Аноним 01/12/25 Пнд 11:35:53 № 1436969 383

Как чёткости добиться в зимаге? Зерно и мыло, ёпта.

Аноним 01/12/25 Пнд 12:42:34 № 1437009 384

>>1436894
edit-2509 не умеет стили изображения нормально менять. Поломали в угоду точности переноса деталей. Возьми более старую qwen-edit (первый выпуск) - она стили меняет прекрасно, с минимального промпта.

Аноним 01/12/25 Пнд 13:33:47 № 1437054 385

)))))))

https://github.com/AIDC-AI/Ovis-Image?tab=readme-ov-file

Аноним 01/12/25 Пнд 13:43:53 № 1437076 386

ComfyUItemporbk[...].png 1791Кб, 768x1352

>>1437009
Норм вроде, спасибо.

Аноним 01/12/25 Пнд 13:47:09 № 1437079 387

>>1437054
> high-quality text rendering
Пиздец. Фотошоп уже не канает?

Аноним 01/12/25 Пнд 14:16:19 № 1437116 388

ovis-image-tech[...].webp 46Кб, 1033x749

Z image left (9 steps) - Ovis image right (50 steps)

hmmm..... оставайтесь короче на зимаге

Аноним 01/12/25 Пнд 14:19:16 № 1437121 389

Краткое изложение превосходства
Выбирайте Ovis-Image, если: Вашим основным требованием является точность визуализации большого объема текста , особенно для плакатов, сложных макетов с несколькими текстовыми областями или китайской типографики.

Выбирайте Z-Image, если: вам нужна универсальная модель , сочетающая высокое качество текста с превосходным эстетическим выравниванием, сложным следованием инструкциям или если вам требуется чрезвычайно быстрый вывод (через вариант Turbo).

Аноним 01/12/25 Пнд 14:21:19 № 1437125 390

>>1437121
> сложным следованием инструкциям
Это явно не про Z.

Аноним 01/12/25 Пнд 14:26:57 № 1437129 391

>>1437125
>сложным следованием инструкциям
>или если вам требуется чрезвычайно быстрый вывод (через вариант Turbo).

ждем фулл короч

Аноним 01/12/25 Пнд 14:37:00 № 1437142 392

Не мог разделить текст на верх и низ, надо было указать положение после самого текста, а не до

Аноним 01/12/25 Пнд 14:56:32 № 1437161 393

Сводил на выходных дочку в зоопарк.

Аноним 01/12/25 Пнд 14:57:02 № 1437162 394

>>1437161

Аноним 01/12/25 Пнд 14:57:37 № 1437164 395

>>1437162

Аноним 01/12/25 Пнд 15:00:29 № 1437167 396

>>1437161
>>1437162
>>1437164
Какая-то она вся разная у тебя.

Аноним 01/12/25 Пнд 15:03:41 № 1437175 397

>>1437167
Это точно. Сам охуеваю с этого!

Аноним 01/12/25 Пнд 15:14:13 № 1437195 398

>>1437125
Я попробовал, весьма неплохо инструкциям следует. Не идеально, но достаточно точно. Плюс модель быстра и качество хорошее на выходе. Если они не зафейлят Edit, по сути все текущие проблемы будут решаться им, надо будет просто докручивать им пикчи после основной генерации. А если они впоследствии на энкодер что-нибудь в духе 12b повесят, так это вообще будет эпик.

Аноним 01/12/25 Пнд 15:18:59 № 1437210 399

>>1437195
Только она мало что может из фантазии. 1 пик квен.

Аноним 01/12/25 Пнд 15:19:43 № 1437211 400

>>1435766
В прошлый раз мне тупо апскейльнули и всё было прям зашибись.
А нейрохрючево апскейлеры всё превращают в понос, я это уже давно понял.
Я не совсем понял какой нужен исходник, но вот лицо поближе.

Аноним 01/12/25 Пнд 15:20:37 № 1437213 401

А что с диверсити у нас? Как сгенерить чёрную негритянку, а не коричневую? Непорядок. Если в гугле гуглить негритянок, то чёрные довольно часто встречаются, значит должны быть в датасетах. Но как запромптить? Типа как на втором, а не шоколадных как на первом.
На Z, Квене и Флюксе 2 не вышло. В Квен Edit если кидать, то он обеляет их до шоколадных.

Аноним 01/12/25 Пнд 15:24:08 № 1437215 402

>>1433480 (OP)
>Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana

А почему не перечислили Kandinsky 5.0, который недавно выложили в открытый доступ? Это какой-то расизм!

Аноним 01/12/25 Пнд 15:26:08 № 1437217 403

>>1437215
https://huggingface.co/collections/kandinskylab/kandinsky-50-image-lite

Аноним 01/12/25 Пнд 15:32:05 № 1437225 404

>>1437210
Zimage на фотореализм заточена. Второй же пик от нее? Сюрреализм странно выглядит, если представлять его идеи в виде фотореализма. Это вопрос стиля, а не умения/неумения в фантазию.

Аноним 01/12/25 Пнд 15:39:03 № 1437232 405

>>1437215
Где воркфлоу для комфи?

Аноним 01/12/25 Пнд 15:39:12 № 1437233 406

>>1437213
Попробуй по конкретным нациям взять
https://www.reddit.com/r/StableDiffusion/comments/1p9f6it/humans_of_zimage_races_cultures_and_geographical/
Туареги у него выглядят темнее дворняг пендосских, попробуй ещё суданские народы ебануть. У африканцев самое большое генетическое разнообразие среди всех "рас"

Аноним 01/12/25 Пнд 15:51:57 № 1437239 407

>>1437215
Ещё проебали хранзузский Pixtral. При этом не пропустили Deepseek Janus-Pro, который не знаю как сейчас, но на старте был всратотой уровня первого DALL‑E.

Аноним 01/12/25 Пнд 15:54:08 № 1437242 408

>>1437195
>весьма неплохо инструкциям следует
Соглашусь.

Недавно вкатился после долгого перерыва, какие инструменты comfiui сейчас есть для доработки мелких неточностей? Что-то типа инпейнта как на автоматике 1111.

Аноним 01/12/25 Пнд 16:11:06 № 1437253 409

>>1437242
Все что были в автоматике, и inpaint в том числе, разумеется.
Но собирать из нод самому надо. В шаблонах comfy есть примеры.

Аноним 01/12/25 Пнд 16:12:00 № 1437255 410

>>1433480 (OP)
Поясните вкатуну:
Хочу добавить концепт шмотья на свою 3д можельку.
Сделал: по советам дипсаки
Усыновил стейбл, накотил Automatic1111 WebUI, усыновил чекпоинт DreamShaper которого какого то хуя и нету в чекпоинтах, поэтому работает v1.5 дефолтный какой то как я понял, усыновил ControlNet и скачайте модели control_v11p_sd15_canny.pth и control_v11p_sd15_openpose.pth.

В окне img2img добавил промты, загрузил фотку, генерирую и выходит какая то ебейшая хуйня уровня "первых" генераций, когда нейронки генерили всратых поплывших аниметелок.
В окне txt2img с выбором canny получается ближе к моей фотке, но какого то хуя часто обрезается фотка и получается только тело и все так же безумно всрато.

Че мне надо сделать то сука шо бы оно всё запахало как часики? Че посмотреть можно под такой запрос?

Аноним 01/12/25 Пнд 16:13:22 № 1437256 411

>>1437255
пиздос

Аноним 01/12/25 Пнд 16:21:14 № 1437260 412

>>1437255
Смотри в сторону Квен Эдит 2509. Еще скоро должна выйти эдит модель от Zimage. Я не помню, что такое Дримшейпер, но звучит как что-то из эпохи СД 1.5 и СДоХЛи. От моделей этого уровня пердолинга будет много, толку мало.

Аноним 01/12/25 Пнд 17:47:27 № 1437328 413

Аноним 01/12/25 Пнд 17:52:32 № 1437333 414

>>1436840
А какой Qwen-Image поддерживает нужные лоры? Или никакой, другое юзаешь?
Какие LoRA используешь?

Аноним 01/12/25 Пнд 17:55:44 № 1437336 415

>>1437079
Это для немогующих.
Но они скоро поймут, что эти инструменты им тоже не помогут.

Аноним 01/12/25 Пнд 18:02:24 № 1437339 416

>>1436840
Хорошо, убедил. Ты прав.

Аноним 01/12/25 Пнд 18:05:00 № 1437341 417

>>1437079
>Фотошоп уже не канает?
5-10 мин в фотошопе VS 1-2 мин в ИИ

>>1437336
>эти инструменты им тоже не помогут.
ну так это нечестно. нужно чтобы все могли в не зависимости от талантов.

Аноним 01/12/25 Пнд 18:07:32 № 1437342 418

>>1437341
Как-то мыльно выглядит всё. Есть же Флюкс 2, он лучше справится со всем этим.

Аноним 01/12/25 Пнд 18:09:16 № 1437344 419

>>1437341
>ну так это нечестно. нужно чтобы все могли в не зависимости от талантов.
Вот ровно в этом и проблема. Это так не работает.
Так работают только ограниченные, конечные и хорошо описанные решения.
Например, тулза которая рисует только одним шрифтом только что-то одно в узких рамках. Будет работать офигенно.

Как только появляются детали и размываются хотелки - нужен либо сразу человек понимающий как бывает и как нужно, или самому вникать как бывает, как это делают и как нужно.

Аноним 01/12/25 Пнд 18:34:38 № 1437366 420

>>1437054
Зетка генерит очень реалистично и я щас не про качество. Смысл в композиции, свветотени и т.п. Первая нейронка, от которой не прёт нейронкой. А это дрисня уровня флюкса, где просто смердит нейрокаловым слопом.

Аноним 01/12/25 Пнд 18:39:16 № 1437371 421

>>1437366
Я и не спорю.

Аноним 01/12/25 Пнд 19:22:08 № 1437428 422

>>1437341
Хуйня мыльная. Зимаж даже в тексте превосходит местами. Пока выгляит так, что легче попросить его чистый текст сгенерировать и в редакторе его налепить в нужное место. Не говоря уже о том, что это в редакторе проще сделать без всяких лишних шагов в виде нейронки. Эти лишние 3 минуты возни с редактором окупятся качеством, это не 10-30 часов работы, которые нейронка экономит на фотобаше, например.

Аноним 01/12/25 Пнд 19:23:57 № 1437433 423

>>1437333
Из личного опыта, большинство LoRAs для Qwen-Image совместимы также с Qwen-Image-Edit и Qwen-Image-Edit-2509.
Перепробовал всякое, но для баловства остановился на связке https://huggingface.co/Danrisi/Qwen-image_SamsungCam_UltraReal и чуть-чуть https://civitai.com/models/2031296/skin-fix-qwen

Для NSFW — Qwen SNOFS (но это не моя тема и часто корёжит анатомию).

Из коробки Qwen-Image, на мой взгляд, условно,больше тяготеет к «цифровой иллюстрации», нежели «фотографии».
Перечисленные LoRAs несколько исправляют ситуацию, но тоже не совсем то. Меня просто относительно устроил визуал, который получается с их помощью, а как сделать лучше, пока не знаю.

Аноним 01/12/25 Пнд 19:30:42 № 1437442 424

Родилась в семье двачеров

Аноним 01/12/25 Пнд 19:40:43 № 1437448 425

ComfyUItempgqqf[...].png 9349Кб, 3072x1440

Попробовал cinematic лору с civitae. Забавно сказалось на мотоцикле, он скукожился.

Аноним 01/12/25 Пнд 20:07:34 № 1437504 426

>>1436635
>2-й пикрил
Le sisique is powerful in this pisique

Аноним 01/12/25 Пнд 20:46:13 № 1437579 427

Аноним 01/12/25 Пнд 20:48:01 № 1437586 428

>>1436927
>Ты прав. Я бомж, который даже не пробовал pixelwave тот же.
Что сказать хотел?

Аноним 01/12/25 Пнд 20:50:46 № 1437592 429

Аноним 01/12/25 Пнд 21:01:01 № 1437606 430

>>1437239
>Pixtral Large is a 124B parameter model (123B decoder + 1B vision encoder)
>The Pixtral-12B-2409 is a Multimodal Model of 12B parameters plus a 400M parameter vision encoder.

Аноним 01/12/25 Пнд 21:09:29 № 1437615 431

моромойка

Аноним 01/12/25 Пнд 22:43:07 № 1437672 432

так бля, какой там положняк за сутки по ZV имыдж

Аноним 01/12/25 Пнд 23:44:46 № 1437691 433

>>1437672
Хуета, ждем базовую модель Z и файнтюны

Аноним 02/12/25 Втр 00:36:16 № 1437721 434

>>1436863
Пробовали, даже не близко

Аноним 02/12/25 Втр 00:40:38 № 1437729 435

>>1437672
1) Лоры хуячат в плохую сторону output, лучше уж с промптом поебаться
2) В зимаге эффективно работаю (веса:1.5)

Аноним 02/12/25 Втр 00:42:53 № 1437733 436

>>1437729
> Лоры хуячат в плохую сторону output
Всё с ними норм, нормально тренятся.

Аноним 02/12/25 Втр 00:43:56 № 1437736 437

>>1437733
ХЗ, на каких весах? В моем случае всегда ломают весь стиль.

Аноним 02/12/25 Втр 01:13:39 № 1437770 438

>>1436663
>>1436772
А как этот дизайн включить? У меня последняя версия, но все выглядит по-старому.

Аноним 02/12/25 Втр 01:22:24 № 1437782 439

>>1437433
Спасибо тебе за ответы.

Аноним 02/12/25 Втр 05:00:41 № 1437889 440

Бля, этот опен сорс это прикол какой-то. Нацелен на еблю клозед сорса, чтобы американские компании терпели убытки, а в итоге стреляют в хуй другой опен сорс конторе. Это я про релиз Flux 2 и Z Image. А закрытые модели как ебали, так и ебут лоКАЛ. Релиз SD 3.5? В день релиза трахнут всем чем можно, включая имеющийся опен сорс. Kontext, кажется, поебывал первое время (потому что Сора рисовала мочу, а Gemini Flash Image Edit не сразу появился), но все остальные Edit появлялись уже опущенными. Все HunYuan (кроме 3D) и LTX релизятся с членом в жопе и еще пачкой в других местах. Alibaba показывает уровень на локалках, но даже близко не приближается к закрытым моделям из 2023. Единственный случай, когда локалка соревновалась с закрытыми сетями - это SD 1.4 и Wan 2.1, те же 1.5 и 2.2 выпущены сосущими, не способными соревноваться с обновившимися коммерческими моделями. Все остальное время low-qual выбрасывают на публику уже отъебанным и годным только для кума как утешение, и то - если обучат™. А если Грок продолжит удивлять, то и эту функцию может отнять.
Классно, что оно есть, но жаль, что не удивляет.

Аноним 02/12/25 Втр 05:16:23 № 1437906 441

>>1437889
>Бля, этот опен сорс это прикол какой-то. Нацелен на…
…извращённый «try before you buy».
Потребитель со всем этим поковыряется в наивной надежде наиграть систему. Многократно испытает фрустрацию. И если ему действительно это нужно для рабочих задач — оплатит подписку.

Это в чём-то похоже на «платную» и «бесплатную» дорогу. Есть иллюзорная видимость альтернативы, чтобы сильно не воняли. И есть «премиальный продукт», который выделяется на этом фоне и предназначен для монетизации.

Аноним 02/12/25 Втр 05:33:08 № 1437915 442

>Flux 2 и Z-Image

Я с ними, как и с другими моделями уже просто извёлся в попытке выставить «свет».
«Flux.2» сопротивляется изо всех сил, оставляя белый источник света, практически при любых раскладах (в том числе при использовании JSON-форматированного promptа). В «Flux.2» жёстко вбиты golden hour и blue hour и немного night, а всё остальное гораздо сложнее.
«Z-Image» ничуть не лучше. Я даже уже на превью смотрю, что происходит. Начинает иногда «за здравие», а потом на 3-5 шаге впихивает либо заполняющий, либо рисующий белый свет.
При этом целая проблема его хотя бы «перекрасить» из белого потом.
(На «Flux.2» превью пока не работает.)

В основном, все используют стоковую генерацию «из коробки» со «стандартными сценариями» и с пеной у рта доказывают какая имбовая модель.

На Qwen-Image чуть-чуть попроще работать с освещением (особенно с нужными LoRAs типа SamsungCam_UltraReal), но тоже много капризов. Есть ещё отдельная relight LoRA, прямо на крайний случай, которая переосвещает всё изображение.

А со стандартным освещением изображения выглядят скучно им не хватает color grading для атмосферы.

Аноним 02/12/25 Втр 09:04:39 № 1437995 443

>>1433480 (OP)
Решил попробовать вместо гуфов - fp8_scaled_e4m3fn, на выходе какой то понос. Как будто я q1 использую. Может там надо какую ноду добавить?

Аноним 02/12/25 Втр 09:14:34 № 1438000 444

>>1437915
>В основном, все используют стоковую генерацию «из коробки» со «стандартными сценариями»
Ну вот я придумал генерацию по референсу в Z Image. Еще придумал инпаинт, но пока не особо качественный. А что придумал анон в этом треде? На реддит что-то тоже не особо. Придумали вариации, еще генерацию в меньшем разрешении с апскейлом, что еще?

Аноним 02/12/25 Втр 09:25:19 № 1438011 445

Еще придумал генератор цвета 30 шагов цфг=2. Картинка чуть другая от дефолта, но цвета больше.

Аноним 02/12/25 Втр 09:28:51 № 1438015 446

>>1438011
Ну и антиблюр. 40 шагов цфг=2. Да, долго, но иногда такого хочется увидеть. Четкий фон.

Аноним 02/12/25 Втр 09:37:36 № 1438020 447

>>1437995
Разобрался, всем спасибо.

Аноним 02/12/25 Втр 09:41:26 № 1438025 448

>>1437915
на хроме не испытываю подобных проблем
а вообще хочешь свет/цвет - испольуй img2img и не еби голову, по одному промпту ни одна сетка не сделает как тебе хочется

Аноним 02/12/25 Втр 09:42:46 № 1438027 449

>>1438000
>>1438011
че ты там еще придумал, шизик?

Аноним 02/12/25 Втр 10:32:47 № 1438078 450

Аноним 02/12/25 Втр 10:45:19 № 1438082 451

>>1438011
>>1438015
Зачем шакалишь? Вот как Z под лорами выглядит. И нахуя 40 шагов, когда в 8 всё отлично, 10 секунд и пик готов.

Аноним 02/12/25 Втр 11:15:35 № 1438102 452

>>1438000

https://civitai.com/models

По фильтрам Z-Image, workflows видно, чего налепили. Там были и самопальные inpaint с outpaint.
Но я не об этом. Не про троллейбус из буханки хлеба. Я говорил про необычный prompting с нестандартными условиями освещения или что-нибудь подобное. Чуть в сторону от стандартного сценария и уже начинаются сложности. Приходится как рулетку роллить Run, пока с очередной попытки не выпадет что-то близкое к запромченному.

Аноним 02/12/25 Втр 11:29:40 № 1438113 453

>>1438025
Qwen-Image относительно справляется. К ней ещё relight LoRA есть.
Я к тому, что на некоторых моделях это даётся легче, а на некоторых сложнее, хотя в promptах все underexposured, low-light, low-key dramatic lighting и прочие слова присутствуют, но результаты получаются разные. Иногда даже на Z-Image проскакивает. То есть, сделать она это может, но очень-очень неохотно. А как запромптить так, чтобы она стабильно включала это в генерацию, я не понимаю (через раз-другой она начинает делать то, что нужно, но к 3-5 шагу сама себя «исправляет» и выворачивает освещение так, как привыкла).

Аноним 02/12/25 Втр 11:37:18 № 1438124 454

>>1438102
Непонимание промпта, это все же проблема модели или энкодера?
Пробовал ли кто то другой энкодер накатить?

Аноним 02/12/25 Втр 11:45:10 № 1438129 455

>>1438124
Пробовал. Суть в том, что она не то, что бы совсем не понимает. Она иногда начинает делать как требуется, а а потом, в ходе генерации, где-то с середины «переделывает» всё то, что сделала до этого момента. «Одной пишет, другой — зачёркивает». Даже «полутёмные» помещения без персонажей удалось уговорить её рисовать. Как только в promptе появляется персонаж, снова берётся за старое и всеми силами пытается залить его заполняющим или рисующим белым светом (как от белого софтбокса или вспышки со стороны камеры).

Аноним 02/12/25 Втр 11:45:59 № 1438132 456

>>1438102
>>1438102
я еще раз говорю, прекрати жрать кактус и полагаться на один лишь промпт/лоры если они стабильно не дают результат. любую пикчу возьми из интернета с подходящим светом, заблюрь ее или накидай изначально в фотошопе, добавь сверху шум и пропусти через img2img с денойзом в районе 0.8

Аноним 02/12/25 Втр 12:19:51 № 1438150 457

Controlnet https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union

Аноним 02/12/25 Втр 12:26:14 № 1438158 458

>>1438150

Аноним 02/12/25 Втр 12:26:30 № 1438159 459

>>1438150
А где воркфлоу на этот контролнет взять?
если можешь - ДАЙ!

Аноним 02/12/25 Втр 12:39:26 № 1438167 460

>>1438159
Очевидно комфи пока не поддерживает его.

Аноним 02/12/25 Втр 12:50:42 № 1438177 461

>>1438167
Как эти азиаты заебали, каждый раз приходится прописывать кавказиан гирл.

Аноним 02/12/25 Втр 12:54:25 № 1438178 462

>>1438177
Достаточно прописать имя персонажа. Masha, Olga, Darya или типа такого.

Аноним 02/12/25 Втр 13:02:03 № 1438189 463

>>1438177
Так у меня там и были азиатки в промпте. Вообще национальность промптится хорошо. А вот две разных сложно в Z сгенерить. Негритянка и белая - работает, азиатка и белая - нет.

Аноним 02/12/25 Втр 13:18:04 № 1438211 464

Возможно полезное раз:
https://www.reddit.com/r/StableDiffusion/comments/1pbslz8/zimageturbo_and_other_distilled_models_do_not/
Возможно полезное два:
https://www.reddit.com/r/StableDiffusion/comments/1pbq1ly/significantly_increase_zimage_turbo_output/
Сам я оба варианта пробовал и второй точно влияет на следование промпту, как и ожидалось.
Первый... вроде бы нет. На всякий случай, я ставил столько дополнительнхы шагов, сколько было пропущенно в начале. Правильно или нет - хз.

Аноним 02/12/25 Втр 13:22:29 № 1438212 465

>>1438189
>азиатка и белая - нет
three young women: Masha, Che-won, Akoko

Аноним 02/12/25 Втр 13:28:36 № 1438218 466

>>1438167
там походу на каждое имя по одной бабе. мне такую же машу выдало.

Аноним 02/12/25 Втр 13:31:22 № 1438220 467

>>1438212
Я только на русском промпчу. На русском не работает, упорно не хочет азиатку и белую, даже если продублировать пять раз. А на английском получается, да.

Аноним 02/12/25 Втр 14:33:38 № 1438262 468

>>1438000
Пизда, мою хохлушку экранизировали на Нетфликс

Аноним 02/12/25 Втр 14:35:42 № 1438265 469

>>1438220
>Я только на русском промпчу. На русском не работает
Ну и не пизди тогда. Ты тут один особенный такой, который не может с deepl совладать или гугл транслейтом на худой конец. У тебя на русском тупо больше токенов уходит на текст, микропиське квен4б тяжелее становится

Аноним 02/12/25 Втр 14:47:10 № 1438283 470

>>1438265
> deepl совладать или гугл транслейтом
Но зачем такой пердолинг для простого перевода?
А русский нужен как раз чтоб на русском промпт был, а не потому что не могу по другому, он местами лучше английского. С русским меньше проблем с одинаковыми лицами/композицией.

Аноним 02/12/25 Втр 14:49:58 № 1438288 471

>>1438265
Не один, я тоже на русском промчу так как инета нет на генерирующем компе так что онлайн переводчики отпадают, а оффлайн не делают больше нормальных. Нормальных это значит весящих десяток мегабайт, чисто для перевода что бы не занимать ресурсы компа. Можно конечно в ламе в консоли ебаться но хотелось бы какое никакое гуи, а браузер даже с 1 окном+ллм это уже огого.

Аноним 02/12/25 Втр 14:52:58 № 1438297 472

>>1438288
Вот почему нельзя ллм ноду ну пусть 100мб сделать чисто для перевода в комфе.

Аноним 02/12/25 Втр 15:41:43 № 1438354 473

>>1433480 (OP)
Подскажите что можно использовать как альтернативу UltimateSDUpscale? Она по прежнему актуальна, или уже нет?

Аноним 02/12/25 Втр 15:44:04 № 1438360 474

>>1438354
Всратым XL явно не стоит апскейлить что-то. HYPER/SEEDVR или сразу генерить в нужном разрешении.

Аноним 02/12/25 Втр 15:54:53 № 1438371 475

блять какой же аитулкит объебанный, когда уже выпустят бейз чтоб коя запилил апдейт на скрипты или мусубу

Аноним 02/12/25 Втр 15:58:01 № 1438374 476

>>1438371
Там просто дефолт ублюдский, а как сделать хорошо никто не объясняет, надо просто знать. А так там всё как у Кохи. В тулките хотя бы код нормальный, легче что-то подпилить напильником, а не ка к у Кохи портянки говнокода.

Аноним 02/12/25 Втр 16:01:02 № 1438377 477

>>1438297
>ллм ноду ну пусть 100мб
В 100 мб тебе, конечно, никто не переведёт, А вот в 500мб можно попробовать уложиться.
Другое дело, что промты мало переводить. Их надо переписывать, расширять, наполнять вариативностью. И тут чем модель умнее, тем лучше. Тут даже между 8b и 20b разница заметная.

Аноним 02/12/25 Втр 16:01:13 № 1438378 478

>>1438374
>Там просто дефолт ублюдский
Не, я про то что тулкит работает как говно, выходной локр вообще не работает, нет нужных фишечек
>а как сделать хорошо никто не объясняет, надо просто знать
ето мы знаем, под адафактором в fp8 в 1024 тренится на 12 кеках есличто

Аноним 02/12/25 Втр 16:13:03 № 1438383 479

>>1438177
Я конечно знал, что тут инвалиды сидят, но чтобы настолько. Одно слово в промпте прописать - это уже тяжесть невыносимая. Ты еще когда веса словам поднимал, небось пыхтел от натуги как будто штангу тянул. Как же людям хочется быть обезьяной, жмущей кнопку "ДЕЛАЙ ХАРАШО ПЛОХА НИДЕЛАЙ ИСКАРОПКИ Я СКОЗАЛ КРАСИВО ДЕЛУЙ!"

Аноним 02/12/25 Втр 16:17:11 № 1438386 480

>>1438378
> локр вообще не работает, нет нужных фишечек
Ну тут тебе только таблетки помогут.

Аноним 02/12/25 Втр 16:22:01 № 1438390 481

>>1438283
>Но зачем такой пердолинг для простого перевода?
Потому что очевидно ты не можешь выразить мысль нормально или начинает модель энкодера душится от большего количества токенов на русском.
>А русский нужен как раз чтоб на русском промпт был, а не потому что не могу по другому, он местами лучше английского
И блядь выше пишет что у него на русском не работает нормально, а на английском работает. Гениально бля
>>1438288
Ну скачай ты бля энкодер пережатый сильнее, и влезет у тебя маленький переводчик какой-то в ресурсы компа. Пиздец, на копейках экономите

Аноним 02/12/25 Втр 16:40:51 № 1438397 482

>>1438390
> модель энкодера душится от большего количества токенов на русском
Любая LLM лучше понимает контекст если больше токенов, это база. Из-за этого внезапно оказывается что польский лучший язык на длинных контекстах в большинстве LLM, а китайский худший.
> на русском не работает нормально, а на английском работает
С чего ты взял что абсолютно всё лучше будет. Где-то есть проёбы, так же как английский где-то проёбывается по сравнению с русским.

Аноним 02/12/25 Втр 16:46:34 № 1438399 483

>>1438397
Ты понимаешь что ты какие-то графики факториалы скидываешь больших моделей, тогда как у тебя там крутится челипиздрик квен на 4 миллиарда, скорее всего ещё и квантованный?

Аноним 02/12/25 Втр 16:57:40 № 1438403 484

>>1438397
>LLM лучше понимает контекст если
Напиши промпт в 64к контекста, как у тебя на картинке цифры и сгенерь имагу я хочу посмотреть.

Аноним 02/12/25 Втр 17:05:36 № 1438407 485

>>1438374
> тулките хотя бы код нормальный, легче что-то подпилить напильником
>> нет шедулера. Даже косинуса. Вообще никакого, кроме константы
> код нормальный
> что-то подпилить напильником
Вперед, дерзай

Аноним 02/12/25 Втр 17:18:53 № 1438430 486

>>1438407
> нет шедулера. Даже косинуса. Вообще никакого, кроме константы
Я же пишу не для тупых сделано, в интерфейсе только самое базовое, всё остальное через конфиг.

Аноним 02/12/25 Втр 17:24:36 № 1438436 487

>>1438430
Охуенно, че
Что там еще не вынесено в интерфейс?

Навскидку этот мусор еще альфу=диму ставит всегда молча без выбора

Аноним 02/12/25 Втр 17:32:57 № 1438444 488

>>1438436
> Что там еще не вынесено в интерфейс?
Буквально всё. Там есть файл config_modules.py с параметрами конфига на 1000 строк, надо в нём смотреть. Потом идти в файлы типа optimizer.py или losses.py и смотреть что там доступно. Зато можно просто впердолить elif и своё добавить. С документацией похоже никто не заморачивался - либо ты тренишь в базе в интерфейсе, либо учишься читать простой код питона.

Аноним 02/12/25 Втр 17:35:11 № 1438446 489

>>1438407
а еще это говно не запускается без включенного впн

Аноним 02/12/25 Втр 17:40:21 № 1438448 490

>>1438446
npm заблочен в РФ.

Аноним 02/12/25 Втр 17:43:58 № 1438451 491

>>1438448
естественно, но вообще от локал тренинг софта ожиждаешь что он будет работать без пердолинга с простукиванием

Аноним 02/12/25 Втр 17:45:35 № 1438453 492

>>1438451
Так зависимости он откуда возьмёт. Скажи спасибо блядскому npm, который пересобирает всё при каждом запуске и тянет свежие зависимости.

Аноним 02/12/25 Втр 17:46:19 № 1438454 493

>>1438444
> config_modules.py
Спс, есть где посмотреть теперь. В принципе в мусуби тоже не подарок, но там всё же есть отправная точка - доки. А потом уже тоже код ковырял

Аноним 02/12/25 Втр 20:24:04 № 1438570 494

Пиздатая нода комфи для Зимы чтобы поднять вариативность результатов.
https://civitai.com/models/2184867/seedvarianceenhancer-optimized-for-z-image-turbo

Аноним 02/12/25 Втр 20:25:08 № 1438572 495

>>1438570
Проверил также на других моделях, везде работает, но нужно постоянно настройки под модели подкручивать. Например, для сдхл нужно силу не выше чем 10 ставить. Сейчас тестирую ван.

Аноним 02/12/25 Втр 20:43:27 № 1438591 496

>>1438572
На ване тоже работает, но нужно использовать от 4 шагов для high noise модели, поскольку нода влезает в кондишенинг минимум на 1 шаг в начале генерации, больше 1/4 от хай нойз этапа начинает рожать дичь, но иногда интересную, а больше 1/3 - уже полная херь.

Аноним 02/12/25 Втр 20:44:48 № 1438594 497

>>1438591
А, и ставить соответственно процент завершения кондишенинга чтобы он соответствовал проценту одного шага от общего количества шагов.

То есть, если общее количество шагов 10 - 4 на высоком нойзе и 6 на низком, то надо ставить 10% - это будет 1 шаг, или 1/4 от всех шагов выского нойза.

Аноним 02/12/25 Втр 21:16:41 № 1438618 498

Я блять рот тулкита ебал, эта ссанина не может скачать модель теперь. При этом с хага норм качается. Куда ее кидать если я так скачаю диффусерсы чтоб тулкитосрань подхватила?

Аноним 02/12/25 Втр 21:23:17 № 1438623 499

когда там базу z-image высрут
не буду делать тюн на огрызке дистиллята

Аноним 02/12/25 Втр 21:24:41 № 1438624 500

>>1438618
Ты лору для Зимы хочешь сделать? Don't bother, они все качество картинки сильно режут из-за дедистилляции. Жди базу.

Аноним 02/12/25 Втр 21:24:56 № 1438625 501

image.png 6545Кб, 3708x1166

Попытка повторить сцену из фильма одним промтом.

Получается зимаг все же ебет?

Аноним 02/12/25 Втр 21:26:58 № 1438627 502

>>1438623
Ходили слухи про выходные.

Аноним 02/12/25 Втр 21:30:39 № 1438630 503

>>1438627
Ходят слухи, что фулл хуже базы или то же самое.

Аноним 02/12/25 Втр 21:32:39 № 1438632 504

>>1438624
>Ты лору для Зимы хочешь сделать?
Да
>Don't bother, они все качество картинки сильно режут из-за дедистилляции
Я знаю, мне не важно.

Аноним 02/12/25 Втр 21:33:23 № 1438633 505

>>1438630
Вообще похую. Базу файнтюнить можно, гунеры знаю че с этим делать.

Аноним 02/12/25 Втр 21:48:55 № 1438640 506

>>1438630
>фулл хуже базы
Какой фулл? Для трена нужна база, а не турбохуйня огрызок которая не знает что такое ваджайна

Аноним 02/12/25 Втр 21:54:06 № 1438641 507

Эх, когда выйдет базовая зедка и её натюнят на нсфв контенте, а-то то что на пикриле не очень выглядит...

Аноним 02/12/25 Втр 21:55:42 № 1438643 508

>>1438641
зетка не знает никаких других бубсов кроме тех что на пике

мимо ценитель бубсов

Аноним 02/12/25 Втр 21:58:02 № 1438645 509

Но юоюсь что тюны убьют весь потанцевал модели...

Аноним 02/12/25 Втр 21:58:31 № 1438646 510

>>1438643
Да, и это печально.

Аноним 02/12/25 Втр 22:02:45 № 1438650 511

Если не брать в расчет нсфв возможности то зедка всётаки ебет, как легковесная модель на замену сдохли...

Аноним 02/12/25 Втр 22:05:54 № 1438652 512

зетка няка

Аноним 02/12/25 Втр 22:06:18 № 1438653 513

Только вариативности ппц как не хватает.

Аноним 02/12/25 Втр 22:06:35 № 1438654 514

>>1438640
>не знает что такое ваджайна
вообщето знает

Аноним 02/12/25 Втр 22:06:49 № 1438655 515

>>1438570
>>1438653

Аноним 02/12/25 Втр 22:09:12 № 1438657 516

>>1438653
>768x768
Ты на процессоре генеришь?

Аноним 02/12/25 Втр 22:11:12 № 1438658 517

>>1438618
кидай куда хочешь, просто путь вставляешь в острисе
а так кэш моделей на диске ц по дефолту

Аноним 02/12/25 Втр 22:13:44 № 1438659 518

>>1438627
>>1438623
то дезинфа (от разраба) была, он имел в виду контролнет или чето еще. дата выхода фулла неизвестна, ожидайте.

Аноним 02/12/25 Втр 22:14:13 № 1438660 519

>>1438658
>просто путь вставляешь в острисе
где это

Аноним 02/12/25 Втр 22:15:03 № 1438661 520

>>1438655
Да, видел, но это костыль который помогает не сильно.

Аноним 02/12/25 Втр 22:15:33 № 1438662 521

>>1438657
Да, мне хватает.

Аноним 02/12/25 Втр 22:15:33 № 1438663 522

>>1438660
сверху
окошко с адресом модели, где ссылка на хф по дефолту,в него вставляешь

Аноним 02/12/25 Втр 22:15:42 № 1438664 523

>>1438659
>он имел в виду контролнет или чето еще
ну все выпустил? все давай базу, пойду кум лоры делать (хотя качественный файнтюн типа нубая закроет потребность в куче лор)

Аноним 02/12/25 Втр 22:17:01 № 1438666 524

>>1438664
выпустил, проверяй под подушкой

Аноним 02/12/25 Втр 22:20:21 № 1438668 525

>>1438655
Хотя всё-же стало по лучше с этой нодой. Благодарю.

Аноним 02/12/25 Втр 22:47:06 № 1438674 526

>>1438655
>>1438570

Эта херь в нулину убивает точность. Удолил.

Аноним 02/12/25 Втр 23:05:26 № 1438682 527

>>1438674
Не пробовал настройки дергать? Можешь понизить процент Switchover step или силу...

Аноним 03/12/25 Срд 00:24:04 № 1438724 528

Зачем пердолиться с моделью которая не знает сисик и писик?

Аноним 03/12/25 Срд 01:13:23 № 1438770 529

>>1438724
Никто с флюскалом и н пердолится. Зетка новый нектген.

Аноним 03/12/25 Срд 01:46:19 № 1438782 530

>>1438653
хороший референс, блг...

Аноним 03/12/25 Срд 02:03:44 № 1438790 531

Тред локальной генерации видео помер похоже, так что спрошу.
Я генерил видео на q16 ване.
Конфи обновился, теперь там при попытке генерить всегда аут оф мемори.
Но вопрос будет внезапно странным, а может я сумасшедший и по факту генерил на q8 а q16 просто валялись в папке? 16 же должно было влезать в 16 видеопамяти и 32 оперативки?
Или у меня отвалились какие то оптимизирующие ноды все ноды мониторинга отвалились?
Только то что на q8 качество сильно ниже позволяет мне помыслить что я не ебнулся уже.

Вашего восторга вокруг Зетимейдж не особо понимаю, это же просто сорт оф киберреалистик пони 14й. Ну да, шустрее. Но тоже не как из пулемета.

Аноним 03/12/25 Срд 02:14:38 № 1438794 532

>>1438790
Посмотри вф у старого видоса, ну что ты как маленький.

Аноним 03/12/25 Срд 02:17:08 № 1438796 533

О каких 10 секундах вы говорите? У меня не меньше 20 секунд генерит на 16 врам.

Аноним 03/12/25 Срд 02:25:35 № 1438800 534

>>1438790
Ты custom nodes VHS используешь?
Обновляй до nightly. (Не факт, что поможет).

Вообще, при переходе на две последние по времени выхода версии ComfyUI многие узлы поломались.

Сейчас столкнулся с тем (в Issues на GitHub подтвердил догадку), что узлы MultiGPU DisTorch2 откисли (а простые MultiGPU нет). (Там фикс уже предложили временный, но он не везде работает).

Аноним 03/12/25 Срд 02:26:47 № 1438801 535

>>1438796
Всё зависит от разрешения и выбранных sampler/scheduler (а также, от того, что можно ещё в workflow навалить).

Аноним 03/12/25 Срд 05:16:22 № 1438846 536

image.png 57Кб, 952x45

>>1438801
Ну, ясен хуй. На дефолтных euler-simple/9/1024, около 20, в среднем получается 30. Я даже попробовал скачать kijai_fp8 и на разных настройках запустить, не меняется. Разница только на fp8_fast и в самом лучшем случае, без пересчета промпта - 16 секунд, косплеит детализацию квена. Что я упускаю? Или 10 секунд это на 4090/5090? Или торч с

Аноним 03/12/25 Срд 07:14:41 № 1438880 537

>>1438846
>Что я упускаю?
То что на двачах сидят пиздаболы

Аноним 03/12/25 Срд 07:50:06 № 1438885 538

>>1438846
Время засекаешь не с первой генерации после смены промпта? Просто другой Сид чтобы текстовой энкодер не отработал ещё раз. Обычно так меряют, чисто сама модель

Аноним 03/12/25 Срд 08:02:58 № 1438888 539

>>1438846
>На дефолтных euler-simple/9/1024, около 20, в среднем получается 30.
На 5060ти 16врам - 15 сек. Если сменить промпт + 8 сек дополнительно.

Аноним 03/12/25 Срд 09:03:38 № 1438894 540

чё то быстро вы

ПЕРЕКАТ

>>1438893 (OP)
>>1438893 (OP)
>>1438893 (OP)

Аноним 03/12/25 Срд 09:07:55 № 1438897 541

>>1438790
чел, в 32 оперы даже одна fp16 модель вана не влезет, а там их две нахуй. ты сопоставь размер модели + текст энкодера с размером оперативы (что от нее остается после загрузки винды и комфи) и подумай в чем просчитался.
на fp8/q8 качество почти неотличимо от fp16
чтобы ванотред не умирал, писать надо в нем, а не в этом z-паблике

Аноним 03/12/25 Срд 09:08:35 № 1438898 542

>>1438796
>>1438846

Аноним 03/12/25 Срд 09:13:06 № 1438902 543

>>1438885
Скриншот нахуя?
>>1438888
Понял, значит в пределах нормы. Я уж подумал что-то простое упустил.
Может показаться, что fp8 должен работать быстрей bf16. Но почему-то это так не работает...
Вот бы избавиться от вариативности совсем, а потом ещё и уебашить модель до 2bit нунчаки, чтобы летала параллельно с ллм и генерила пикчи для сгенерированной истории.

Аноним 03/12/25 Срд 09:13:29 № 1438903 544

>>1438897
>не в этом z-паблике
Хехе, врамошизики вдруг осознали, что врам ентот нахуй не нужон, и оптимизация - залог успеха модели

Аноним 03/12/25 Срд 10:21:20 № 1438943 545

>>1438903
кто что осознал
что ты несешь блять?

Аноним 03/12/25 Срд 11:11:02 № 1438983 546

>>1438770
Зетка тоже мало знает про сисик и писик

Аноним 03/12/25 Срд 13:15:28 № 1439085 547

>>1438983
Существенно больше чем флюкс знает.

Аноним 06/12/25 Суб 07:11:38 № 1442940 548

Есть ли смысл ставить больше 8 шагов на ЗИТе?
И какие еще есть рабочие связки помимо euler + simple?

Аноним 06/12/25 Суб 09:55:17 № 1443005 549

>>1442940
Нахуя спрашивать тут?

Все давно уже ПЕРЕКАТились

>>1438893 (OP)
>>1438893 (OP)
>>1438893 (OP)

Аноним 15/12/25 Пнд 16:53:33 № 1456253 550

>>1433480 (OP)
Возможно тупой вопрос но насколько критично отсутствие видюхи?
RAM 32, i9 13gen
текстовые копайлоты более-менее пашут.
ебнутая скорость/качество не нужны 512х512 достаточно, надо редачить картинки по промпту, будет ли это адекватно работать (условно до получаса) или без cuda это часы?