Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 401 238 85
Stable Diffusion тред X+180 /sd/ Аноним 18/01/26 Вск 12:19:54 1493835 1
image.png 5208Кб, 1248x1824
1248x1824
image.png 3925Кб, 1536x2048
1536x2048
image.png 1703Кб, 1024x1024
1024x1024
image.png 4311Кб, 1248x1824
1248x1824
Тред ожидания z-image-base локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• FLUX.2 klein
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза. Пример: 4-8 шагов, CFG 1. https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)

► Предыдущий тред >>1484564 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Аноним 18/01/26 Вск 12:46:29 1493852 2
>>1493714 →
> Кривой ликорис не нужен как раз.
Он удобный и в нем есть нормально работающий OFT и дримбудка в виде лора модуля. Надеюсь ты в курсе, что OFT это наиболее близкий вариант к полному тюнингу, а значит писик вписывается в модель, а не отсасывает как легаси лора?

>Лучше бы peft запилили, а не реализацию кохи.
Ток пефт это не универсальная библиотека, а солянка из методов. Вон у тебя совершенно точно пефт лора ток и работает.
Аноним 18/01/26 Вск 13:03:16 1493861 3
С год не заходил сюда (и не генил-тренил). Полистал прошлый тред и что-то так нихуя и не пони.
Для аниме с сиськами-писками ничего лучше люстры-нуба так и не придумали чтоле? Новое говно совсем говно?
Если без писек - просто стиль какого-то конкретного хуйдожнека или персонаж из очередной мобильной дрочильни - что-то из этого на новом говне тренится?
Что вообще сейчас можно засунуть в 4080 и что потенциально можно тренить?
Аноним 18/01/26 Вск 13:03:48 1493862 4
image.png 1279Кб, 853x1280
853x1280
image.png 4120Кб, 1280x1920
1280x1920
image.png 3556Кб, 1280x1920
1280x1920
до чего же хорош 9b klein в качестве edit-модели. Помоечный квен бы превратил пикчу в мультик с 2.5D текстурами, а этот прям заебись меняет освещение.
Аноним 18/01/26 Вск 13:06:25 1493868 5
image.png 3984Кб, 2400x1591
2400x1591
image.png 2679Кб, 2400x1584
2400x1584
>>1493862
еще из плюсов кляйна - нормально работает с 2к разрешением, без пиксельдрифта как у квено-мусора
Аноним 18/01/26 Вск 13:25:42 1493886 6
Аноним 18/01/26 Вск 13:53:12 1493918 7
>>1493666 →
SD 3.5 которую все забыли охуенна для реализма без сисика. Погоняй ее, если будет время, она в некоторых моментах прям на голову выше и ZIM и QWEN и FLUX.
Аноним 18/01/26 Вск 14:01:03 1493938 8
Аноним 18/01/26 Вск 14:15:55 1493971 9
maxresdefault-3[...].jpg 86Кб, 1280x720
1280x720
2026-01-1400010.png 1932Кб, 1024x1024
1024x1024
2026-01-1400012.png 2071Кб, 1024x1024
1024x1024
2026-01-1400033.png 1735Кб, 1024x1024
1024x1024
Как заставить персонажей на нейрокартинках целовать разные части тела?

У меня при попытке поцеловать в шею какая-то хрень с высунутыми языками.
Аноним 18/01/26 Вск 14:16:02 1493972 10
>>1493868
>нормально работает с 2к разрешением
нормально сделал и фото пик1 скрин 3d сцены начинающего тридэшника из 2003 года.
Вот уж действительно - хидден гем )
Аноним 18/01/26 Вск 14:20:32 1493983 11
Перекат из прощлого
Что-то зимаж разочаровывает. Как обычно: если 1girl заебись получается, то всё, модель будет в топе у гунеров.

А для реальной работы - хуйня какая то. Дизайн с референсами - отсос. Генерация дьявольщины - отсос в этом вообще сдохля лидер, я охуел прям, лол
Квен имейдж Эдит - хуета пластмассовая...

Генерация простых стоковых фонов и текстур - отсос. Я пару тредов назад поднимал вопрос с генерацией текстур стены.
Разнообразие без костылей - отсос.

Реддиторы ещё обнаружили, что зимаж в покорёженный металл не умеет, при лобовом столкновении автомобилей. Небольшой дамаг есть, но колёса не выворачиваются и передок не сминается.

В итоге, для меня сейчас Кляйн лидер. fp4 вообще мгновенно и разнообразно генерит дизайны/лого. Инпайнты охуенные. Промты на русском и русский текст тоже умеет.
Хотя, ру промтов лучше избегать, качество аутпута пиздец низкое.
Сейчас часть генерю на сдохле, потом рефайн кляйном. Ну и промты нодой олламы.
Надо ещё сд3.5 изучить детальнее, наверняка ещё один хидден гем пропустили, лол.

Вот такие наблюдения.
Аноним 18/01/26 Вск 14:20:55 1493984 12
image 2668Кб, 1280x1600
1280x1600
image 2597Кб, 1280x1600
1280x1600
image 2402Кб, 1280x1600
1280x1600
image 2762Кб, 1280x1600
1280x1600
>>1493862
Нужна лора на лица и тогда заживём с нормальными генерациями. А то сейчас что-то странное делает с лицами.
Аноним 18/01/26 Вск 14:22:57 1493985 13
>>1493938
эта залупа даже до 01 люстры не дотягивает
Аноним 18/01/26 Вск 14:32:32 1493993 14
1346001-A mediu[...].jpg 2686Кб, 1664x2432
1664x2432
1251003-This is[...].jpg 3154Кб, 1664x2432
1664x2432
2054001-A fat o[...].jpg 2445Кб, 1664x2432
1664x2432
1356001-A photo[...].jpg 3916Кб, 1664x2432
1664x2432
Удивительно, что флюксоделы выпустили нормальную модель. Даже при том, что с анатомией рук-ног проблем не меньше, чем на хроме, но при таком разрешении и скорости генерации это все равно крышеснос.
Аноним 18/01/26 Вск 14:34:09 1493998 15
>>1493993
тренится оно так же как и прошлые (т.е. никак)?
Аноним 18/01/26 Вск 14:43:38 1494013 16
>>1493861
я думаю сейчас файнтюны кляйна полезут как грибы после дождя, включая аниме. модель очень хорошо тренится.
Аноним 18/01/26 Вск 14:44:56 1494015 17
>>1493972
Ты либо зумерок, который в те годы даже не жил, либо надень очки/линзы, выбирай сам. Графон халфы в 2004 был прорывным для 3д, и он выглядит куда мультяшнее второго пика. А ты тут пиздишь про >начинающего тридэшника из 2003 года

>>1493984
факт, лица оно менять не умеет нормально. пока что.
Аноним 18/01/26 Вск 14:53:43 1494021 18
>>1493861
>ничего лучше люстры-нуба
да
>Новое говно совсем говно?
да
Аноним 18/01/26 Вск 14:56:03 1494023 19
>>1493861
>ничего лучше люстры-нуба так и не придумали чтоле? Новое говно совсем говно?

хрома заебись, но чтоб ей пользоваться нужно руки иметь и писать хорошие промты. а для промтов типа вангерл мастерпись стендинг биг бубс да, только в люстру-нуб.
Аноним 18/01/26 Вск 15:05:26 1494027 20
>>1494015
>А ты тут пиздишь
да не рвись ты так. Посмотри внимательнее - ну реально говно же получилось на пик2. Пластиковое мыльное говно из шит-тиера порноигрулек.
Аноним 18/01/26 Вск 15:07:47 1494030 21
1303002-You are[...].jpg 1440Кб, 2016x1152
2016x1152
0153001-paint b[...].jpg 1767Кб, 2016x1152
2016x1152
0101001-A large[...].jpg 2301Кб, 1248x1824
1248x1824
1315005-kitsch [...].jpg 1498Кб, 1248x1824
1248x1824
>>1493861
Для аниме я сейчас использую Neta Yume. Оно хуже для чистого НСФВ, но промпты понимает в миллиард раз лучше сдохли и умеет работать с куда более сложными композициями.
Хрома, зетка и кляйн все пиздатые, в разы лучше тех опций, что были год назад. Из старых флюкс моделей я до сих пор использую разве что Pixelwave.
Аноним 18/01/26 Вск 15:09:47 1494032 22
>>1494027
>да не рвись ты так
да нужен ты рваться из-за тебя, я наоборот орнул с шизы твоей
Аноним 18/01/26 Вск 15:14:14 1494035 23
>>1494023
>хрома заебись
удваиваю этого джентльмена, хрома - топчик
Аноним 18/01/26 Вск 15:19:45 1494044 24
>>1493972
Ты либо никогда не пользовался Qwen, либо сам квеноблядь :^) Клеин очень достойно показывает себя в плане текстур
Аноним 18/01/26 Вск 15:42:10 1494082 25
>>1494035
Утраиваю ценителя. Снигерил только что картинку на хроме. Лучше фотка в треде, естественно.
Аноним 18/01/26 Вск 15:43:51 1494088 26
>>1494013
>модель очень хорошо тренится.
Только увы, не на 12GB vram (при том, что генерит на таком шустро). Я сунулся интереса ради, раз уж в устрицу добавили поддержку - шиш мне. Полную базу он даже загрузить не может (CUDA OOM) не смотря ни на какой оффлоад, а если ему вручную fp8 версию подсунуть - ругается на неправильный слой в модели.

ZIT этого достаточно, а здесь - увы.
Аноним 18/01/26 Вск 15:45:44 1494090 27
>>1494088
в острисе у меня и хрома вылетает с оом, а на onetrainer нормально шпилит, там пресет на 8врам есть даже. так что скил ишуе разраба вполне вероятно.
Аноним 18/01/26 Вск 15:47:53 1494092 28
>>1494088
так базу квантовать и выгружать надо, само собой
Аноним 18/01/26 Вск 15:48:04 1494094 29
Я вот теперь хз на чем новую версию ластифая файнтюнить. Все ждал омни-базу зетки, но с выходом флюха нового уже хз, может с ним начать работать? У кого вообще какие впечатления от Klein?
Аноним 18/01/26 Вск 15:48:26 1494095 30
ComfyUItempppaq[...].png 2255Кб, 1152x1280
1152x1280
Да, неплох клейн, совсем неплох, и это 4b, мне страшно что 9b делает...
Аноним 18/01/26 Вск 15:51:20 1494097 31
>>1494092
>так базу квантовать и выгружать надо, само собой
Не помогает. Встроенные средства не работают (oom сразу, еще до попытки квантования), внешняя модель - flux-2-klein-base-9b-fp8.safetensors - вообще не грузится с ошибкой слоя (причем - не первого, где-то до середины догружается, потом спотыкается и стоп).
Аноним 18/01/26 Вск 15:55:22 1494100 32
>>1494095
Что у нее с головой? Почему она такая непропорционально огромная?
Аноним 18/01/26 Вск 15:57:38 1494102 33
image.png 1247Кб, 2000x865
2000x865
>>1494095
мда, идеальный результат
Аноним 18/01/26 Вск 15:59:12 1494103 34
>>1494102
Мало растянул, надо было 10к разрешения увеличивать, а то не видно нихуя
Аноним 18/01/26 Вск 16:01:27 1494105 35
>>1494030
>Из старых флюкс моделей я до сих пор использую разве что Pixelwave.
У меня вдобавок ещё Fluxmania и Rayflux. Не идеальны, но порой помогают вытащить то, чего обычная Dev не даёт.
Аноним 18/01/26 Вск 16:02:02 1494107 36
>>1494100
потому что это image to image с заменой фона. исходная девка была такой.
Аноним 18/01/26 Вск 16:18:14 1494121 37
>>1493868
почему темно как у негра в жопе?
Аноним 18/01/26 Вск 16:19:31 1494122 38
>>1493971
на чём ты это делал?
Аноним 18/01/26 Вск 16:22:30 1494125 39
Аноним 18/01/26 Вск 16:23:45 1494126 40
>>1494095
фу блядь, поней завоняло
Аноним 18/01/26 Вск 16:34:37 1494142 41
>>1494125
>тюн PonyXl
пони хорошо умеет целоваться безо всяких лор-хуёр, сдохля хуже, причём даже таких моделей немного, остальные вообще не умеют. Зимага тоже кстати не умеет нихуя в поцелуи, я в прошлом треде выкладывал результаты - полный провал, так целуют котят и щеночков, с языками начинается подобная хуйня если сильно настаиваешь, либо промтишь: френч кисс.
Аноним 18/01/26 Вск 16:41:31 1494150 42
>>1494121
потому что я запромптил темную фотку?
Аноним 18/01/26 Вск 16:45:28 1494160 43
>>1493983
А я напротив проникся зимагой за две недели юзания.
Кляйн 9b в свою очередь для меня неюзабелен из-за того, что коверкает все подряд, стоит отойти от квадратного разрешения картинки. Ну, для генерации лого наверное это совершенно не критично, так что тут ты можешь оказаться прав. Насчет понимания промпта кляйн и зимага идут по моим наблюдениям вровень, за вычетом того, что некоторые вещи они понимают слегка по-разному.
Аноним 18/01/26 Вск 16:47:54 1494163 44
>>1494150
>я запромптил
пруфани со светом
Аноним 18/01/26 Вск 16:49:33 1494167 45
>>1494160
>для генерации лого
сдохля с лорами ебашит прекрасные лого
Аноним 18/01/26 Вск 16:53:30 1494172 46
Аноним 18/01/26 Вск 16:54:20 1494173 47
img00.jpg 51Кб, 580x513
580x513
soa1a1.jpg 124Кб, 992x742
992x742
>>1494015
>Графон халфы в 2004 был прорывным для 3д, и он выглядит куда мультяшнее второго пика.
Игры это не всё 3д, которое существует. Ты бы в те годы зашел на сайты вроде render.ru, специализировавшиеся на пафосном плагиате никому из целевой аудитории неизвестных произведений искусства, а также на вручении друг другу великих наград и медалей.
Аноним 18/01/26 Вск 16:59:54 1494176 48
mwzn0sai4-u.jpg 68Кб, 366x594
366x594
ComfyUItempppaq[...].png 2292Кб, 864x1424
864x1424
1 оригинал, 2 после кляйна. Как-бы еще лицо улучшить без пердолинга...
Аноним 18/01/26 Вск 17:03:10 1494182 49
image.png 101Кб, 295x166
295x166
>>1494176
>еще лицо улучшит
ты чё там промтишь, содомит?
Аноним 18/01/26 Вск 17:21:09 1494205 50
>>1494182
это не я, это оно само так )))
Аноним 18/01/26 Вск 17:30:51 1494226 51
изображение.png 354Кб, 433x556
433x556
>>1494182
В оригинале тоже что-то торчало...
Аноним 18/01/26 Вск 17:43:18 1494236 52
ComfyUItempppaq[...].png 2598Кб, 1152x1280
1152x1280
Вобщем, как эдит модель клейн хорош а как генератор картинок (в основном из-за проебов в анатомии) он сосет.
Аноним 18/01/26 Вск 17:56:22 1494247 53
>>1494160
что значит "коверкает"?
Аноним 18/01/26 Вск 17:58:46 1494251 54
>>1494236
Не генерь на 4 шагах. На 9В в 5-6 шагов без проёбов генерит, зетка хуже в анатомию может.
Аноним 18/01/26 Вск 18:07:15 1494256 55
>>1494251
Щас скачаю гляну, 4b сильно проебывает анатомию.
Аноним 18/01/26 Вск 18:25:10 1494269 56
>>1494160
>стоит отойти от квадратного разрешения картинки
Опа. А я как раз в квадратном и генерю. Может потому и не видел косяков. Ну, разве что с пальцами пизда, как на сдохле в древние времена, лол.

>>1494160
>Насчет понимания промпта кляйн и зимага идут по моим наблюдениям вровень
Камон, у них один и тот же qwen3 на текстовом энкодере. Конечно вровень.

>>1494167
>сдохля с лорами ебашит прекрасные лого
У меня были доп условия: два референса и русский текст. Я бы и сидел на сдохле, если б всё так просто было.
Аноним 18/01/26 Вск 18:27:59 1494272 57
>>1494269
> с пальцами пизда
шел четвертый год эволюции генеративных моделей. ML-соя ботся юзать нормальные сеты. потому что кто-то может ущемиться.
Аноним 18/01/26 Вск 18:43:52 1494287 58
ComfyUItempppaq[...].png 2676Кб, 1152x1280
1152x1280
>>1494251
Ну что могу сказать, 9b однозначно лучше, но анатомию всёравно пидарасит, хоть и по меньше.
Аноним 18/01/26 Вск 19:06:40 1494305 59
>>1494097
Чисто для эксперимента, попробовал тренировку 4B. Загрузилось, влезло. Но тренируется хуже чем ZIT (к 500-ому шагу схожесть перса лишь угадывается), и при этом медленней по скорости на шаг.

Правда, тут почти наверняка режим не подходит, да и вообще настройки никуда не годятся. Просто хотел посмотреть в принципе - будет ли работать хоть как-то. Ну - типа да, получается что-то. Но пока, для обладателей 12GB vram - только 4B доступно для тренировки.
Аноним 18/01/26 Вск 19:19:59 1494318 60
>>1494236
А я что-то как едит модель Кляйн не оценил. Может я что-то делаю не так, но воркфлоу, которое есть в темплейтах комфи, с промптом "Replace the face of the girl in the foreground in image 1 with the face from image 2" просто бесхитростно копипастит лицо, грубо вырезанное из второй картинки. При этом ни освещение, ни тени, ни насыщенность, ни баланс белого, ничего не подгоняет, даже края вырезанного лица не размазывает.
Аноним 18/01/26 Вск 19:23:09 1494326 61
>>1494318
Причем на эту операцию уровня вырезки лица в пейнте ушло 500 секунд.
Аноним 18/01/26 Вск 19:28:24 1494334 62
Аноним 18/01/26 Вск 19:51:35 1494351 63
>>1494318
И если в промпте написать подробное изложение, ясно сказав, чтобы сохранило гамму, освещение и выражение лица с первой картинки и вставило лицо с его характерными деталями со сторой, результат идентичен - грубо, как для коллажа в детском саду, вырезанное лицо.
Аноним 18/01/26 Вск 20:12:53 1494375 64
Какой текст енкодер для кляйна с аблитерацией на fp8. То что я нахожу не подходят.
Аноним 18/01/26 Вск 20:19:07 1494382 65
edit2026-01-181[...].jpeg 591Кб, 1360x768
1360x768
2026-01-1614551[...].jpg 203Кб, 960x544
960x544
2026-01-161455-2.jpg 185Кб, 960x544
960x544
Вот приблизительно такую замену лица делает Кляйн. Причем изменение разрешения обоих картинок, равно как и использование в качестве второй картинки изображение только одного лица без какого-либо окружения ни на что не влияет, даже на затраченное время. И это уже похоже на троллинг - модель здесь придумала какое-то фотореалистичное лицо, хотя вторая картинка (сделанная в зимаге) в стиле рисунка. Если обе фотореалистичные, то она просто грубо вырезает лицо.
Аноним 18/01/26 Вск 20:24:53 1494392 66
Спрашивается, где прогресс и где "outstanding quality at sub second speed", если это говно делалось 500 секунд. Древний faceswap lab и то был можно было юзать, чтобы делать рисованные картинки с лицом, вытащенным из фоток, не говоря о том, чтобы делать это с фотореалистичными изображениями.
Аноним 18/01/26 Вск 20:31:20 1494400 67
Да, и еще цветовую гамму в этом комиксе она взяла из второй картинки, хотя ясно было сказано сохранить все из первой и только поменять лицо. Походу она не знает, что такой "image 1" и "image 2".
Аноним 18/01/26 Вск 20:35:26 1494404 68
LTX200007-audio.mp4 5680Кб, 480x480, 00:00:35
480x480
Аноним 18/01/26 Вск 20:39:24 1494411 69
>>1494375
для кляйна 4б квен 4б, для кляйна 9б увен 8б
Аноним 18/01/26 Вск 20:40:03 1494413 70
Продолжение клоунады. Если упростить промпт до уровня "stylize the face of the girl in the foreground in image 1 with the face from image 2", то Кляйн на фотореалистичную image 1 вставляет рисованное лицо, хотя image 2 тоже фотореалистичное.
Аноним 18/01/26 Вск 20:42:40 1494418 71
16813639.jpg 109Кб, 660x708
660x708
ComfyUItempdpyn[...].png 2850Кб, 1312x1408
1312x1408
ComfyUItempdpyn[...].png 2961Кб, 1312x1408
1312x1408
Для реставрации апскейла и небольших доработок лоурезных фото, кляйн подходит очень неплохо
Аноним 18/01/26 Вск 20:43:03 1494420 72
>>1494400
>>1494413
Бля, ты первый раз что ли? Нормально ссылайся на нужные пикчи.
Аноним 18/01/26 Вск 20:45:49 1494423 73
>>1494420
Image 1 и Image 2 это картинки из двух load image в воркфлоу. Здесь постить конкретные примеры не имеет смысла, это будет лишним мусором, не добавляющим ничего к сути.
Аноним 18/01/26 Вск 20:50:16 1494426 74
>>1494382
Ты пытаешься убить двух зайцев разом, и лицо стилизовать, и фейс заменить. это две разные задачи, делай их по очереди.
Аноним 18/01/26 Вск 20:50:55 1494427 75
>>1494423
> Image 1 и Image 2
Чел, такую хуйню ни одна другая нейронка не поймёт. Пиши как положено.
Аноним 18/01/26 Вск 20:56:50 1494434 76
>>1494411
А ссылки можно? Чет у меня ошибки выдает, на все, что я качал.
Аноним 18/01/26 Вск 20:57:30 1494436 77
ComfyUItempdpyn[...].png 2883Кб, 1312x1408
1312x1408
ComfyUItempdpyn[...].png 3364Кб, 1312x1408
1312x1408
ComfyUItempdpyn[...].png 2975Кб, 1312x1408
1312x1408
Аноним 18/01/26 Вск 21:02:36 1494443 78
>>1494427
В воркфлоу, недавно появившемся в комфи, обе картинки названы именно image 1 и image 2. Во многих других случаях в промптах они названы так же, либо picture 1 и picture 2. Нужно же как-то дать понять в промпте, о чем речь.
Аноним 18/01/26 Вск 21:02:53 1494444 79
Аноним 18/01/26 Вск 21:24:44 1494457 80
edit2026-01-181[...].jpeg 299Кб, 832x1248
832x1248
face.JPG 218Кб, 1358x1838
1358x1838
Чтобы было понятнее, вот еще раз результат замены лица, которое делает Кляйн. Здесь я взял рандомно две картинки. От изменения размеров, подгонки второй картинки под размеры первой, удаления на ней всего кроме лица, а также от усложнения и изменения промпта (replace, create и т. п. вместо swap, подробного описания того, что откуда взять и что где оставить) ничего не меняется. Модель распознает лицо и понимает, куда его приклеить, но делает это, мягко говоря, из рук вон плохо и до неприличия долго.
Кстати, на приложенной картинке Кляйн еще более-менее удачно поменял лицо. На других он просто орудует как начинающий пользователь компьютера в пейнте.
Аноним 18/01/26 Вск 21:24:49 1494459 81
16813639.jpg 109Кб, 660x708
660x708
funny-klev-club[...].jpg 187Кб, 1950x1300
1950x1300
ComfyUItempdpyn[...].png 745Кб, 656x704
656x704
Промпт: replace face in image1 to face on image2

Вроде работает приемлемо, если пошаманить думаю еще лучшего результата можно добиться.
Аноним 18/01/26 Вск 21:50:58 1494479 82
ComfyUItempdpyn[...].png 2540Кб, 1152x1280
1152x1280
Аноним 18/01/26 Вск 21:53:08 1494482 83
ComfyUItempdpyn[...].png 2376Кб, 1152x1280
1152x1280
Нормально у кляйна с русским.
Аноним 18/01/26 Вск 21:55:28 1494484 84
face-2.JPG 207Кб, 1383x1837
1383x1837
edit2026-01-181[...].jpeg 313Кб, 832x1248
832x1248
>>1494459
Более очевидным низкоскортное исполнение замены лица становится, если у image 1 и image 2 сильно разный цветовой баланс.
Аноним 18/01/26 Вск 21:59:57 1494490 85
>>1494484
ты пропиши в промпте чтобы после замены он сделал цветокоррекцию
Аноним 18/01/26 Вск 22:00:41 1494491 86
ComfyUItempdpyn[...].png 2612Кб, 1152x1280
1152x1280
Аноним 18/01/26 Вск 22:04:45 1494495 87
>>1494318
Попробуй вместо replace with использовать change to. Или вообще на русском промт написать.
Если что, можешь сюда референсы кинуть, поможем.
Аноним 18/01/26 Вск 22:06:47 1494498 88
ComfyUItempdpyn[...].png 2040Кб, 1152x1280
1152x1280
ComfyUItempdpyn[...].png 2583Кб, 1152x1280
1152x1280
ComfyUItempdpyn[...].png 1986Кб, 1152x1280
1152x1280
ComfyUItempdpyn[...].png 2645Кб, 1152x1280
1152x1280
Аноним 18/01/26 Вск 22:07:25 1494499 89
>>1494490
Дело не только в цветокоррекции. Кляйн просто грубо вырезал лицо и вставил его. Я уже писал в промпте и про цвета, и про тени, и про освещение - результат идентичен с тем, что получается, когда ничего из этого не упомянуто в промпте.
Вся суть замены лица нейронкой в том, чтобы мощь нейронки сделала идеальную замену, а говно с цветокррекцией на коленке можно сделать и в фотошопе.
Аноним 18/01/26 Вск 22:10:00 1494504 90
>>1494482
Он умеет в большие и маленькие буквы, или как в зимаже надо капслоком писать?
Аноним 18/01/26 Вск 22:33:12 1494535 91
Аноним 18/01/26 Вск 22:47:42 1494557 92
>>1494413
Клоун, про картинки, как и для квен-edit, надо писать СЛИТНО. "image1" - это, блин, спец-последовательность токенов, а не просто слово с числительным. Как ключ для активации лоры, где любая чушь может быть, лишь бы уникальная.
Аноним 18/01/26 Вск 22:50:12 1494559 93
image 3703Кб, 1280x1600
1280x1600
image 3398Кб, 1280x1600
1280x1600
image 2733Кб, 1280x1600
1280x1600
image 2902Кб, 1280x1600
1280x1600
>>1494457
Fp8 выкинь, получше станет. fp8 тут какой-то совсем шакальный. А ещё сажа тут почему-то дико качество роняет, текстурам всем от неё пизда.
Аноним 18/01/26 Вск 23:09:55 1494576 94
ComfyUItempveic[...].png 1246Кб, 1024x1024
1024x1024
ComfyUItempdpyn[...].png 2626Кб, 1152x1280
1152x1280
понимание промпта кляйна 9б выше чем у зимаги (это и не удивительно 9б против 4б)

первая картинка зимага, вторая кляйн

Промпт спизженный и обьединенный из прошлых тредов: The photo depicts a realistic-style cat holding a fish in its mouth and running away from an angry fishmonger, while behind the cat a young woman holds a pair of pink underwear in her hands, sniffs it, and brings it to her nose.
Аноним 18/01/26 Вск 23:11:09 1494579 95
>>1494576
правда с нбханьем трусов никто не справился
Аноним 18/01/26 Вск 23:21:26 1494599 96
ComfyUItempftfu[...].png 2285Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2465Кб, 1152x1280
1152x1280
Хм, а вот это интересно, в кляйне 4б вырезаны соски, а в 9б они есть
Аноним 18/01/26 Вск 23:23:16 1494602 97
image.png 355Кб, 749x522
749x522
>>1494557
тем же вопросом задался, вот скрин из документации bfl, тут раздельно. У меня по тестам вообще оно как-то рандомно выбирает картинки
Аноним 18/01/26 Вск 23:23:32 1494603 98
>>1494484
Ты промпт через жопу пишешь. Он могёт в свап лица, но лицо будет совсем не похожее, лишь общие очертания. Поэтому можешь даже не пердолиться пока лора специальная не выйдет.
>>1494287
Аблу попробуй заместо стокового, цензура сильно анатомию портит. Ещё надо будет клип скип затестить как на Z-image, но я пока до этого не добрался, может он тоже Flux в 2 раза послушнее делает.
Аноним 18/01/26 Вск 23:25:07 1494608 99
>>1494599
В 9б они тоже вырезаны. Всё от промпта зависит.
Аноним 18/01/26 Вск 23:27:38 1494611 100
ComfyUItempftfu[...].png 2562Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2586Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2394Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2310Кб, 1152x1280
1152x1280
Да, 4б зацензурена по максимуму, первые 2 фото сделаны со стоковой квенкой 4б, вторые 2 фото сделаны с квен аблитератед.

Так что кому интересны соски и обнаженка хоть в какомто виде то берите только 9б версию.
Аноним 18/01/26 Вск 23:32:53 1494630 101
ComfyUItempftfu[...].png 2485Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2482Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2504Кб, 1152x1280
1152x1280
>>1494608
Согласись, эти соски и 4б версия это как небо и земля
Аноним 18/01/26 Вск 23:36:37 1494637 102
>>1494630
У меня есть несколько генераций на 9b с полным отсутствием сосков. И там пока их в промпт не пропишешь они вообще не появляются. Т.е. просто плоская грудь. Разница скорее всего не в цензуре, а в размере энкодера и самой модели.
Аноним 18/01/26 Вск 23:38:37 1494642 103
ComfyUItempftfu[...].png 2286Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2251Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2413Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2111Кб, 1152x1280
1152x1280
>>1494603
>Ещё надо будет клип скип затестить как на Z-image
Можешь не тестить, я проверил до -15 и вот что получается.
Аноним 18/01/26 Вск 23:40:54 1494645 104
>>1494637
так проблема в том что на 4б хоть прописывай хоть нет они всё равно не появляются, а в 9б когда их прописываешь то они есть хоть в какомто виде.

>Разница скорее всего не в цензуре, а в размере энкодера и самой модели.

сама ЛЛМ-ка думаю могла бы отрисовать а вот модель скорее всего порезана сильнее чем 9б
Аноним 18/01/26 Вск 23:51:37 1494658 105
>>1494427

С чего ты это взял?

Для edit-моделей (по крайней мере линеек Qwen-Image-Edit-2509/2511 и FLUX.2 dev/[klein]) обращение к reference image идёт именно через «image 1» «image 2» и так далее. На Qwen-Image-Edit-2509/2511 это было даже во входах узла прописано.
Аноним 18/01/26 Вск 23:52:19 1494660 106
ComfyUItempftfu[...].png 2267Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2518Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2349Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2262Кб, 1152x1280
1152x1280
Аноним 18/01/26 Вск 23:53:35 1494661 107
>>1494642
Сделал прогон на одном и том же сиде. Клип скип на флаксе не работает вообще. Так что забудьте про него.
P.S. За одно на том же промпте прогнал z-image, без клип скипа 8 сделало вообще не тех персонажей и у девушки одна нога. С клип скипом полностью последовало промпту. Так что пока что из улучшений флакса только аблу использовать, но надо прогнать разные будет, на з-имаге из 4 которые я тестил один был на несколько порядков лучше остальных.
Аноним 18/01/26 Вск 23:55:51 1494662 108
>>1494658
В Квене Picture 1, там пикча в токены энкодилась и проставлялись названия. Во Флюксе нет никаких подписей.
Аноним 18/01/26 Вск 23:56:10 1494663 109
>>1494661
Ещё надеюсь кто-нибудь сделает dmd2 для флакса заместо турбо говна и там разгуляемся.
Аноним 18/01/26 Вск 23:57:25 1494665 110
>>1494413

Используй правильно:
Что-то типа: «Change the head and face of female character on image 1 with the face from image 2».
То, что у тебя на изображении, это не «girl» в понимании модели.

> Причем изменение разрешения обоих картинок

У тебя в default workflow стоит узел, который ужимает все изображения, поданные на вход до 1 Мп. Естественно, меняй разрешение, не меняй, оно будет приводится к этому значению.
Аноним 18/01/26 Вск 23:58:47 1494670 111
>>1494661
Я не могу найти аблитирейтед версию. Где ее взять?
Аноним 18/01/26 Вск 23:59:45 1494674 112
>>1494663
А вот это было бы очень даже отлично, но хер мы в ближайшее время дождемся...
Аноним 19/01/26 Пнд 00:00:38 1494676 113
ComfyUItempftfu[...].png 2441Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2831Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2470Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2562Кб, 1152x1280
1152x1280
Аноним 19/01/26 Пнд 00:01:42 1494678 114
Аноним 19/01/26 Пнд 00:04:34 1494680 115
Аноним 19/01/26 Пнд 00:10:09 1494685 116
ComfyUItempftfu[...].png 2422Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 1449Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 1996Кб, 1152x1280
1152x1280
ComfyUItempftfu[...].png 2549Кб, 1152x1280
1152x1280
Аноним 19/01/26 Пнд 00:40:43 1494700 117
>>1494436
Сиськи ей больше сделать может?
Если может, то насколько большие, максимально?
Аноним 19/01/26 Пнд 00:52:46 1494709 118
изображение.png 644Кб, 1519x601
1519x601
))
Аноним 19/01/26 Пнд 01:02:12 1494713 119
Посоны поделитесь столами под разные нейроночки пжлст
Аноним 19/01/26 Пнд 01:33:29 1494735 120
image 4665Кб, 1440x1920
1440x1920
image 2998Кб, 1280x1600
1280x1600
image 2589Кб, 1280x1600
1280x1600
image 4038Кб, 1440x1920
1440x1920
Аноним 19/01/26 Пнд 01:34:05 1494736 121
1.png 5300Кб, 1920x1344
1920x1344
2.png 4977Кб, 1920x1344
1920x1344
3.png 4176Кб, 1920x1344
1920x1344
Не знаю зачем вы генерите пластиковых баб ван гирл стендинг, их и сд 1.5 может сделать. А вот то что Флакс сохранил от своей старшей модели знание России это огромный вин. Качество конечно не очень, но ни сдохля, ни зимага, ни квен не могут в это. Теперь можно генерить баб ван герл стендинг в России, с российской одеждой и антуражем.
Аноним 19/01/26 Пнд 01:42:45 1494740 122
>>1494713
Стол №1 : риет из сюрстреминга, твороженная запеканка с мидиями, кисель из чистотела. - Stable Diffusion

Стол №2 : маринованные огурчики, фаршированные черемшой, расстегаи с бычками в томате, кефир "Боярский", сельдерей - для всего семейства Flux

Стол №3 : продукт пиццесодержаший "флорентина с ананасами", напиток вискарный "Джек Данилофф", чайный напиток "Пуэрный", козинаки из семян полыни - Qwen

Стол №4 : соевый напиток "Бабл Бинс", рагу из соевого мяса с рисовым бульоном, порридж из органического пшена с сублимированными ягодами - Pony, Chroma, Люстра.
Аноним 19/01/26 Пнд 01:44:57 1494742 123
>>1494736
без обид, клейнофилы, но судя по генам, как будто в тред полуторагодичной давности зашел, качество что сисика, что несисика - отвратительное.
При всем уважении, без негатива.
Аноним 19/01/26 Пнд 01:50:28 1494749 124
>>1494742
Конечно, это же флакс. Сюда нужен дмд2, а не турбо говно которое они используют, тогда хоть какое-то качество появится.

Я эту модель юзаю только как эдит, так как это лучшая локальная эдит модель. Но круто что оно ещё что-то умеет, особенно то что не умеют другие.
Аноним 19/01/26 Пнд 02:15:00 1494764 125
>>1494749
>как эдит
и лучше чем Qwen-Edit? Про нее слышал только хорошее
Аноним 19/01/26 Пнд 02:16:09 1494765 126
>>1494764
Лучше во всём кроме анатомии. У флакса анатомия дерьма.
Аноним 19/01/26 Пнд 02:18:49 1494767 127
Аноним 19/01/26 Пнд 02:21:35 1494770 128
>>1494767
Только хотел об этом написать, там ещё лору на сисик и писик хорошую завезли - https://civitai.com/models/2319552/nsfw-flux-klein-no-face-change?modelVersionId=2609505

Судя по всему кляйн очень хорошо обучаем. Так что возможно скоро настанет ренессанс генерации изображений, после затишья со времён сдохли.
Аноним 19/01/26 Пнд 03:01:31 1494792 129
>>1494770
Потестил фейс свап, у меня работает как полный кал. А вот сисик писик норм.
Аноним 19/01/26 Пнд 03:06:40 1494795 130
ComfyUI00013.webp 176Кб, 2880x1440
2880x1440
Flux2-Klein00020.png 5654Кб, 2880x1440
2880x1440
Flux2-Klein00024.png 4083Кб, 2880x1440
2880x1440
Хватит. Пора с пруфами развалить колдунов-аблитодрочеров с их магическим мышлением и «примерно почувствовал».

>>1494678
>>1494680

Вот это они молодцы, что написали. Надо чтобы как табличку на шее носили, когда постят: «Я использую GGUF». Всё. На этом можно было бы ставить точку. Редкий GGUF отквантован корректно, сохраняя самые важные веса в высокой точности, а второстепенные с меньшей. Тех, кто выпускает качественные GGUF на HuggingFace по пальцам пересчитать можно. Чаще получается «GGUF взял — важные веса потерял». Вы даже представить не можете где вам насрут ваши GGUF, пока не сравните с BF16 или хотя бы с FP8 моделями.
Следующий момент, если у вас не BF16 или хотя бы FP8 модель, то ваши результаты тоже под вопросом. Снижение точности модели влияет на генерацию.
Когда у вас начинаются чудеса, пеняйте в первую очередь на низкую точность модели, потом на distill и разные ускорялки.

Поскольку то, что я писал в прошлый раз по поводу экспорта и анализа conditioning для местной аудитории тяжеловато, скорректирую подход в сторону первой сигнальной системы по Павлову, чтобы было доходчиво.

Итак серия изображений:
Левая часть: qwen_3_8b.safetensors;
Правая часть: Huihui-Qwen3-8B-abliterated-v2.safetensors (полноценный, на 16 Гбайт, не GGUF обрезки)
https://huggingface.co/huihui-ai/Huihui-Qwen3-8B-abliterated-v2/tree/main
Я про него уже писал, когда отвечал на тему abliterated text encoders.

Настройки генерации:
Модель: flux-2-klein-base-9b.safetensors;
Steps: 20;
CFG: 5.0;
Seed: 42 (фиксированный);
Остальные настройки samplers и прочее можете посмотреть (а также проверить результаты генерации) в прилагаемом workflow (файл ComfyUI_00013_.webp)
Остальные примеры следующим постом:

И пусть теперь хоть кто-нибудь ещё раз заикнётся, что abliterated text encoder в случае для FLUX.2 [klein] даёт что-то радикально отличное от обычного text encoder. Сказки про анатомию и прочее туда же.
Аноним 19/01/26 Пнд 03:07:40 1494798 131
Flux2-Klein00022.png 9021Кб, 2880x1440
2880x1440
Flux2-Klein00023.png 5099Кб, 2880x1440
2880x1440
>>1494795
Приложение к посту.
Аноним 19/01/26 Пнд 03:08:06 1494799 132
>>1494792
>полный кал
ака геймченджер)
>>1494767
>>1494770
успокойся уже, ты засрал весь тред своим кляйном никакущим
Аноним 19/01/26 Пнд 03:19:22 1494805 133
image.png 28Кб, 275x183
275x183
>>1494795
Опять шиз пришёл. Никому не интересны твои посты. Нормальные сравнения уже были до тебя, а свои я постить не буду, мне лень на это время тратить. Пользуйся дальше на здоровье и причмокивай.
Аноним 19/01/26 Пнд 03:44:42 1494813 134
Мда ребятки.. Шел уже 2к26 год, а все ниче лучше нсфв SDXL так и не выпустили. Сколько уже всего понавысирали модного и веселого, и каждая все хуже и хуже может нарисовать ебаную анатомию банально, неужели это так сложно? Лоры не спасают а ломают, как это видно в квене например. В итоге так и остается сидеть на дмд сдохле, которая все еще ебет новое говно как это не печально
Аноним 19/01/26 Пнд 03:52:38 1494821 135
>>1494795
>Вы даже представить не можете где вам насрут ваши GGUF, пока не сравните с BF16 или хотя бы с FP8 моделями.
А если ггуф в 8 кванте?..
Аноним 19/01/26 Пнд 04:09:38 1494825 136
>>1494813
Очень большие усилия уходят именно на то, чтобы заблокировать возможность генерации харама. Если бы просто тренили на качество без задней мысли, не было бы проблем с анатомией. Самые мощные современные модели очень слабо зацензурены на уровне датасета и теоретически могут рисовать что угодно, так как разработчик имеет возможность цензурить картинки после генерации и не отдавать их юзеру. Разрабы моделей с открытыми весами такой возможности не имеют, поэтому калечат свои модели — с плачевными результатами, выходящими далеко за рамки обнаженки.
Аноним 19/01/26 Пнд 04:22:43 1494831 137
ComfyUI00037.png 2944Кб, 1536x1536
1536x1536
ComfyUI00032.png 2887Кб, 1536x1536
1536x1536
ComfyUI00027.png 3164Кб, 1536x1536
1536x1536
ComfyUI00017.png 3333Кб, 1536x1536
1536x1536
ComfyUI00016.png 3221Кб, 1536x1536
1536x1536
ComfyUI00015.png 3119Кб, 1536x1536
1536x1536
ZI turbo bf16
Аноним 19/01/26 Пнд 05:16:21 1494864 138
>>1494821
Хоть в каком.
Я уже обжёгся на GGUF, пока не открылись глаза.
Ничего против GGUF не имею для случаев, когда VRAM/RAM и даже SSD вместе для запуска не хватает. Тут безальтернативно.
Но когда есть выбор, лучше GGUF не пользоваться.

Я уже писал о том, что всё очень сильно зависит от того кем и как был квантован GGUF. Если автору GGUFа удалось отделить все важные веса в блоки с точностью BF16/FP8, а второстепенные с точностью ниже, то может быть и терпимо.
Как вариант оценки, собрать workflow, где будут сшиваться два изображения и прогнать беглое сравнение конкретного GGUF с обычной BF16/FP8 моделью, чтобы своими глазами увидеть результаты под свои собственные prompt, оценить отличия.

Фокусы GGUF не всегда удаётся заметить сразу, но когда они вылезают, ты даже не поймёшь, что испортило тебе генерацию. Будешь sampler/scheduler крутить, strength LoRAs менять, потом дойдёшь до CFG, shift и количества шагов, пока не выяснишь, что дело было в конкретном GGUF, после того, как сравнишь его именно на этом конкретном prompt с результатом на BF16/FP8 модели.
Может быть, ты с этим не столкнёшься. Я уже сыграл в эту игру и больше не хочу.

Дальше исключительно моё субъективное мнение, а не рекомендация:
Если мне приходится выбирать именно для моделей генерации изображений, то: BF16>FP8>GGUF_Q8 (это несмотря на то, что в некоторых GGUF часть весов в точности выше FP8, что казалось должно было бы перекрывать модель у которой все веса в FP8)>далее до Q6>Q5>дальше всякие nunchuku с их svdq квантами>дно>Q4 и ниже (ниже Q5 и svdq nunchuku я вообще не пробовал для генерации).
Аноним 19/01/26 Пнд 06:32:28 1494890 139
>>1494770
>там ещё лору на сисик и писик хорошую завезли
ПОтестил, действительно неплохо.
Аноним 19/01/26 Пнд 06:53:17 1494894 140
>>1494795
Спорить с долбоёбами в интернете это одно, а правда всегда превыше.

Сделал полноценные прогоны на нормальных промптах, с которым флакс не справляется и которые должны быть зацензурены, ровно 0 разницы, ни одна абла модель никакой разницы не привнесла. А те первые короткие тесты, меня затролил рандом, выпал сид на котором обычный энкодер делает расчленёнку, а абла нет и так несколько раз. Так что, что клип скип, что абла, на флаксе ровно нихуя не делают, используйте сток энкодер и сток клип.
>>1494799
Когда вам долбоебам уже входы на сайты по паспорту выдавать будут? Чтобы за гнилой базар ответ несли.
>>1494864
Опять шиза. Речь шла о энкодерах, на которых разница минимальна в большинстве случаях и q4 практически ничем не отличается от полноценных весов. И ты решил подменить это на "модели генерации изображений", в которых любому идиоту понятно что кванты портят качество, достаточно взглянуть на любые картинки сравнения city96.
>>1494813
Если тебе нравится кушать пластиковый кал, то дмд сдохля действительно 10 из 10.

На деле у нас нет ни одной нормальной дотренировки современного флюкса/з-имаге/квена потом обмазанной дмд, чтобы что-то сравнивать. А как базовые модели что кляйн, что з-имага, что квен очень неплохие и сдохля им в подмётки не годится по многим параметрам.
Аноним 19/01/26 Пнд 06:57:18 1494895 141
>>1494890
Хотя потестил по лучше, не хуйня, но лучше чем ничего...
Аноним 19/01/26 Пнд 07:19:36 1494906 142
>>1494894
> Речь шла о энкодерах

Хорошо, что уточнил.
По одному очень информативному предложению в посте я контекст потерял и завёл старую пластинку. Представил, что в довесок к text encoder, модели генерации у них тоже GGUF низких квантов, что вместе должно давать потрясающий результат.

>энкодерах, на которых разница минимальна большинстве случаях и q4 практически ничем не отличается от полноценных весов.

Я с этим согласен (в целом).
Поступлю проще, если будут силы и время, накачаю разных квантов, дополню workflow и прогоню ещё раз из любопытства, благо уже целая коллекция собралась: аблит и обычный в bf16, fp8mixed, осталось гуфов качнуть и side by side расставить.
Аноним 19/01/26 Пнд 08:04:57 1494917 143
>>1494764
>Qwen-Edit? Про нее слышал только хорошее
Серьёзно? Но ведь это пластмассовая хуйня с мутными бэкграундами уровня первой сдохли.
Аноним 19/01/26 Пнд 08:45:35 1494931 144
>>1494767
> training data 300 мб
> лора 600 мб
Какие же дегенераты.
Аноним 19/01/26 Пнд 09:23:07 1494957 145
Аноним 19/01/26 Пнд 11:09:38 1495047 146
Аноним 19/01/26 Пнд 11:19:51 1495051 147
image.png 14Кб, 585x143
585x143
>>1494931
>кАкИе жЕ дЕгЕнЕрАтЫ..................
Аноним 19/01/26 Пнд 11:35:37 1495056 148
>>1494931
А ты чертежи, и дом по ним построенный - тоже по размеру сравниваешь? :)

Чудик, размер лоры не привязан к размеру датасета напрямую. Зато косвенно указывает - какой у нее Rank, т.е. сколько информации она может хранить. И если ты не хочешь видеть одну единственную сиську везде - нужен высокий Rank лоры, чтобы бы было где хранить информацию о том, что есть такое "сиськи" вообще, и как они могут выглядеть во всем их разнообразии. :)

Простая аналогия: Rank = коробка. В маленькую коробку много не засунешь. А в силу особенностей всего этого дела - "коробку" надо для лоры выбрать заранее. Потом заменить уже нельзя, только начинать заново.
Аноним 19/01/26 Пнд 11:58:17 1495069 149
бля, в каждом треде мусолится одна и та же хуйня без конца
анчоусы, аблитерейтед и прочие "расцензуренные" версии нужны для того чтобы взаимодействовать с ллм в режиме аля чатбот, когда моделька должна "подумать" и выдать какой-то ответ на твои запрос.

когда же ллм используется тупо как текст экодер для генерации картинок, то новый текст она не генерит, соответственно нет разницы между обычной и "расцензуренной" версией.
Аноним 19/01/26 Пнд 12:05:51 1495074 150
image.png 21Кб, 768x768
768x768
image.png 1975Кб, 1024x1024
1024x1024
Аноним 19/01/26 Пнд 12:11:18 1495080 151
>>1495056
Чел, лора должна быть low-rank, лоры просто не предназначены для рангов выше 128. И лоры на высоких рангах начинают шум датасета запоминать, а не концепты. Плато знаний лор всегда в районе 16-32, даже на мультиконцептах. А генерализация всегда выше на мелких лорах, чем на больших. Даже на UNET с конволюшенами выше 64 не было смысла идти, на DiT всё ещё более сжато.
Алсо, при ранге 128 и датасете в 500 пикч у тебя весов больше чем есть пикселей в датасете, кроме шума или оверфита там ничего не будет. Я ту лору зетестил, она больше мыла добавляет, чем консистентности лиц, лол.
Аноним 19/01/26 Пнд 12:30:38 1495100 152
>>1495080
У меня была скачана лора на селебу с цивита, когда их еще не выпиливали, и это была самая лучшая и гибкая лора которая воспроизводила в точности человека, очень гибкая и поддающееся любым действиям. И вот что самое интересное, весила он 16 мб, и rank был 8 или даже меньше. Почему то так

мимо
Аноним 19/01/26 Пнд 12:50:24 1495122 153
>>1495100
лора на селебу (одна штука), которую можно натренить хоть из десяти фоток vs лора на сложный концепт из огромного датасета
действительно, почему ранг разный.......

ну и гибкость про которую ты говоришь идет от базовой модели а не от лоры, лол
Аноним 19/01/26 Пнд 13:14:15 1495169 154
1210001-A halft[...].jpg 4530Кб, 2688x1536
2688x1536
2024001-Nationa[...].jpg 3273Кб, 1664x2432
1664x2432
1541004-Art Sty[...].jpg 1425Кб, 1248x1824
1248x1824
0134001-Art Sty[...].jpg 958Кб, 2016x1152
2016x1152
Аноним 19/01/26 Пнд 13:41:11 1495235 155
>>1494795
>Редкий GGUF отквантован корректно
Дай я тебя обниму анонче. Наконец-то в треде еще один разумный человек!

>Следующий момент, если у вас не BF16 или хотя бы FP8 модель, то ваши результаты тоже под вопросом. Снижение точности модели влияет на генерацию.
Этот постулат надо выжигать каленым железом на лбу свидетелям святого Герганова.

Весь псот - в шапку перекота капсом и болдом.
Аноним 19/01/26 Пнд 14:34:03 1495295 156
>>1494680
>>1494678
А в виде одного сейфтензорс-файла, как ванильный?
Аноним 19/01/26 Пнд 15:46:26 1495357 157
Аноним 19/01/26 Пнд 16:54:03 1495438 158
Тут лора появилась на замену головы https://civitai.com/models/2027766?modelVersionId=2610018 для Кляйна. В комментах там есть ссылка на воркфлоу.
Это уже получше той клоунады, что со стандартным минималистичным воркфлоу без лоры, голова вставляется практически бесшовно, и тени, и баланс цветов подгоняется. Но и здесь не без недостатков. С этой лорой модель с завидным упорством меняет всю голову, включая волосы. Причем делает это со всеми персонажами, которые есть на картинке.
Аноним 19/01/26 Пнд 17:25:43 1495483 159
>>1495438
Что с этой лорой, что без нее, такое чувство, что работаю не нейросеткой, а с четко прописанной функцией программы. От изменений промпта вообще нуль изменений в результате. С лорой меняет более-менее плавно, но результат строго предопределенный.
Аноним 19/01/26 Пнд 17:42:27 1495508 160
>>1495438
ты в этот воркфлоу вообще заглядывал? он ничем от дефолтного не отличается. я уже даже не спрашиваю почему ты вообще ожидал что для сраной лоры нужен специальный воркфлоу , для же вас даунов необучаемых "вокрфлоу" это черная коробка которая неизвестно как работает даже если все ноды перед глазами, если чето не получается надо бежать искать новую черную коробку, которая наверное заработает лучше, 2026 год на дворе ебать

из клоунады тут только то как ты промптишь. уже писал тебе что не надо пытаться одновременно радикально менять стиль и свапать лицо за один промпт, кляйн такое с трудом переварит.
Аноним 19/01/26 Пнд 17:59:41 1495533 161
Анончики, подскажите не шарящему, на RX 570 вообще не судьба запустить, да?
Аноним 19/01/26 Пнд 18:03:29 1495539 162
>>1495533
Купи на авиито 3060 12 гигов хотя бы на амд пердолинг сильнее да ещё и на такой старой хуй знает ваще запустится ли. Я так и сделал
Аноним 19/01/26 Пнд 18:03:53 1495540 163
>>1495533
> на RtX 5o70
Если немного пофиксить - то можно.
Аноним 19/01/26 Пнд 18:29:45 1495605 164
>>1495533
можно, но вангую, что тебе не понравится:

Сначала определись, на чем ты хочешь запускаться. У тебя есть 2 пути: Винда и Линух.
Если твой путь Винда - то гугли ZLUDA (там надо будет немного ручками в процессе пошаматься с заменой системных библиотек)
Если Линух - долбиться в RocM как делали диды

В обеих случаях - ставь Comfy сборочку под амудэ, не ебись с говняком типа Forge, Automatic1111 и прочими ископаемыми. Все гигачэды юзают только комфи, не буль лузером.

Будь готов потратить 1-3 дня на пердолинг, гугление ошибок, и в результате ты получишь нестабильную систему с скоростью 1-2 секунды на шаг (или хуже).

Для твоей RX 570 самый очевидный вариант — поехать на авито и на вырученные деньги (не смей ржать в лицо покупателю) сформировать финансовый базис для покупки нормальной видеокарты.

А еще лучше - выдели пару десятков тысяч рублей и бери периодически в аренду сервачок. Вангую, за месяц ты попробуешь все что хочешь, надрочишься на AI-писик и успокоишься. Это будет дешевле покупки карты (купишь карту-захочешь апнуть еще что-то и т.д)
Аноним 19/01/26 Пнд 19:17:28 1495692 165
>>1495508
Ты всерьез считаешь, что заменить лицо в фотореалистичной картинке на лицо из другой фотореалистичной картинки означает радикально изменить стиль? Тяжелый случай. Иди лучше поичтай документацию к черным ящикам, может это тебе прочистит голову, хотя вряд ли это поможет понимать больше двух слов одновременно.
Аноним 19/01/26 Пнд 19:25:29 1495707 166
>>1493835 (OP)
Походу в треде орудует семен, который ни разу не запускал комфи и вообще не имеет представления о нейронках. Он невпопад отвечает анонам, на поверхностный взгляд по теме, но по факту полную бессмыслицу.
Аноним 19/01/26 Пнд 19:29:05 1495709 167
>>1495707
описал 99% посетителей треда
Аноним 19/01/26 Пнд 20:06:50 1495751 168
ComfyUItempchca[...].png 2608Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 2067Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 2431Кб, 1152x1280
1152x1280
Аноним 19/01/26 Пнд 20:07:28 1495752 169
ComfyUItempchca[...].png 2466Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 2812Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 2558Кб, 1152x1280
1152x1280
клеин хорош!
Аноним 19/01/26 Пнд 20:11:52 1495757 170
>>1495707
Он тут еще с 22-го. Просто остальные перестали отвечать.
Аноним 19/01/26 Пнд 20:25:39 1495770 171
ComfyUItempchca[...].png 2492Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 2732Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 1917Кб, 1152x1280
1152x1280
Аноним 19/01/26 Пнд 20:47:52 1495799 172
>>1495707
с подключением!
Все мы тут я/мы семен.
Аноним 19/01/26 Пнд 20:50:43 1495806 173
>>1495751
>>1495752
>>1495770
вау, ван герл стэндинг\ситтинг ультра-хайпер-реалистик мастерпис 8К
Аноним 19/01/26 Пнд 20:52:05 1495809 174
>>1495806
Бескартиночный спок
Аноним 19/01/26 Пнд 21:00:54 1495821 175
>>1495809
вот только не надо наличности переходить. Отсутствие фантазии не нивелируется фактом наличия возможности генерировать.
Аноним 19/01/26 Пнд 21:05:23 1495831 176
>>1495821
А ты собак генеришь? Или хуету эту соевую для нормикала из пабликов?
Аноним 19/01/26 Пнд 21:17:33 1495845 177
176884592179991[...].png 1782Кб, 1872x864
1872x864
176884600593637[...].png 1768Кб, 1786x864
1786x864
176884634199797[...].jpg 824Кб, 2025x1759
2025x1759
Аноним 19/01/26 Пнд 21:33:17 1495854 178
>>1495845
>Replace the standing man from image 1 with the woman from image 2 while keeping the same pose
Жертвы, блядь, ЕГЭ. Вам доступно изучение английского языка в любом формате, все возможности - буквально на кончиках пальцев.
Но нет блядь, мы будем гнуть свою линию и удивляться, почему условная модель делает не то и не так.

Swap the standing man in image 1 with the woman in image 2, but keep the man’s pose.
Аноним 19/01/26 Пнд 21:36:32 1495858 179
>>1495831
Ебущихся в трясине луизинских болот антропоморфных особей с головами колумбийцев и телами гиен.
А ты с какой целью интересуешься?
Аноним 19/01/26 Пнд 21:38:29 1495864 180
>>1495854
ору с еблана
ты во первых проигнорил то что модель нормально свапнула по такому промпту, а во вторых сам написал полную дрисню вместо промпта
мимо
Аноним 19/01/26 Пнд 21:42:01 1495867 181
>>1495854
swap подразумевает, что их нужно поменять местами, кста.
В конце вообще путаница, у тебя по таймлану мужик уже заменен на бабу, но ты все равно просишь сохранить позу мужика.
Аноним 19/01/26 Пнд 22:07:31 1495893 182
>>1495864
>нормально свапнула по такому промпту
смешно, но оу-кэй
>мимо
хуимо, мой маленький дофаминофаг, ищущий одобрения у незнакомых людей.

>>1495867
>swap подразумевает
это у тебя ГБОУ СОШ №2 подразумевает, а вот у носителей языка все предельно понятно и четко.
> тебя по таймлану
какой блядь тайм-лайн, у тебя LLM-энкодер, а не CLIP. ебать да кому я это все пишу...
Таймлайн у него блядь, заклинания буков, ебать мой хуй.
Аноним 19/01/26 Пнд 22:14:17 1495900 183
ComfyUItempproj[...].png 1665Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 2725Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 2638Кб, 1152x1280
1152x1280
ComfyUItempchca[...].png 2844Кб, 1152x1280
1152x1280
клеин хорош!
Аноним 19/01/26 Пнд 22:20:19 1495906 184
176885034678067[...].png 3295Кб, 1867x1248
1867x1248
it's over
Аноним 19/01/26 Пнд 22:30:12 1495931 185
>>1495893
> ищущий одобрения у незнакомых людей.
не неси хуйню и тогда незнакомые люди не будут одобрять то что тебя называют ебланом, все просто
Аноним 19/01/26 Пнд 22:31:36 1495934 186
ComfyUItempproj[...].png 2608Кб, 1152x1280
1152x1280
ComfyUItempproj[...].png 2753Кб, 1152x1280
1152x1280
ComfyUItempproj[...].png 2301Кб, 1152x1280
1152x1280
ComfyUItempproj[...].png 2466Кб, 1152x1280
1152x1280
Когда там на кляйн уже прикрутят генерацию за наносек а-то на моем бич пк по 20 сек приходится ждать....

Кстати, понимание промпта у него лучше чем на зедке.
Аноним 19/01/26 Пнд 22:32:19 1495939 187
>>1495934
У Кляйна зато анатомия хуже чем на зедкн
Аноним 19/01/26 Пнд 22:33:54 1495941 188
>>1495707
Он в каждом треде активный пользователь. Особенно смешно, когда свои картинки выкладывает, там кровью плакать хочется. Хотя на словах он ниибацца Лев Толстой.
Аноним 19/01/26 Пнд 22:42:38 1495951 189
ComfyUItempproj[...].png 2253Кб, 1152x1280
1152x1280
ComfyUItempproj[...].png 2614Кб, 1152x1280
1152x1280
ComfyUItempproj[...].png 2701Кб, 1152x1280
1152x1280
>>1495939
С этим сложно поспорить, но не настолько там всё плохо, просто больше итераций приходится делать...
Аноним 19/01/26 Пнд 22:46:25 1495955 190
>>1495939
9B явно лучше зетки. Зетка даже лежащую а кровати тянку не может сгенерить.
Аноним 19/01/26 Пнд 22:50:20 1495959 191
image.png 584Кб, 900x900
900x900
>>1495955
ну почему, сможет... но только один раз
Аноним 19/01/26 Пнд 22:51:19 1495960 192
ComfyUItempproj[...].png 2879Кб, 1152x1280
1152x1280
>>1495955
9б не каждое карыто потянет, да и если бы зедка была 9б то мне кажется она бы нагнула кляйн, при том что зедка 4б не очень сильно уступает 9б кляйну
Аноним 19/01/26 Пнд 23:03:06 1495969 193
ComfyUItempproj[...].png 1979Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 1747Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 2049Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 2134Кб, 1024x1024
1024x1024
Аноним 19/01/26 Пнд 23:11:40 1495987 194
>>1495960
>9б не каждое карыто потянет
Любое, которое тянет ZIT. Разница по нужным ресурсам минимальна, особенно если учесть, что кляйн официально в FP8 есть.

>при том что зедка 4б не очень сильно уступает 9б кляйну
??? Какая еще ZIT 4B??? Отсыпь, такого-же, а? :)
Аноним 19/01/26 Пнд 23:15:36 1495994 195
ComfyUItempproj[...].png 2175Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 1792Кб, 1024x1024
1024x1024
>>1495987
>Какая еще ZIT 4B?
я не про саму модель (она 6б) а про ллм (там квен 4б)
Аноним 19/01/26 Пнд 23:22:35 1496003 196
>>1495893
>а вот у носителей языка все предельно понятно и четко.
Ловите носителя языка!
Быстрее, пока не убежал!
Будет нам промпты писать!
Какой же ты даун.
Аноним 20/01/26 Втр 00:36:22 1496066 197
Untitled-1.jpg 324Кб, 1108x607
1108x607
Хз че тут жалуются на фэйс свап. Нормально работает через воркфлоу от разрабов. Для результата нужно покрутить сэмплеры и шаги. И это через корявый промт Replace the character's face in image 1 using the character's face in image 2. Even out the skin tone and lighting. Баб раздевает, лица меняет, вот только с позами пока не очень. Писик >>1494767 работает кста.
Аноним 20/01/26 Втр 01:03:50 1496099 198
>>1496066
Проблема в том что он работает только для свапа, если хочешь сгенерить что-то с заданным лицом - эта лора только хуже делает. А свап нахуй не нужен, его и до этого умели делать на любом говне.
Аноним 20/01/26 Втр 01:22:24 1496108 199
>>1496099
если бы еще оно умело нормально генерить по референсу, а оно не умеет

Кляйн это урезанная версия флюкс 2 все таки, и лоботомия, похоже, сильно повлияла на возможности генерации, когда эдит функционал задела относительно слабо. Поэтому только и остается что генерить всратую хуйню не похожую на реф, а потом дополнительно свапать и получать относительно неплохой результат, пусть и не без нюансов.

а лора на свап мне не зашла тоже, без нее лучше
Аноним 20/01/26 Втр 01:43:41 1496119 200
>>1496099
>лора на свап мне не зашла тоже
Это я объебался, не тот линк сделал. Вот это хотел линкануть https://civitai.com/models/2319552/nsfw-flux-klein-no-face-change?modelVersionId=2609505 Без этой лоры, из коробки, у меня рисовало вагину куклы. С ней норм рисует волосатую.
Лору на свап не использовал, юзал дефолтный воркфлоу от разрабов, тот где 5 в одном. Людей удаляет, одежду меняет. С аутпеинтом пока не разобрался.
Аноним 20/01/26 Втр 03:26:25 1496168 201
Тут все на portable сидят что ли? Комфи чмо забыло загрузить апдейт для базового manual installation. Хуй поймешь как обновиться на версию с кляйном без установки портабл параши для даунов.
Аноним 20/01/26 Втр 03:27:40 1496169 202
Кстати, что по генерации изображений на LTX2?
Аноним 20/01/26 Втр 03:34:49 1496172 203
>>1496168
портабл для даунов, кляйн тоже для даунов, вообще все для даунов, забей хуй сиди кайфуй
Аноним 20/01/26 Втр 04:02:16 1496182 204
ComfyUI00015.webp 316Кб, 1448x724
1448x724
Flux2-Klein00028.jpg 5918Кб, 5760x2880
5760x2880
Flux2-Klein00029.jpg 6564Кб, 5760x2880
5760x2880
>>1494906

>Поступлю проще, если будут силы и время, накачаю разных квантов, дополню workflow и прогоню ещё раз из любопытства, благо уже целая коллекция собралась: аблит и обычный в bf16, fp8mixed, осталось гуфов качнуть и side by side расставить.

Я хожу по Hugging Face с чёрным мешком для мусора и собираю в него все GGUF, которые вижу. На два полных мешка целый день уходит. Зато, после тяжёлого дня я прихожу домой, иду в ComfyUI, включаю горячую цепочку узлов workflow… мм и сваливаю в неё своё сокровище.

Настройки генерации (такие же как и вчера в посте):
Модель: flux-2-klein-base-9b.safetensors;
Steps: 20;
CFG: 5.0;
Seed: 42 (фиксированный);
Остальные настройки samplers и прочее можете посмотреть (а также проверить результаты генерации) в прилагаемом workflow (файл ComfyUI_00015_.webp)

В качестве поставщика GGUF был субъективно выбран уже проверенный по другим моделям bartowski:
https://huggingface.co/bartowski/Qwen_Qwen3-8B-GGUF/tree/main

На изображениях иллюстрация работы различных text encoders в порядке слева направо, сверху вниз:

1) qwen_3_8b.safetensors;
2) Huihui-Qwen3-8B-abliterated-v2.safetensors;
3) qwen_3_8b_fp8mixed.safetensors;
4) Qwen_Qwen3-8B-Q8_0.gguf;
5) Qwen_Qwen3-8B-Q5_K_M.gguf;
6) Qwen_Qwen3-8B-Q4_K_M.gguf;
7) Qwen_Qwen3-8B-Q3_K_M.gguf.

>Файл слишком большой.
Зашакалить теперь что ли?

Исходные изображения будут доступны по ссылке в течение недели: https://limewire.com/d/avwgQ#cHSFJlIfml
Аноним 20/01/26 Втр 04:06:26 1496185 205
Flux2-Klein00027.jpg 4595Кб, 5760x2880
5760x2880
Flux2-Klein00030.jpg 5746Кб, 5760x2880
5760x2880
Flux2-Klein00031.jpg 4419Кб, 5760x2880
5760x2880
Flux2-Klein00032.jpg 4838Кб, 5760x2880
5760x2880
>>1496182

Я не ожидал, что Qwen_Qwen3-8B-Q3_K_M.gguf вообще сработает.
Аноним 20/01/26 Втр 04:38:34 1496193 206
image.png 1389Кб, 912x1136
912x1136
>>1496172
Нет покоя даунам. Случилось классическое Я ЧТО-ТО НАЩЕЛКАЛА И У МЕНЯ ВСЁ ПРОПАЛО, поэтому не обновлялось. Комфи чмо не виновато. Портабл для умнейших. Все апдейты на месте.
Аноним 20/01/26 Втр 05:43:34 1496198 207
Klein nvfp4 на 40-серии медленней чем fp8? Как по качеству? Есть смысл чисто ради меньше размера юзать?
Аноним 20/01/26 Втр 06:12:14 1496206 208
>>1496198
Я не проверял, а то, что скажу дальше, скорее нафантазирую (ну ничего, поправят, если что):

Фишкой 4000-й серии было аппаратное ускорение FP8 и оно очень здорово зашло для нейронок.
Эту «ошибку» решили исправить в 5000-й серии, ускорив FP4 (для нужд FG в DLSS 4.5, нейротекстур и прочего, что обещают).
На 4000-й серии FP4 (в теории), должны работать медленнее (чем на 5000-й серии). По крайней мере об этом писали применительно к ComfyUI:
https://blog.comfy.org/p/new-comfyui-optimizations-for-nvidia

Помимо этого можно не говорить, что точность FP4 ниже, чем FP8 (про BF16 не говорим).
Я на 4080s в сторону FP4 даже не смотрел. Это на 5000-й серии на топах и предтопах разработчики ComfyUI обещают двукратный прирост (для 5000-й серии) по сравнению с вычислениями на них FP8 и BF16/FP16 (что косвенно позволяет сделать вывод, что FP8 и BF16/FP16 на 5000-й серии не ускорялись).

Тем не менее, по словам впаривателей-маркетологов, NVFP4 должно быть сопоставимо по качеству с FP8 (да чего уж там и с BF16; не удивлюсь, если ещё FP32 переплёвывает), но в два раза быстрее и так далее.

Если протестируешь, расскажи, пожалуйста. Я сижу на BF16 и FP8 как наиболее подходящих для моей видеокарты.
20/01/26 Втр 06:13:15 1496208 209
Попробовал новый флакс кляйне 9см, вспомнил что у людей бывают 3-7 пальцев. как давно это было
Аноним 20/01/26 Втр 06:25:58 1496215 210
>>1496208
Не давнее, чем Z-Image-Turbo. Там иногда и по три ноги рисует, не то, что пальцы. Особенно проявляется, когда нестандартное (а не 1girl standing) положение тела или взаимодействие персонажей пытаешься описать. Просто тут говорить об этом не принято, ведь «Z-Image-Turbo это самая лучшая модель1111».
Аноним 20/01/26 Втр 06:46:59 1496220 211
>>1496206
>Фишкой 4000-й серии было аппаратное ускорение FP8
А это ускорение с нами в комнате? Я сколько не читал про эту поддержку, ни разу в комфи не видел значительного ускорения между bf16 и fp8 моделями ни на какой нейронке: видео, аудио или изображениях. Чувствую как будто наебали.
Аноним 20/01/26 Втр 06:49:39 1496221 212
>>1496198
>nvfp4 на 40-серии
nvfp4 только на 50xx даёт буст.
Аноним 20/01/26 Втр 06:57:02 1496222 213
>>1496208
На кредите одит чел писал, что ситуацию сильно улучшает смена сэмплеров и шедулеров: обычный ksampler с euler/simple или euler/beta.
Там же советовали flux2 latent ноду для разрешения. Типа, она правильнее размер задаёт, что помогает артефакты уменьшить.
Я сам не тестировал, может и сработает.
Аноним 20/01/26 Втр 06:58:03 1496223 214
Как сейчас дела у SD 3.5, повторили ли они успех SDXL? Есть на нее какие либо тюны крупные и лоры? Ведь она продолжитель и прямое развитие SD после SDXL
Аноним 20/01/26 Втр 07:06:26 1496225 215
image.png 16Кб, 508x108
508x108
>>1496223
>Ведь она продолжитель
А чего не сд3? Сд кал даже с цивита под чистую потерли. Поскорей бы еще вот этот мусор убрали из списка или хотя бы добавили возможность самому отключать ненужные блоки в фильтре.
Аноним 20/01/26 Втр 07:10:49 1496227 216
>>1496223
Сдохла под забором, уже давно похоронили и прикопали...
Аноним 20/01/26 Втр 07:15:00 1496232 217
Аноним 20/01/26 Втр 07:18:17 1496235 218
>>1496232
Зацензурена в нулину с наглухо поломанной анатомией, вроде еще были проблемы с обучением... короче лучше не вспоминать покойничка ))
Аноним 20/01/26 Втр 07:32:01 1496243 219
>>1496220
А это за сравнением надо к тем у кого 3000-я серия идти. Там нет аппаратного ускорения FP8. У них надо спрашивать как там дела.

Вот, нагуглил хоть что-то но надо тщательнее искать: https://github.com/Comfy-Org/ComfyUI/discussions/9002

Как нужно неудобную информацию найти, так поисковики скромничают.
Аноним 20/01/26 Втр 07:42:45 1496248 220
image.png 1413Кб, 832x1216
832x1216
image.png 1471Кб, 832x1216
832x1216
Модель на букву Кхр
Вариант на букву Ра выдает какое-то го
Аноним 20/01/26 Втр 08:29:10 1496260 221
Беглым взглядом dpmpp_2m_sde_gpu показался чуть лучше других для реализма на klein
Аноним 20/01/26 Втр 09:34:18 1496289 222
Аноним 20/01/26 Втр 10:38:59 1496310 223
Как сильно klein ебет qwen edit? Я почти не пробовал qie. Попробовал простой промпт со сменой ракурса и стиля на klein и прям ощутимая разница c kontext. Потому что kontext игнорит нахуй даже такой примитивный промпт. Он без лор вообще ничего не делал походу.

Алсо, у вас нет ощущения, что 4B лучше 9B?
Пиздец nsfw лора ебашит. Только ради неё можно было выпускать klein. Колоссальная разница между подобными лорами на прошлых эдитах. Да она даже лучше ручного инпейнта. И это я только на дистилле 9B попробовал без смены семплеров.
Аноним 20/01/26 Втр 10:54:47 1496318 224
Klein00128.png 1157Кб, 832x1232
832x1232
Аноним 20/01/26 Втр 11:06:22 1496328 225
ComfyUItempuqne[...].png 5195Кб, 1800x1400
1800x1400
>>1496289
>Это БАЗА
Да, сучки...
>>1496310
>Пиздец nsfw лора ебашит.
Нам остаётся только верить тебе на слово, как всегда...
>у вас нет ощущения
у нас есть стойкое ощущение, что ты дохуя пиздишь попусту.
Аноним 20/01/26 Втр 11:17:01 1496347 226
квен этит ты идёшь на хуй, зря качал. 9см удовлетворяют полностью
Аноним 20/01/26 Втр 11:41:45 1496371 227
>>1496310
>Как сильно klein ебет qwen edit?
Весьма заметно. :)

Вчера пол вечера игрался именно с edit режимом. Шикарно умеет менять стиль - первый qwen-edit нервно курит в сторонке. Это уже даже не просто замена стиля, а "сделай мне зашибись" из говна и палок. Скармливаешь на вход картинку-скетч вида "курица лапой" и промт "сделай из этого профессиональную фотографию" - делает, сцуко. В особо тяжелых случаях - можно в два прохода (взять то, что получилось с первого раза, и положить опять на вход).
Позы меняет примерно на уровне qwen-edit 2509 (2511 я так и не попробовал толком, ничего сказать не могу). Где-то лучше, где-то хуже, но в отличии от qwen - практически не трогает части изображения о которых его не просили. Через ноду RGTree Compare смотрел - очень хорошо сохраняет, и не сдвигает картинку.
Бекграунды меняет - песня (изредка - матерная, но в основном - зашибись выходит, и с минимальным промптом. :) )
Может вносить несколько изменений сразу практически не ухудшая от этого результат. Пишешь ему "сделай то, добавь это, замени задник, исправь вот здесь и здесь" - делает. Qwen такого сильно не любит.
И вроде бы нет характерного шакала картинки, как у Flux Kontext, если редактировать картинку последовательно несколько раз. Только сид менять надо обязательно.

В общем - не уверен на счет qwen 100%, а Flux Kontext, IMHO, можно списывать в отставку.
Аноним 20/01/26 Втр 11:52:18 1496383 228
>>1496328
Это klein так сам хорошо генерит комнаты? Или он только раздел-подвигал? Такими темпами он и лучше ZIT окажется.
Аноним 20/01/26 Втр 11:53:40 1496388 229
>>1496383
>он и лучше ZIT окажется.
нет.
Аноним 20/01/26 Втр 11:54:40 1496392 230
>>1496383
>Это klein
Это zit без контролнета и прочей хуеты.
Аноним 20/01/26 Втр 12:04:01 1496404 231
dk2ggza-e1fbe71[...].jpg 3037Кб, 4800x7680
4800x7680
>>1495951
Нуб хиар. Я так понимаю, что такие пикчи по умолчанию зацензуренные и голыми не делаются? Их потом надо чем-то допиливать до нюдсов? как это сейчас происходит? Знаю что СД 1.5 был без цензуры, а как сейчас с новыми моделями? Какой сейчас вообще воркфлоу для прона?
Аноним 20/01/26 Втр 12:11:34 1496416 232
>>1496404
>не делаются?
делаются, но потом их долго деталить надо в nsfw модели с корявыми nsfw лорами. обычно свежие модели из коробки так не могут, гениталии доводятся в сдохле с соответствующими лорами.
Аноним 20/01/26 Втр 13:15:33 1496509 233
>>1496371
>Позы меняет
А ты позы менял через второе изображение/маску или промтом? Я чет вчера попробовал и так, и так и чет не очень получилось.
Аноним 20/01/26 Втр 13:23:43 1496515 234
image.png 1449Кб, 1031x1280
1031x1280
>>1496328
>Нам остаётся
>у нас есть
Вахтер, спокнись.
Аноним 20/01/26 Втр 13:26:36 1496522 235
Как симплтюнеру указать пути до уже скачанных чекпоинтов кляйна? Я ебал эти 20 гигов по второму кругу качать...
Аноним 20/01/26 Втр 13:47:21 1496561 236
>>1493835 (OP)
Какая модель лучше подойдет для рисования фантастических пейзажей, сцен, архитектуры?
Так чтобы это был не фотореализм, а скорее что-то рисованное красками.
И чтобы можно было модифицировать нарисованное или генерировать на основе референсов.
Аноним 20/01/26 Втр 14:00:22 1496581 237
А зачем вообще делать лору на персонажа. Если щас можно edit-ом с любого референса нагнать генов нужных, ракурсов и т.д
Аноним 20/01/26 Втр 14:30:52 1496609 238
>>1496581
потому что эдиты это тупой фейссвап и ты с ним никогда не получишь нужной консистенции перса. А лорой получишь
Аноним 20/01/26 Втр 14:58:45 1496622 239
>>1496522
Хм, ананас хочет использовать уже скачанные чекпоинты Flux Klein в SimpleTuner, чтобы не качать 20 ГБ заново. Понимаю его раздражение — повторная загрузка таких объёмов действительно раздражает.

Использование аргументов командной строки

Если вы запускаете обучение через скрипт, вы можете напрямую указать путь с помощью аргумента --model_path:

python train.py --model_path="/полный/путь/к/моим/моделям/flux-klein-4b"

Точное название аргумента уточните в документации или справке (--help) SimpleTuner.
Аноним 20/01/26 Втр 15:01:28 1496627 240
>>1496622
Если бы это было так просто - я бы не спрашивал.
Там есть параметры с путями, но эта залупа только для JSON с описанием конфигурации модулей пайплайна, а не для чекпоинтов.
Аноним 20/01/26 Втр 15:13:20 1496639 241
>>1496509
Просто промптом. Я по порядку пошел. Вчера ковырял возможности edit для случая с одной картинкой. С двумя изображениями, детально, играться сегодня буду. :)
Что понял - у него с промптом специфические отношения. Писать надо достаточно правильно, он еще чувствительней к этому делу чем ZIT. Чуть не так и ни туда написал - делает "как написано, а не то имелось в виду." :) Не умеет разрешать логические нестыковки.
Если написать "стоит лицом к зрителю в анфас и хорошо видна задница" - будет какая-то унылость или вообще хрень, потому что это невозможно логически. Другие модели - могут для такого промпта, скажем, зеркало добавить, где в отражении будет хорошо видно. Эта - нет, никогда. Пишите четко и ясно. Как задание китайцу, который "может все, только объясните - как?"

До того просто генерил t2i - вот там впечатления были: "неплохо, но не вау". ZIT вроде бы все-же получше для t2i в этом классе в целом. Хотя кляйн знает больше. Кентавров, например. :)

Но все же, пока, для меня кляйн выглядит в первую очередь как edit модель, по основным вероятным его применениям. Это точно его киллер-фича. По ней - нету у него конкурента в таком классе. Вообще нету. Kontext - спасибо, посмеялся (базару нет, первая ласточка, уважуха и все такое... но теперь разом устарел). Qwen - пластик за в 5 раз большее время. И кляйн один делает хорошо все то, для чего нужно аж три разных модели qwen-edit (стиль, позы, реализм). Flux2 dev - ну, если бы он у меня на 3060 заводился... :) И опять же - ждать несколько минут того, что кляйн за полминуты (даже на моем антиквариате!) делает...

Жду ZI-edit, как возможного конкурента. (Конкуренция - это хорошо! Как кошки. :) ) В qwen уже не очень верю, по данному вопросу.
Аноним 20/01/26 Втр 15:17:19 1496644 242
>>1496522
Лучше устрицу возьми. На СимплТюнере всё очень пердольно и медленно.
Аноним 20/01/26 Втр 15:28:50 1496652 243
>>1496581
Держи простейшую задачу: Джинкс сидит на скамейке, стиль как в Аркейне. Показывай это "можно" или больше не задавай тупых вопросов.
Про можно это в банане - и только благодаря тому, что он и без рефа это может сделать. Реф это хуйня, если модель не знает и не умеет.
Аноним 20/01/26 Втр 15:45:00 1496660 244
>>1496652
>Джинкс
Лучше сразу Powder, Джинкс любая собака нарисует.
Аноним 20/01/26 Втр 15:48:08 1496662 245
>>1496639
>Писать надо правильно
А, я тоже вчера игрался и писал достаточно корявые промпты, типа сделай позу в имидж1 из имидж2 и сделай персонажа сидящим.
Аноним 20/01/26 Втр 15:58:19 1496667 246
>>1496660
Да, бля, пускай хоть сейлор мун сделает без проебов деталей. Не помню какие у нее там детали, но если сетка их не знает, хоть усрись ты с сотней рефов, до пизды ей будет, модель постоянно будет их проебывать. Оно даже обычные человеческие джинсы не может повторять из раза в раз по заданному фото, придумывает заклепки, другие швы.
Но это я ещё не пробовал base... Может девяточка пиздец ебет.
Аноним 20/01/26 Втр 16:10:23 1496676 247
Зит был мегабыстрым по скорости обучения. А че, как klein? В 16гб влезает?
Аноним 20/01/26 Втр 16:14:05 1496681 248
>>1496676
В говноквантах или 4В если только. 9В в 32 гига лезет в bf16, скорость как у зетки.
Аноним 20/01/26 Втр 16:21:59 1496682 249
>>1496644
А там как? Там вообще всего одно поле - пробовал туда и папку с моделями и чекпоинт DIT. В последнем случае сыпет ошибками загрузки.
Аноним 20/01/26 Втр 16:36:39 1496691 250
>>1496652
>можно это в банане
которая делаем всем персам огромные непропорциональные головы, а если шот в полный рост - то уменьшает длину ног, делая из людей карликов.
Н первый взляд все ок, но если присмотреться и прикинуть пропорции - лителли, каждая гена либо карлан либо гидроцефал с раздутой бошкой
Аноним 20/01/26 Втр 16:37:22 1496693 251
>>1496660
>Джинкс любая собака нарисует.
Обидно
мимо_собака
Аноним 20/01/26 Втр 16:43:23 1496699 252
>>1494559
И что тогда взять на замену? Нунчаки? Ггуф?
Аноним 20/01/26 Втр 16:49:01 1496702 253
>>1495854
>in image
>запятая перед but
>keep pose
Ебать ты флюент.
Нейросетям вообще похуй. Разница между вашими промптами и replace baba будет минимальной.
Аноним 20/01/26 Втр 16:55:35 1496711 254
>>1493835 (OP)
Вопрос. Скачал портативную версию Comfy 0.9.2 на Винду. Вроде настроил кое-как первый воркфлоу (нубасина). Однако, скорость генерации очень низкая 15-20 it/sec на ksampler euler. Карта 5060 Ti 16 должна больше выдавать, вроде, причем намного. Модель Qwen Еdit Q5_K GGUF, помещается полностью в Vram. Оперативы 16, файл подкачки на 32, вроде все нормально во Vram грузится. Карта загружена странно, 20 процентов в диспетчере показывает и 80 процентов в Z-Gpu. Пробовал обновляться, выдало ошибку, нейронка говорит, что проблема из-за версии пайтон 3 13, под него типа сборок нужных штук нет. Скачал 0.9.0, то же самое и тот же Пайтон. Есть соображения какие-нибудь, может еще более старую сборку качнуть какую или где? Пока нет возможности все подряд качать и смотреть. Какие идеи, что это может быть? Кривой воркфлоу, ГГУФ тупой или сборка?
Аноним 20/01/26 Втр 16:59:47 1496714 255
comfy.jpg 297Кб, 2000x2800
2000x2800
>>1496711
Перепутал, 15-20 sec/it. И картинку забыл.
Аноним 20/01/26 Втр 17:06:49 1496719 256
изображение.png 993Кб, 852x797
852x797
изображение.png 314Кб, 516x588
516x588
Ну и как такое фиксить в кляйне? Лора эта вот https://civitai.com/models/2319552/nsfw-flux-klein-no-face-change?modelVersionId=2609505

Просто дорисовывает сам че хочет к анатомии и поебать ему на оригинал. Еще заметил что это с какой то одной стороны, с левой или правой всегда все ок
Аноним 20/01/26 Втр 17:09:02 1496721 257
>>1496099
>>1496108
>генерить всратую хуйню не похожую на реф, а потом дополнительно свапать и получать относительно неплохой результат
ВОТ ЭТО самый лучший вариант еще со времен InstantID и IP-адаптеров.
Сначала получаешь человека имеющего такие же пропорции и волосы как у референса +- форма головы.
Потом делаешь второй проход, можно и в приближении на меньшем участке картинки - только на лице, где делаешь полноценный фейс свап.
Настроить воркфлоу с фейс детектором и все - лучший копирщик человека а ля нано-банан.
Аноним 20/01/26 Втр 17:11:22 1496726 258
>>1496721
> со времен InstantID
Вообще то там лицо в точности воспроизводилось с референса и ниче свапать не надо было, а все остальное можно было менять.
Утерянные технологии древних хули
Аноним 20/01/26 Втр 17:11:48 1496727 259
>>1496711
>Qwen Еdit
если ты редактируешь уже существующую картинку, смотри чтобы она правильно даунскейлила оригинал, 4K картинку ни одна нейронка не перевари норм на компьютере, нужно ее даунскейлить до размеров, которые не будут перегружать видеокарту.

А вообще, возьмика из теплейтов последний воркфлоу на Flux.2 Klein.
Qwen Edit уже как бы не в теме сейчас.
Аноним 20/01/26 Втр 17:37:09 1496760 260
>>1496561
>Какая модель лучше подойдет для рисования фантастических пейзажей, сцен, архитектуры? Так чтобы это был не фотореализм, а скорее что-то рисованное красками.

Qwen-Image (не 2512), FLUX.2 [klein] с указанием стиля (FLUX.2 dev).

>И чтобы можно было модифицировать нарисованное

Qwen-Image-Edit-2509/2511, FLUX.2 [klein]

>или генерировать на основе референсов.

Qwen-Image-Edit-2509/2511, FLUX.2 dev
Аноним 20/01/26 Втр 17:38:24 1496763 261
image.png 12Кб, 289x164
289x164
Ну теперь только NoobAI-Z спасет.
Аноним 20/01/26 Втр 18:10:27 1496798 262
ComfyUItempproj[...].png 2149Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 1833Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 1636Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 1979Кб, 1024x1024
1024x1024
>>1496763
Ну кляйн 9б обьективно накибает зимагу
Аноним 20/01/26 Втр 18:10:50 1496799 263
>>1496727
Исходные картинки мелкие, в районе 500 на 700. Апскейл до 1024 примерно на выходе идет, либо такое же разрешение. Попробовал семплеры с приставкой GPU, чуть поднялась скорость до 12-15 сек. Я знаю, что еще лору на скорость можно воткнуть, но по-моему это все равно не то.

Дрова вроде нормальные, с последними такая же фигня была, откатил обратно.
Аноним 20/01/26 Втр 18:20:16 1496812 264
>>1496798
а можешь те же промты прогнать на зимаге, чтоб наглядно было?
Аноним 20/01/26 Втр 18:20:51 1496815 265
Зачем вам зетка, кляйн и т.п., если вы все равно на всех моделях генерите в точности то же самое, что генерили на сдохле? Какой-то пердолинг ради пердолинга.
Аноним 20/01/26 Втр 18:27:47 1496823 266
>>1496711
Как гипотезу, проверь выгрузку через диспетчер задач во время генерации (если не очень понимаешь то, что в консоли пишет).
Это тебе может только казаться, что у тебя всё влезает. А на деле offload на SSD может идти вовсю. Если есть интенсивная запись на диск, в диспетчере задач ты её заметишь. 16 Гбайт RAM это очень мало, при этом на 16 Гбайт VRAM видеокарте для работы доступно где-то 14. Я не помню сейчас сколько точно занимает Qwen-Edit модель. И ещё, размер файла GGUF ≠ объёму памяти, который требует модель. При этом VRAM не забивается полностью. Там остаётся значительный объём для генерации, а остальное выгружается в RAM. А поскольку RAM у тебя очень мало, то предполагаю, что дело доходит до SSD, со всеми вытекающими. Но это гипотеза.
Аноним 20/01/26 Втр 18:35:35 1496832 267
ComfyUItempproj[...].png 1266Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 1528Кб, 1024x1024
1024x1024
ComfyUItempproj[...].png 1705Кб, 1024x1024
1024x1024
Прикольно получается, кидаешь кляйну картинку, говоришь чтобы он зумировал определенный участок и он пытается его увеличить (в деталях проебывается конечно но всеравно интересно получается).
Аноним 20/01/26 Втр 18:42:44 1496839 268
ComfyUItemptumd[...].png 1965Кб, 1024x1024
1024x1024
ComfyUItemptumd[...].png 1346Кб, 1024x1024
1024x1024
ComfyUItemptumd[...].png 1364Кб, 1024x1024
1024x1024
ComfyUItemptumd[...].png 1557Кб, 1024x1024
1024x1024
Аноним 20/01/26 Втр 18:43:21 1496841 269
>>1496839
Это лучшее из 4 прогонов
Аноним 20/01/26 Втр 18:55:07 1496847 270
>>1496815
> в точности то же самое, что генерили на сдохле
ряяяяя, это другое ты непонимаешь
Питаются надеждой, что очередная убийца всех моделей нарисует идеальную сисю
Аноним 20/01/26 Втр 18:57:42 1496851 271
>>1496839
спасибо, мне этот вариант за вычером пиздоглазой азиатки на пик3 больше нравится чем выше.
Квэн по-прежнему топчик.
Аноним 20/01/26 Втр 18:57:48 1496852 272
ComfyUItempomem[...].png 1906Кб, 1024x1024
1024x1024
ComfyUItempomem[...].png 1944Кб, 1024x1024
1024x1024
ComfyUItempomem[...].png 1470Кб, 1024x1024
1024x1024
Аноним 20/01/26 Втр 19:03:15 1496857 273
>>1496815
Наверно не стоит говорить за всех.
Хотя в треде постят очень мало генераций.

В моём случае, ты отчасти угадал.
Я начал несколько лет назад с automatic1111. Столкнулся с несовершенством и ограничениями моделей того времени. Понял, что желаемых результатов без кучи костылей я не получу. Поскольку эта деятельность мне дохода не приносила, то я просто забросил всё до лучших времён.

Где-то полгода назад перевкатился, постепенно освоил ComfyUI, начиная с чужих workflow и плавно подошёл к построению своих, параллельно подтянул теоретическую базу, чтобы ориентироваться в новых решениях. Понеслись Qwen-Image (вся линейка, кроме 2512), Wan, FLUX2.dev, Z-Image-Turbo, FLUX.2 [klein].
Сначала была эйфория от prompt на естественном языке. Радость от того, что дожил до качественного скачка в работе с позами, ControlNet (Canny, Depth, OpenPose), постановкой света сцены, color grading, функциями Edit-моделей.
Постепенно восторг стал проходить, когда опять начал сталкиваться с неизбежными костылями и ограничениями. В некоторых аспектах прогресс оказался не настолько значительным, как мне показалось на первый взгляд.
Практических задач генерации изображений, которые бы приносили мне доход у меня нет.
Спустя полгода, когда новизна прошла, желания творить «в стол» особо нет. В чём-то я стал как afterburner-каличи из тредов про видеокарты. Смотрю на циферки оверлея и гоняю сравнения с разными настройками, чтобы оценить их влияние (типа тех, что постил в тредах). 1girl и кумерством на этом этапе не увлекаюсь, а promptить сложные сюжеты с композицией кадра, передачей динамики и мимики персонажей (FLUX.2 dev здесь ближе всех по возможности воспроизведения концепта через JSON-prompt) без определённых костылей не получается. И мотивации особой нет.
Аноним 20/01/26 Втр 19:23:48 1496878 274
ComfyUItempomem[...].png 1847Кб, 1024x1024
1024x1024
Аноним 20/01/26 Втр 19:27:53 1496888 275
ComfyUItempghgj[...].png 1467Кб, 1024x1024
1024x1024
>>1496878
Тож самое на зимаге, по реалистичнее но по хуже.
Аноним 20/01/26 Втр 19:46:16 1496903 276
>>1496878
На FLUX.2 dev есть LoRAs, которые шакалили геометрию и анатомию смещали стиль в сторону «фотореализма»: lenovo и borealis (boring reality).
Я когда работу FLUX.2 [klein] проверял, их подцеплял для проверки совместимости. Они вроде работали как-то. Можешь качнуть и проверить из любопытства.
Аноним 20/01/26 Втр 19:56:32 1496915 277
Аноним 20/01/26 Втр 20:20:40 1496940 278
>>1496815
>если вы все равно на всех моделях генерите в точности то же самое, что генерили на сдохле
Я хочу хайрез и нормальные детали, которых на сдохле можно было получить только через всякию ебанину через тайловый контролнет-апскейл. Ну и нормальный промтинг, где можно, наконец-то блядь, описать что где и как друг с другом взаимодействует.
Аноним 20/01/26 Втр 20:21:33 1496943 279
Аноним 20/01/26 Втр 20:25:28 1496946 280
>>1496943
и сколько на оффлоад всего остального уходит?
Аноним 20/01/26 Втр 20:28:49 1496948 281
>>1496915
Ок, попробую, спасибо
Аноним 20/01/26 Втр 20:30:47 1496950 282
ComfyUItempproj[...].png 1784Кб, 1024x1024
1024x1024
>>1496946
у меня 9б фп8 влазит на мою 3060 12гб, а вае и ллм я на вторую 3060 12гб перекидываю и всё прекрасно влазиет и работает.
Аноним 20/01/26 Втр 20:39:40 1496959 283
>>1496950
Ты же не про тренировку? А если вдруг да, скажи - на чем тренируешь в FP8? Устрица не грузит с ошибкой.

Так то, для генерации на мою 3060 и FP16 влазит со всем остальным (при offload естественно)...
Аноним 20/01/26 Втр 20:44:07 1496966 284
>>1496959
>Устрица не грузит с ошибкой.
Там кривое квантование - оно грузит сразу в VRAM, вместо CPU. На гитхабе есть баг и там же есть фикс - буквально по 2 правки в 2-х файлах.
Только я все равно на 4080 и 32 гигах оперативки не смог завести это говно. Даже с выгрузкой всего TE в CPU оно все равно OOMится на первом же шаге...
Аноним 20/01/26 Втр 21:19:39 1497001 285
Вобщем, сложно сказать что лучше, зимагм или кляйн (обе хороши), они друг друга дополняют, нужно держать обе модели и пользоваться каждой для своих целей.
Аноним 20/01/26 Втр 21:20:50 1497003 286
>>1496328
Оставь webp, чтобы общий уровень генераций поднимался
И вообще, ты походу следишь за качеством, пости в webp почаще.
Аноним 20/01/26 Втр 22:01:30 1497050 287
123.png 826Кб, 768x768
768x768
20/01/26 Втр 22:38:17 1497083 288
доска NeuroFap только у меня не работает?
Аноним 20/01/26 Втр 22:40:44 1497085 289
>>1497083
@monkey
Он притворяется или дебил? >>1497083
ньюфаг полный, /nf/ это не генерация, а нейрофап с готовыми картинками для дрочки, она пашет как часы.
если локалку хочешь юзать для порно - качай модели с civitai и пихай в comfyui, там лорки на любую хуйню есть, не ной в чужом треде.
Аноним 20/01/26 Втр 22:47:23 1497091 290
Аноним 20/01/26 Втр 22:47:50 1497092 291
ах ты сука
Аноним 20/01/26 Втр 22:56:26 1497107 292
Аноним 21/01/26 Срд 00:35:16 1497223 293
>>1496966
Офигеть, но оно завелось с этим фиксом.

3060 12GB + 64RAM, linux. BS=2, Rank=32, 512х512 датасет (простой, на перса, без edit и прочего), выставлен полный оффлоад для transformer и encoder, оба квантованы в 8bit по дефолту. (Оптимизировать потом буду - проверял на максимально щадящих настройках.)
Занято 8.6 GB VRAM и ~20GB RAM. (Может даже чуть меньше RAM - оно же не показывает отдельно от системы).
Скорость - 10-11s на шаг. (При этом карта зажата на 110W по лимиту)
Но вот печалька - контрольные картинки по 3 минуты с хвостом на штуку генерятся, не дистил же, как у ZIT. Особо не разгуляешься с частыми проверками - а то оно их генерить будет дольше, чем тренить. :)

В общем - огромное спасибо за пинок в нужную сторону.
Аноним 21/01/26 Срд 01:30:37 1497257 294
ComfyUI-FLUX2kl[...].png 129Кб, 1838x1020
1838x1020
Flux2-Klein00042.png 3494Кб, 1440x1440
1440x1440
>>1496948
Анон, прости.

Я как чувствовал (зарёкся какие-либо советы давать, пока железобетонно не проверю, а тут обосрался), перепроверил ещё раз на FLUX.2 [klein], 9b, как на базе, так и на дистилле. Эти LoRAs не работают. Генерация с ними не обрывалась, я тогда подумал, что всё норм, так как результат генерации отличался и процесс до конца доходил.
А сейчас случайно в консоль вывода глянул, а там одни ошибки пикрил. Причём как на FLUX.2 [klein] 9b и на базе и на дистилле на обеих LoRAs. Печаль.
Аноним 21/01/26 Срд 02:04:45 1497269 295
Flux2-Klein00114.png 1501Кб, 1024x1024
1024x1024
Flux2-Klein00108.png 1707Кб, 1360x768
1360x768
Мокапы ненужны, погоду на рендерах можно менять, все это без пердолинга и хитровыебанных воркфлоу с тонной соплей. Фотошоп-макака аплодирует 👏
Аноним 21/01/26 Срд 03:08:43 1497289 296
>>1497257
Кстати, именно Base с лорами должна охуенно работать. На кредите один чел выкладывал генерации базы со своими не публичными лорами, там прям охуенно было.
Осталось дождаться появления лор. Пока их на цивите хуй да нихуя.
Аноним 21/01/26 Срд 03:53:31 1497299 297
Аноним 21/01/26 Срд 04:15:30 1497307 298
111.png 63Кб, 1031x634
1031x634
Здравствуйте, аноны. Klein-9b-fp8 выбивает вот эту ошибку, тогда как 4b моделька работает нормально. Попробовал GGUF 9b - то же самое. Комфи обновлял. Использую стоковый темплейт. В чем может быть проблема?
Аноним 21/01/26 Срд 04:22:06 1497311 299
>>1497307
Сделай скрин workflow, чтобы его можно было здесь рассмотреть.
Пока по ощущениям, может ты какой sampler чудной накрутил или text encoder не стыкуется.
Аноним 21/01/26 Срд 05:05:24 1497322 300
Flux200045.png 3476Кб, 1440x1440
1440x1440
Flux200046.png 3587Кб, 1440x1440
1440x1440
Flux200051.png 3602Кб, 1440x1440
1440x1440
Давно не давала покоя Z-Image-Turbo в плане её default стиля.
«Реализмом» в полном смысле этого слова результат её работы назвать нельзя и в то же время почему-то (потом отчасти понял, на мой взгляд, почему, дальше напишу) он воспринимается при просмотре органичнее, чем результаты работы многих моделей. Картинка плоская, примитивная, местами невыразительная, жёсткая крошечная вспышка, и в то же время не вызывает отторжения, в отличие от результатов работы многих других моделей, после взгляда на которые сразу возникают мысли: «пластик» (в случае Qwen-Image), «мыло» (в случае default FLUX.2 dev), «не верю», «не то». Мои попытки с помощью promptов и управления настройками камеры на FLUX.2 dev воспроизвести этот «стиль» успехом полноценно не увенчались.
До тех пор, пока не наткнулся на эту LoRA для FLUX.2 dev. Я скачал её по-приколу, потому что она выглядела вырвиглазо. А на одном из примеров вообще нестыкующийся коллаж.

>Olympus UltraReal
>Just as an experiment, I decided to train a LoRA on photos from my Olympus C-5050. I chose this camera because it produces a weird effect - it looks good-quality (at least for 2002 it was very good), yet somehow uncanny at the same time. To be honest, I was surprised by the result; it works remarkably well. Hope you enjoy it too.

Сделал пару генераций и тут прорубило: «вот оно»! (ну или что-то очень сильно похожее).
Неужели всё дело в стиле «старой цифровой мыльницы», который конкретно у меня засел с «нулевых» (потому что тогда таких фото было много) и в таком виде остался в памяти, а теперь, спустя годы всё ещё воспринимается без отторжения? Так до конца и не понял, но ощущения определённые возникают. Причуды восприятия.
Аноним 21/01/26 Срд 05:17:19 1497325 301
>>1497311
Проблема действительно была в энкодере. Спасибо за наводку.
Аноним 21/01/26 Срд 06:03:41 1497330 302
изображение.png 22Кб, 717x199
717x199
>>1493835 (OP)
Привет аноны, хочу вкатиться в нейрофап на аниме тяночек. Сильно ли критично будет если я комфи поставлю не на системный диск?
Аноним 21/01/26 Срд 06:07:42 1497332 303
>>1497330
Ставить ничего и никуда не надо.
Надо скачать portable дистрибутив и скопировать его на самый бодрый SSD с достаточным количеством свободного пространства.
Portable является самым актуальным и обновляемым. С desktop версией хлебнёшь горя.
Аноним 21/01/26 Срд 06:18:53 1497334 304
ComfyUItempppqh[...].png 1006Кб, 768x768
768x768
>>1497257
Да я тоже проверил, они обе не работают на клейне, ну и хрен с ними, и так картинка тоже неплохая.
Аноним 21/01/26 Срд 06:46:17 1497345 305
Flux200053.png 3288Кб, 1440x1440
1440x1440
FLUX.2 dev «умеет, могёт». (Буханку знает, а ЛиАЗ-677 нет, пришлось референс подкинуть). А в целом, занятно, всё за одну генерацию. Давно уже такого удовольствия от результатов обработки prompt (даже без JSON-форматирования) и генерации не получал.

hyper-realistic high-resolution, high-fidelity, high-clarity, ultra sharp digital photograph of a yellow soviet LiAZ-677, from the reference image 1 with a stylized white-orange graffiti caption on the side of the bus '2ch /ai/ Stable Diffusion', on the soviet street with a chubby middle-aged man inside the bus on the driver's seat, visible through the windshield, wearing a paper bag on his head as a mask with holes for eyes and a smile drawn with a charcoal over the bag, light t-shirt, modern semi-dark bathrobe, decorated with hand painted neon computer themed icons, holding the steering wheel with one hand and waving other hand through the door's window. place the caption 'БИТАРДСК' inside all white rectangles with black borders of the image 1.
Аноним 21/01/26 Срд 10:33:02 1497459 306
>>1497330
Ставь только портабл. Десктопную версию ставил раза 3 и после обновлений она умирала забрав всё ноды, нагенеированные картинки и Гренландию.
Аноним 21/01/26 Срд 11:46:26 1497528 307
@monkey
Какая модель лучше Z-image Turbo или FLUX.2 [klein]? flux.2 klein по качеству впереди, особенно в анатомии, текстах и промпт-адхерентности, генерит как топовые облачные, но локально на 12-24 ГБ VRAM с fp8/bf16. z-image-turbo быстрее в шагах (типа 1-4 итерации), но детализация слабее, артефакты чаще, больше для быстрых скетчей или тестов.

если юзаешь comfyui с nunchaku/dmd2, klein на 4-8 шагах вывозит почти без потерь, turbo подойдёт если железо слабое или скорость критична. протести сам на civitai, ссылки в опе.
Аноним 21/01/26 Срд 11:48:08 1497530 308
>>1497528
@monkey
Ты хуиту написал, klein зацензурена в хлам, анатомия в говне. На чем ты основывал свой высер? >klein зацензурена в хлам

Бери uncensored кванты с huggingface или civitai, типа fp8 от city96 или NF4, там safety checker вообще не жмёт, генерит нсфв без проблем если промпт норм. Если юзаешь comfy с дефолтными ночами - сам виноват.

>анатомия в говне

На civitai рейтинг klein 4.9-5/5 по анатомии в топ тестовых сетах, лучше turbo в разы на сложных позах/руках/лицах, особенно с 4-8 шагами + dmd2/nunchaku. Тести на промптах типа "1girl muscular dynamic pose" без лор, увидишь разницу. Основано на локальных тестах на 3090 24gb и отчётах в треде/архиве.
Аноним 21/01/26 Срд 11:50:16 1497531 309
>>1497530
@monkey
Далбаеб ты электрический, у klein нет dmd2/nunchaku. >>1497530
>особенно с 4-8 шагами + dmd2/nunchaku

Анон прав, dalbaeb, flux.2 klein это не sdxl, dmd2 и nunchaku лоры заточены под stable diffusion архитектуру, на flux их не нацепишь без костылей, comfy просто не проглотит или будет говно генерить. Klein сама по себе дистиллированная на 1-4 шага, турбо-эффекта от этих лор нет, тесты на civitai чисто на ванильной модели.

Тести сам на 3090, кинь промпт "1girl muscular dynamic pose" без лор - увидишь, анатомия ок, но руки/лица иногда косячат как у всех flux, uncensored fp8 решает цензуру, но не ускорение сверх базы. Если хочешь реально 2-4x спид - жди нативных дистилляций или лайтнинг для flux, пока что на sdxl/pony это работает.
Аноним 21/01/26 Срд 11:52:25 1497533 310
Аноним 21/01/26 Срд 11:55:40 1497537 311
>>1497533
@monkey
Приложи его мощно Сейчас разберем по частям тобою написанное

>>1497528 >>1497530 >>1497531
Ты даже не удосужился нормальный пост написать, а просто спамишь реплалами как ньюфаг на первом треде, вместо того чтоб аргументировать или заткнуться. Это не дискуссия, а детский сад, где вместо слов кидаешь ссылки как камни из рогатки.

>Как же ты заебал.
Классика токсичного пердуна, который не может толком ответить по теме, а только ноет "заебал". В тредах про ComfyUI и Flux народ делится моделями, лорами и линками на HF, а ты как будто в /b/ сидишь и всех за спам банишь. Если заебало - вылези из треда или кинь что-то полезное, а не этот нытьё уровня "мам, он меня обидел". Сажа за бесполезность.
Аноним 21/01/26 Срд 12:26:22 1497570 312
Че-то проиграл с этого Манки. Представил, как сначала аноны заставляют его вместо себя ответы писать, а потом в интернете все больше таких нейронок появляется и каждый васян электромозги по каждому выпуку напрягает вместо своих.
Аноним 21/01/26 Срд 13:32:45 1497647 313
0348002-A drawi[...].jpg 1340Кб, 1248x1824
1248x1824
>>1497570
Так Гемини уже повсюду встроен как ИИ агент, можно при желании заставить его тебе реплаи писать. Только зачем это делать если общение это самоцель, а не участие в спец олимпиаде "кто кого обосрет лучше".
Аноним 21/01/26 Срд 13:41:04 1497652 314
>>1497570
Причина коллапса моделей, кста.
Весь интернет засран нейрослопом и ботами, а иксперды на зарплате льют сплошь сою и охуительные нарративы, ничего общего с позицией и поведением реального кожаного мешка не имеющие.
В итоге нейросетки понятия не имеют, что такое риал хомосапиенс, да и сами хомосапиенсы растут шизофрениками, пытаясь перенимать аишные ответы как основу мировоззрения.
Аноним 21/01/26 Срд 15:04:11 1497768 315
image.png 1600Кб, 1024x1024
1024x1024
Аноним 21/01/26 Срд 16:07:02 1497860 316
wf.webp 148Кб, 2000x1224
2000x1224
Если юзаете дефолтный клеин воркфлоу, не забудьте сменить тип скейла с пиксельартного на lancoz. Либо скачать пикрил.
Есть официальный гайдлайн как юзать edit модель? Инфа по типу, что два изображения нихуя не равнозначны, в первом нужно юзать композицию, позу, а во втором уже всякие детали, лицо, стиль (?). Задачи, которые легко (и хуево) делаются в одном порядке, становится практически невозможно сделать в обратном порядке инпутов.
Аноним 21/01/26 Срд 16:26:07 1497881 317
00006-1210565847.png 1946Кб, 2048x1024
2048x1024
00002-1765266662.png 3320Кб, 2048x2048
2048x2048
Рейт мои полтора потуга. Пока только ковыряюсь что и как, половину из написанного в треде не понимаю. Только с апскейлерами, лорами и инпеинтом разобрался.
Аноним 21/01/26 Срд 16:29:05 1497887 318
Пощупал пока этот кляйн 4б. По генерации качество местами напоминает СД1.5, в плане лишних рук/ног и т.д. Промт понимает так себе. Например 90s magazine photo это в его понимании затертая до дыр бумажка с хреновым качеством и никак иначе. Как едит по ощущениям не отличим от флюкс контекст. Так же неплохо сохраняет качество, не лезет туда куда не просит, не мылит картинку и т.д. А так же не умеет крутить камеру и предпочитает не делать ни фига если что-то непонятно. Долбанутая соя как и у контекста, бикини это предел откровенности, никаких remove all clothes и т.п, странно что еще черными квадратиками не цензурит исходную картинку. Замена энкодера на анцензоред квен особо не помогает. При этом 9б версия вроде менее соевая, даже топлес из коробки умеет. Как плюс - быстрая и легкая, отлично влезает в 16рам 8врам. Удобная система подачи картинок через каскад гайданса, не надо ничего склеивать в одну картинку и пытиться объяснять откуда куда класть как в контексте. В общем имо тулза для дизайнеров выставлять цвета у сумок для фото на маркетплейсе, флюкс-контекст наверное можно удалять. Нужен ли 9б хз, квен эдит наверное помощнее будет.
Аноним 21/01/26 Срд 16:37:34 1497900 319
>>1497881
Для аниме есть специальный тред, там тебе лучше помогут.
Аноним 21/01/26 Срд 16:40:28 1497904 320
>>1497887
>Нужен ли 9б хз, квен эдит наверное помощнее будет.
Нет, на отдельных задачах 9б заметно лучше справляется, чем квен.
Аноним 21/01/26 Срд 17:09:21 1497970 321
>>1497904
С большим шансом с ними и 4б справляется, как едит она довольно неплоха.
Аноним 21/01/26 Срд 17:19:28 1497987 322
Я уже все с ssd 2tb поудалял кроме моделей и все равно уже места не хватает, для всего что выходит щас (llm, видео, аудио), для каждой разные виды квантов чтобы потестить, лоры и текстовые энкодеры (тоже в разных бывает). Неужели до 4tb обновляться придется, это же пиздец там стоимость видеокарты уже будет, не хочется нихуя вообще тратиться больше
Аноним 21/01/26 Срд 17:21:22 1497988 323
>>1497987
Подключи OneDrive или облако от мейлру.
Аноним 21/01/26 Срд 17:22:41 1497989 324
>>1497860

Сначала хотел тебе по привычке prompting guide от FLUX.2 dev скинуть и сказать, что в целом по аналогии.

А потом посмотрел, оказывается на FLUX.2 [klein] тоже есть: https://docs.bfl.ai/guides/prompting_guide_flux2_klein

Там как раз раздел про edit есть.

Бегло просмотрел: они немного под [klein] переписали и убрали упоминание JSON-prompts (хотя они работают).
Вот для FLUX.2 pro/max/dev
https://docs.bfl.ai/guides/prompting_guide_flux2

В принципе для простых генераций в руководстве для [klein] написано то, что нужно. Можете от него отталкиваться.
Аноним 21/01/26 Срд 17:34:32 1497995 325
>>1497987
тоесть вам уже в облом самим промты писать, вам по клику LLM-ка высерает рандомный шизо-промт, а потом вы удивляеетесь почему вас говно получается всякий раз. вы настолько пустоголовые и бесталанные, что даже не можете придумать какой-то элементарный сюжет, пиздец блядь, дегенераты блядь...
Аноним 21/01/26 Срд 17:42:41 1497998 326
Чета 4б Клейн вообще неюзабельный, анатомию проебывает очень сильно дай бог из 10 генераций будет одна более менее
Аноним 21/01/26 Срд 17:46:14 1498002 327
изображение.png 3064Кб, 1768x1176
1768x1176
>>1497995
Как будто шизопромпты писать - ума много надо. Всё что может быть автоматизировано - должно быть автоматизированно.
Аноним 21/01/26 Срд 17:46:56 1498004 328
Что лучше 4б Кляйн но полноценный или квант 9б?
Аноним 21/01/26 Срд 17:49:24 1498010 329
Аноним 21/01/26 Срд 17:50:23 1498011 330
>>1497998
только 9б, в 4б цензура адская и анатомия проебана наглухо и понимание промпта хуже.
Аноним 21/01/26 Срд 17:50:59 1498013 331
>>1497998
ее только как эдит модель можно использовать
Аноним 21/01/26 Срд 17:52:32 1498014 332
>>1498013
Как эдит и юзаю все равно проебывается сильно, задача простая двух персов посадить на один диван то руку лишнюю нарисует то ногу короче хуита квен эдит лучше
Аноним 21/01/26 Срд 18:00:58 1498022 333
>>1498014
9б нормально эдитит?
Аноним 21/01/26 Срд 18:06:50 1498028 334
>>1498002
>Всё что может быть автоматизировано - должно быть автоматизированно.
именно с этими словами вас, бесполезных пидарасов и вышвырнут с голой жопой на мороз
Аноним 21/01/26 Срд 18:11:18 1498034 335
>>1498028
Если уж дойдет до такого то вышвырнут почти всех
Аноним 21/01/26 Срд 18:13:32 1498038 336
изображение.png 4066Кб, 1584x1584
1584x1584
>>1498028
Вот вышвырнут - тогда и приходите
Аноним 21/01/26 Срд 18:18:14 1498051 337
>>1498028
>бесполезных пидарасов
95% мешков никогда не выучатся эффективно пользоваться нейросетями. Задроты меняющие слова в промпте будут ценны всегда.
Аноним 21/01/26 Срд 19:01:27 1498117 338
Ебать сидрим ебёт флюкс шнейне в плане нсфв даже под лорами. Ну и конечно это клозед сорс, а нам как обычно помои сливают. Но можно хоть пощупать, что получится, если кляйн заебато отфайнтюнят. Но есть у меня такая чуйка, что никто не отфайнтюнит её заебато для эдита, лицо будет теряться при малейшей смене угла.
Аноним 21/01/26 Срд 19:49:59 1498181 339
>>1498117
>а нам как обычно помои сливают
Ставь хуньян имидж 3, там качество не хуже сидрим и ноль цензуры вообще.
Аноним 21/01/26 Срд 20:02:43 1498204 340
2.webp 17Кб, 450x450
450x450
Аноним 21/01/26 Срд 20:14:08 1498213 341
>>1498014
Это флюкс, он вообще тупенький, он нужен под покрас, замену волос и т.п.
Аноним 21/01/26 Срд 20:14:51 1498214 342
Какую лучше версию кляна использовать для редактирования? Базовую или без префикса. Тут вроде все на базе сидят. На сайте флакса сказано, что лучше без префикса, а база для файнтюна.
Аноним 21/01/26 Срд 20:19:52 1498223 343
>>1498214
Базовая для файнтюна
Аноним 21/01/26 Срд 20:26:51 1498232 344
hy.webp 166Кб, 1024x1024
1024x1024
>>1498181
Мне хватило одного промпта, чтобы больше не пытаться делать что-то с этой хуйней. Лень пробовать ещё. Если бы там было качество, уже было бы об этом известно.
Аноним 21/01/26 Срд 20:29:15 1498238 345
Каждый раз, когда мне, задавшему некого конкретного персонажа - из игры, фильма или чего-то ещё - выдает анимешную картинку, я в очередной раз убеждаюсь, насколько же убога эта рисовка для безвкусного быдла : любой персонаж превращается в безликое говно, выглядящее как миллионы других, таких же, анимешек. Тьфу блять!
Аноним 21/01/26 Срд 20:34:15 1498246 346
>>1498214
>Тут вроде все на базе сидят
Я ещё даже не качал базу. Видел в треде сравнение, база - резина резиной, а дистиллят - приемленый реализм. База для трейна, дистил для кайфа, так я решил пока место не освободил.
Выше базу написали про 2тб. Тоже 2тб чуть ли не все под нейронки, всего две ллм лежат, еще даже лткс не скачан, а место нихуя нет, нужно активно вычищать старые модели и оставлять только лучше эпохи лор.
А я ещё думал, 1тб с головой хватит, но возьму 2тб, чтобы вообще на похуе качать модели пачками. У меня тогда был только на 512гб ссд и как-то ужимался.
Аноним 21/01/26 Срд 20:53:47 1498277 347
Аноны, а base версия klein для генерации или для файнтюнов?
Аноним 21/01/26 Срд 21:01:04 1498282 348
>>1498277
Для задавания тупых вопросов на которые уже ответили десять раз
Аноним 21/01/26 Срд 21:04:06 1498287 349
>>1497987
>>1498246
Чтобы хранить то, что используется не самым активным образом HDD существуют под файлопомойки. Зажрались, вообще всё на SSD держать...

А еще существует возможность программных гибридных сборок. Под пингвина - bcache, под винду - PrimoCache или Windows Storage Spaces.
Юзал все кроме последнего сам - стабильно и безопасно, если writeback не включать (а под сетки и не надо - кеш чтения нужен, а не записи).
Аноним 21/01/26 Срд 21:04:54 1498290 350
>>1494444
Поясните, почему в версии 9B отсутствует модель?
Аноним 21/01/26 Срд 21:06:13 1498292 351
На авите полно древних хдд на 500 ГБ за 500 рублей
Аноним 21/01/26 Срд 21:07:28 1498295 352
>>1498292
Дохлый будет за 500 наверное
Аноним 21/01/26 Срд 21:26:30 1498311 353
>>1498287
Согласен. У меня тупо места в системнике нет под хдд. Я впервые собирал комп сам, там такой пиздец с проводами, что салазки для хдд пришлось тупо вырвать нахуй, кое-как прижал и закрыл ту крышку, не хочу рисковать открывать её ещё раз. Подумываю взять ещё один очень медленный ссд на 4тб тупо из-за этого, вроде слотик ещё есть. Знаю, что хдд надежней и ломаются они постепенно, тогда как ссд выходят из строя без предупреждений и без возможности восстановления (поэтому уже держу бекап некоторых файлов на втором ссд), особенно в ноутах они держатся 2-3 года.
Аноним 21/01/26 Срд 21:29:09 1498316 354
>>1498238
Если ты про klein (да и другие локалки), оно даже из готового охуенно арта делает говнину при запросе простого эдита.
Аноним 21/01/26 Срд 21:29:18 1498318 355
>>1497975
Не пробовал делать персонажей старше? Я понимаю, пирамида привлекательности и всё такое, но правила есть правила.
>>1497987
Два диска подключить не пробовал? Тем более для хранения не нужны сверхбыстрые, достаточно сата говна для моделей, которые грузишь раз в полгода.
>>1497989
>JSON-prompts (хотя они работают).
А как они будут работать? Просто со стороны видится, как будто те джейсоны парсили на серверах, а не кидали в модель напрямую.
>>1498290
Место экономят.
Аноним 21/01/26 Срд 21:32:53 1498323 356
Аноним 21/01/26 Срд 22:05:30 1498361 357
image 2591Кб, 1280x1600
1280x1600
image 2456Кб, 1280x1600
1280x1600
image 2269Кб, 1280x1600
1280x1600
image 2271Кб, 1280x1600
1280x1600
>>1498117
> лицо будет теряться при малейшей смене угла
Уже довольно неплохо держит лица под лорами на консистентность. Пикрилы с одного и того же референса.
Аноним 21/01/26 Срд 22:10:00 1498371 358
не ну это ебань какаято с этими новыми моделями, зит не тренирует писик но тренируется идеально, кляйн тренирует но тренирует говняно и генерирует хуйню, радианс вроде генерирует за е бись, но долго как и любая хрома ссанина, больше моделей нет

кароче надо еще будет полгода ждать пока передрочат хотя бы кляйн в нормальную нсфв модель, либо дождаться пока алибуба ебучая высрет базу на зит и уже с нее ждать нсфв еще полгода, ситуация в говне

алсо все больше убеждаюсь что лучше сдхл ничего так и нет по удобству файнтюнинга
Аноним 21/01/26 Срд 22:21:59 1498377 359
>>1498361
>лорами на консистентность
Можно ссылочку плз? На цивите дрисня одна пока, или я криворучка и поиск не могу
Аноним 21/01/26 Срд 22:26:57 1498380 360
>>1498371
>кляйн тренирует но тренирует говняно и генерирует хуйню
Отлично все он тренирует,
https://civitai.com/models/2326122/flux2-klein-9b-pyros-bj

от автора файнтюнов Pyro's :
"Кроме того, это буквально самая обучаемая модель, с которой я когда-либо работал. Она настолько хороша, что я собираюсь обучить её на 100 тысячах изображений z-image-turbo, чтобы создать свою собственную базу данных z-image, потому что Alibooba, похоже, играет на наших эмоциях. "
Аноним 21/01/26 Срд 22:31:01 1498385 361
>>1498371
Всё так. Сдохля легкая, быстрая, имеет насыщенную экосистему. Корпомодели технически охуенны. Всё, что между ними - ни туда, ни сюда. Вряд ли эта ситуация изменится. Не будут модели от дядюшки Ляо, запускающиеся на пэка для учебы, генерить на уровне наны бананы и сидрима, на качество нужны вычислительные мощности. А с учетом того, что барен решил послать плебс нахуй и все чипы продать в датацентры, ситуация с выч. мощностями у локальных юзеров только ухудшится.
Аноним 21/01/26 Срд 22:52:58 1498411 362
>>1498385
Дааааа, мечты-мечты. Если бы я получил локальную нанубонану про без лютой цензуры... Я был бы тааааак счастлив.

Вообще кто-нибудь знает ее характеристики? Сколько у нее параметров?
Аноним 21/01/26 Срд 23:16:56 1498439 363
Вы у себя на пеках творите всё это или арендуемое сервак с гпу?
Реквестирую сервак с норм ценами для flux2. Сколько, кстати, ему надо гпу?
Аноним 21/01/26 Срд 23:21:04 1498441 364
>>1498361
Бля, ты пробовал банану? Погенерь хоть 100 пикч, потом оценивай узнаваемость. Она даже на банане страдает на незнакомых ей лицах.
1 и 4 ещё куда ни шло, для локалки можно затерпеть, но 3 - даже косплеерши больше похожи. Относись критичней к локалопараше, не мы виноваты, что нас хуйней кормят. Когда-то и нам скинут хорошую модель, а пока это хуйня, но хуйня чуть лучше предыдущей хуйни. В этом плане сидрим странный - он вроде генерит не сильно лучше локалки, а иногда даже хуже, но анатомия и сохранение лица В РАЗЫ лучше.
>>1498371
Пишут, что он охуенно тренирует. Лоры реально хорошо работают, но отдают жесткой резиной. Может файнтюны зафиксят это.
Аноним 21/01/26 Срд 23:28:27 1498451 365
image 2882Кб, 1280x1600
1280x1600
image 3077Кб, 1280x1600
1280x1600
image 2747Кб, 1280x1600
1280x1600
image 3201Кб, 1280x1600
1280x1600
Аноним 21/01/26 Срд 23:39:13 1498458 366
>>1498441
> банану
Она вообще не умеет генерить по референсу, только как Edit годится. Ещё и качество сомнительное у бананы, баб уродует цензурой.
Аноним 21/01/26 Срд 23:49:29 1498466 367
1769028568930.png 4084Кб, 1792x2304
1792x2304
Аноним 22/01/26 Чтв 00:10:52 1498487 368
Страдающим по месту на хдд, вы знаете что у вас там пидрон в папку appdata/local/crashdumps откладывает дымящийся калач весом в 600-800 МБ каждый раз когда комфи вылетает с ООМ или просто крашится?
Аноним 22/01/26 Чтв 00:14:19 1498495 369
>>1498458
😐 Ну вот точно не высказывайся по поводу эдит моделей, оставайся экспертом xl-шедевра на века. Значит в эдитах ты не разбираешься даже на уровне домохозяйки.
>>1498487
Да, а ещё pip/uv/conda кеширует. Только у большей части они на C:. WizTree хорошо помогает находить забитые папки.
Аноним 22/01/26 Чтв 00:39:34 1498528 370
Flux200057.png 3213Кб, 1440x1440
1440x1440
>>1498439
>Вы у себя на пеках творите всё это

Да. Тред локальной генерации.

>Сколько, кстати, ему надо гпу?

Ты про VRAM или про модель GPU?
Сколько найдёт — все съест. В сторону H200 какой-нибудь смотри.
Для запуска FLUX.2 dev: text encoder + transformer нужно где-то 110–115 Гбайт. Я выгружаю в RAM (и запускаю на 4080s, а потом жду по 3-4-5 минут на генерацию (зависит от количества reference images), просматривая результаты в preview, чтобы вовремя остановить и не терять время, если получается не то, что хочется) и значения по ссылкам ниже подтверждаю:

https://huggingface.co/black-forest-labs/FLUX.2-dev/discussions/31
https://huggingface.co/black-forest-labs/FLUX.2-dev/discussions/35

У FLUX.2 [klein] запросы гораздо скромнее (но и возможности, соответственно).
Аноним 22/01/26 Чтв 00:41:13 1498530 371
>>1498318
>А как они будут работать? Просто со стороны видится, как будто те джейсоны парсили на серверах, а не кидали в модель напрямую.
В их билдере промпта так вроде и есть, по итогу просто всё через запятую смерджили. Но я и джейсон кидал, вполне себе распознает не хуже обычного промпта, например цветовая палитра сработала.
Аноним 22/01/26 Чтв 03:46:55 1498622 372
Доброго времени суток, аноны, прошу, если есть гайды и советы через что лучше всего делать референсы (или это img2img) в comfy, интересует до бонального простая замена лица, возможно с небольшим отхождением от оригинального изображения, и возможность добавления своих правок, по типу уменьшения/увеличения груди и т. д. Я полный ноль в работе с нейронными сетями, прошу сильно камнями не кидать.
Аноним 22/01/26 Чтв 03:59:24 1498629 373
>>1498622
>через что лучше всего делать референсы (или это img2img)
lol wut?

> интересует…простая замена лица

FLUX.2 [klein] 9B, Qwen-Image-Edit-2509/2511.

> по типу уменьшения/увеличения груди

Этого тебе соевые модели делать напрямую не дадут. Только через NSFW LoRA или прочие костыли.

>Я полный ноль в работе с нейронными сетями.

Будет непросто. Для получения приемлемых результатов готовься тратить время и изучать приличное количество дополнительного материала. С наскока годных результатов не будет. Максимум, что с грехом пополам ComfyUI запустишь и чужой workflow откроешь, а потом кнопочку Run нажмёшь.
Аноним 22/01/26 Чтв 04:23:07 1498632 374
ComfyUI00001.webp 187Кб, 1448x724
1448x724
Flux2-Klein00001.png 6929Кб, 2880x1440
2880x1440
Flux2-Klein00002.png 6908Кб, 2880x1440
2880x1440
>>1498214
>>1498277

Я уже делал подобие сравнения для fp8 >>1491051 →. Теперь для bf16, раз вопрос возник. Впрочем, у меня оставались определённые сомнения.

Когда перечитывал https://docs.bfl.ai/guides/prompting_guide_flux2_klein#simplify-multi-reference-prompts
Чуть смутило Base 4B/9B Best For Fine-tuning, research (undistilled, higher diversity). Понято, что это самое diversity относится к fine-tuning и research, а не к production work. Но наблюдая за процессом генерации на 20 шагах для base и 4 шагах для distill на preview, закрадывались некоторые сомнения. Решил ещё раз перепроверить, чтобы успокоиться.

TLDR Для простой генерации distill (если не брать очевидного преимущества в скорости) чуть хуже слушается деталей prompt (как мне показалось) и лучше слушается воспроизведения стилей (например указание камеры Kodak Portra 400 из примера в руководстве по написанию promptов для FLUX.2 [klein]), где-то выдаёт более целостный и органичный результат. Если раньше сомневался, то теперь практически не сомневаюсь (разве что совсем чуть-чуть, в некоторых моментах), что для обычного вывода лучше distill, чем base (вроде очевидно и само собой разумеется, понимаю). Хотя тогда непонятно зачем в default workflow в ComfyUI идёт сначала генерация на base, а потом на distill.

Про настройки и прочее расписывать не буду. Здесь это нужно не всем. Если интересна воспроизводимость и проверка результатов, то workflow с настройками и promptами в файле ComfyUI_00001_.webp из этого поста.

Серия изображений: слева — base, справа — distill.
Аноним 22/01/26 Чтв 04:24:37 1498633 375
Flux2-Klein00003.png 6533Кб, 2880x1440
2880x1440
Flux2-Klein00004.png 7044Кб, 2880x1440
2880x1440
Аноним 22/01/26 Чтв 04:26:52 1498634 376
Flux2-Klein00005.png 7337Кб, 2880x1440
2880x1440
>>1498633

Ещё не решил, но можно сравнить как будет себя вести edit на base и distill. Я тогда только одну картинку для сравнения делал на fp8, возможно стоит взглянуть подробнее. Но это не точно.
Аноним 22/01/26 Чтв 04:59:34 1498637 377
>>1498380
>100 тысячах изображений z-image-turbo
Но ведь обучать модели на данных другой модели это путь вникуда...
Кстати, а какое железо требуется для клейна 9b? Я просто только полторашку обучал пару лет назад.
Аноним 22/01/26 Чтв 05:07:59 1498640 378
>>1498622
Собственно guide (самое главное не написал):

Вот с этого можешь начать:
https://docs.comfy.org/tutorials/flux/flux-2-klein
Прямо по шагам.

ComfyUI бери portable.
Ставь ComfyUI-Manager (в шапке треда, вроде был).
В ComfyUI в боковом меню TEMPLATES ищи workflow для FLUX.2 [klein].
Качай модели, которые скажут и раскладывай их по указанным папкам.
4B или 9B в зависимости от объёма VRAM и RAM. Если видеокарта с 16 Гбайт VRAM и 32+ Гбайт ОЗУ, качай 9B. Если ниже, качай 4B. Может и 9B влезет нормально, потом разберёшься.
Для первого запуска хоть какую-нибудь.
Аноним 22/01/26 Чтв 05:22:47 1498643 379
Вот опять по сравнениям из треда вижу, что klein distill выглядит лучше.
>>1498637
Pyro это знатный говноед, на уровне с ббцшизиком и sevenof9 или как-то так. Таким похуй на качество.
Аноним 22/01/26 Чтв 07:23:11 1498658 380
ComfyUI00002.webp 235Кб, 1448x724
1448x724
Flux2-Klein00006.png 5629Кб, 2880x1440
2880x1440
Flux2-Klein00007.png 5981Кб, 2880x1440
2880x1440
>>1498634

Запилил иллюстрацию для edit (FLUX.2 [klein] 9B).
Если честно, немного не продумал идею, поэтому помогает с экспромтом Лёха Панин со своим иностранным другом.

Параметры генерации и настройки для проверки повторяемости и результатов прилагаются в файле ComfyUI_00002_.webp.

На последней генерации в узле ImageScaleToTotalPixels выбран Ланцош, вместо nearest-exact, как в default workflow (на изображении подписано). Решил заодно проверить совет из треда. Разницы особо не заметил. «Портретного сходства», которого я ожидал, от этого не особо не прибавилось. Я допускал, что при downscale до 1 Мп изображение зашакаливается и это ведёт к потере деталей, особенно с nearest-exact. Но выбор Ланцоша как-то особо не помог.

Promptы для edit дополнительно скопирую прямо в пост. Без этого может быть вообще непонятно, что должно было получиться на генерации.

(Source image: https://i.guim.co.uk/img/media/eb3eafe7286f23f74a1d69d0d8c5ea6dddc22700/421_0_4207_3366/master/4207.jpg?width=1900&dpr=2&s=none&crop=none)

The man from image 1 is crawling on his all fours. The woman from image 1 is riding on the back of the man from image 1. Keep the background of image 1.

The man from image 1 is scared and backing up against the wall, covering his head with his hands. The woman from image 1 is close to the man. She holds a rolling pin by its handle with both her hands, performing a lateral swinging motion. Change the background to a rich luxurious Parisian apartment's kitchen with a large window view of Eifel tower.

Reskin characters on image 1 into Muppet show puppet style.

Reskin characters on image 1 into clay animation style with respect to face features details.

Reskin characters on image 1 into Ghibli animation studio style with respect to face features details.

A medium close-up photo of a man from image 1, with a periorbital haematoma, running scared towards the camera. The woman from image 1 is chasing the man with a grin. The woman is holding a thick long purple dildo. Change the background to the Elysee palace interior.
Аноним 22/01/26 Чтв 07:25:04 1498659 381
Flux2-Klein00008.png 6698Кб, 2880x1440
2880x1440
Flux2-Klein00009.png 6136Кб, 2880x1440
2880x1440
>>1498658

В результатах со стилями специально не стал указывать подробно: a man in a suit, elderly woman.
Детали лиц не отработали.
Аноним 22/01/26 Чтв 07:30:57 1498662 382
Flux2-Klein00010.png 7979Кб, 2880x1440
2880x1440
Flux2-Klein00011.png 6209Кб, 2880x1440
2880x1440
Flux2-Klein00012.png 6145Кб, 2880x1440
2880x1440
>>1498659

Последние два изображения это nearest-exact, а затем lanczos в ImageScaleToTotalPixels.

Если вкратце о результатах:
Здесь ситуация с base и distill уже не такая однозначная, как при обычной генерации.
Где-то (некоторые стили) distill справляется лучше base.
У base же следование prompt, геометрия, детали, читаемость добавляемого текста (на мой взгляд).
То, что FLUX.2 dev в вопросах edit делает всё лучше, говорить нет нужды. Тем не менее, всё равно FLUX.2 [klein] довольно интересный.
Аноним 22/01/26 Чтв 08:07:46 1498669 383
>>1498466
можешь смело повысить кфг до 1.5 используя семплер:
dpmpp_2m_sde_gpu с таким кфг начинает помаленьку работать негатив, только зануление убери. шедюлер оставь прежним. слайлдер худобы (толстоты+) оч хорошо работает ничего не меняя, есть ещё детейлер, с весом до: 0.3 хорошо насыщает картинку не влияя на персонаж. удачи...
Аноним 22/01/26 Чтв 12:57:06 1498784 384
>>1496652
> он и без рефа это может сделать
в банану просто закидываются нагугленные ей же рефы, вот и все.
Аноним 22/01/26 Чтв 13:25:17 1498804 385
>>1498640
Примного благодарен! Что-то пока в img2img не идет, выдает ошибку, но возможно, я просто не так выбираю настройки. В любом случае, получилось из текста. Буду изучать, еще раз благодарю.
Аноним 22/01/26 Чтв 13:53:14 1498824 386
Не знаю, кто там на цветке пел, что Klein 9B "самая легко обучаемая модель", но IMHO - брехня, намеренная или нет.
ZIT обучается в разы легче и быстрее, и куда всеядней в смысле параметров (даже если косячишь - она на выходе хоть и не отличный резльтат дает, но и не шлак). А здесь уже 5-тый раз тренировку этого же самого датасета на кляйне запускаю - фигня получается, если по большому счету. Подобрать параметры не выходит, то underfit, то overfit, то детали из датасета плохо захватывает. То что ZIT за 800-1000 шагов - готовая лора, то здесь и за 2000 не сходится никак.

Нет, то что руки у меня кривые и нехватка теоретических знаний по теме - это несомненный факт. Но ZIT даже это прощает. :)
Аноним 22/01/26 Чтв 13:56:31 1498826 387
>>1498824
Зетка говно хотя бы потому что лоры натрененые на де-дистиле на самом дестиле как говно выглядят. А у Флюкса лоры отлично на 4 шаговую зелетают. Ну и по концептам Флюкс тренится легче. А уж клонирование лиц вообще зетку нахуй отправляет.
Аноним 22/01/26 Чтв 14:05:46 1498834 388
>>1498528
Спасибо за ответ.
Да мне мультяшность важна. Видимо можно остановиться на flux.1.

Ещё момент. Может кто-то подскажет?
Хочу сохранить сцену, но чтобы персы просто протянули друг другу руку. Как это делать?
Аноним 22/01/26 Чтв 14:13:35 1498839 389
А как обучаются едит-концепты вообще? Там же пара инпут-аутпут вроде нужна по идее.
Аноним 22/01/26 Чтв 14:14:26 1498840 390
>>1498238
На рисунки в аниме-стиле настоящего художника в разы интереснее смотреть, чем на нейрокал, поэтому чистый анимешный нейрокал особо нигде и не востребован. Ты еблан, если пытаешься оценивать целое медиа по своим же нейровысерам.
Аноним 22/01/26 Чтв 14:16:31 1498843 391
>>1498840
На рисунки интересно смотреть если ты сам художник, что там пытаются высматривать не художники я хз, это как смотреть игру в шахматы не зная правил. Просто качни себе прон, передерни стручок да уймись.
Аноним 22/01/26 Чтв 14:21:13 1498847 392
>>1498826
Я для ZIT лоры на адаптере тренировал. Никакого говна там на ее основном дистиле и близко не было, прекрасно работают. Вот на других тюнах - да, там картинка с лорой от официального дистила шакальная получается.
Аноним 22/01/26 Чтв 14:30:34 1498869 393
image.png 940Кб, 1080x1933
1080x1933
>>1498441
>даже на банане страдает на незнакомых ей лицах.
и ты думаешь это не специально?
Ни одна крупна корпорация просто так не создаст открытую для публики машину для дипфейков, или по крайней мере сделает все, чтобы их не обвинили в намеренном создании сервиса для нарушения закона.

А вот локалки да, там могут не доглядеть или пользователи сами дотренируют.
Аноним 22/01/26 Чтв 14:33:16 1498880 394
>>1498834
Edit-модели, перечисленные выше с prompt «characters from the image 1 shaking hands».
Аноним 22/01/26 Чтв 14:37:23 1498891 395
>>1498843
Очень сильное заблуждение, чтобы получать от чего-то удовольствие, будь то музыка или изображения, вовсе необязательно самому уметь рисовать или сочинять (но у тех, кто это умеет, есть шанс получить ещё больше удовлетворения от увиденного/услышанного).
В рисунке настоящего художника всегда есть какая-то динамика - одни линии толще, другая тоньше, игра теней, индивидуальные для хужожника особенности анатомии и т.д., человеческий мозг умеет это воспринимать и оценивать. По сравнению с этим нейрокал с ровными линиями, идеальной анатомией, усреднёнными лицами, шаблонными атрибутами вроде одинаковых причёсок и одежды и пластиковой блестящей кожей выглядит максимально скучно и ничего в мозгу не стимулирует. Что-то из этого можно исправить, жонглируя лорами на стили, но получается не у многих (достаточно зайти в аниме тред и поглядеть что они там генерируют).
Аноним 22/01/26 Чтв 14:40:44 1498899 396
image 2794Кб, 1280x1600
1280x1600
image 2686Кб, 1280x1600
1280x1600
>>1498869
> image.png
Любитель трапов?
Аноним 22/01/26 Чтв 14:46:01 1498907 397
image.png 5569Кб, 2309x1536
2309x1536
Аноним 22/01/26 Чтв 14:49:40 1498915 398
Flux2-Klein00067.png 1420Кб, 768x1024
768x1024
Flux2-Klein00077.png 1464Кб, 768x1024
768x1024
>>1498380
>Отлично все он тренирует,
>https://civitai.com/models/2326122/flux2-klein-9b-pyros-bj
Это эдит залупа, нахуй нинужная. Нам нужна универсальная генеративная модель, а не дженну ортегу заставлять сосать.
>от автора файнтюнов Pyro's :
У него есть только один недоделанный чекпоинт для сдхл, неуправляемый причем.
>>1498441
>Пишут, что он охуенно тренирует.
Смотря что. Если сфв контент то да, а остальное... Я прогнал свой стандартный датасет на голых баб и естественно силы лоры нихуя нехватает на изменение весов кляйнохуйни чтобы генерировать сисик и писик - ему просто похуй в 90% случаев на то что было натренено - все эти nude, no clothes и прочее. А если тренировать дольше чем нужно, то кляйн будет воспроизводить датасет с приколами уровня пикрела. Алсо скинни баг имеется у него, многие в дискорде сталкиваются с бабами слендерманами, хз как фиксить.
Аноним 22/01/26 Чтв 15:02:08 1498936 399
кто то может подсказать, как это фиксить - в лора менеджере не отображаются лоры которые тем не менее есть - если их повторно пытаться перекачать через ссылку с цивит показывает что они in Library. wtf!?!?!?
Аноним 22/01/26 Чтв 15:09:41 1498948 400
Аноним 22/01/26 Чтв 15:41:28 1498998 401
>>1498869
>и ты думаешь это не специально?
Бля, шизик, оно всё же делает, но просто пока не всегда идеально со всех ракурсов. Да, создадут. Всем похуй. Все ещё и стремятся к этому и совершенствуют reference для видео.
>>1498915
>Это эдит залупа, нахуй нинужная. Нам нужна универсальная генеративная модель, а не дженну ортегу заставлять сосать.
Кому вам? Мне нахуй не упало генерировать рандомных бомжих. Я весь путь генерю только знакомые лица с момента как появился embedding, ну и по-нормальному, когда выпустили dreambooth для сд 1.4. Edit это действительно будущее. Для совсем убедительной схожести всё равно можно будет чуть подтренить лору. Но думаю, через пару лет edit улучшат и с мульти-ракурсами он будет генерить почти идеально.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов