Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 554 277 97
Stable Diffusion тред X+190 /sd/ Аноним 15/05/26 Птн 17:38:21 1613048 1
image.png 1421Кб, 1024x1024
1024x1024
image.png 3391Кб, 1216x1600
1216x1600
image.png 720Кб, 1015x677
1015x677
image.png 3504Кб, 1920x1088
1920x1088
Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Lens (3.8B) от Microsoft
• HiDream-O1-Image
• Z-Image-Base
• FLUX.2 klein (4b и 9b)
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/Comfy-Org/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

► Предыдущий тред >>1602441 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Аноним 15/05/26 Птн 18:38:54 1613074 2
image.png 84Кб, 461x825
461x825
Набросайте пожалуйста гайд для дауна, что сделать что бы int8 заработал с ускорением. Качал готовые и потестил int8 convrot anima-p3 и klein-9b-base - работает медленнее.
Юзаю ноду Load diffusion model int 8 (W8A8) без on fly флага и сразу в сэмплер.

Python version: 3.13.12 (tags/v3.13.12:1cbe481, Feb 3 2026, 18:22:25) [MSC v.1944 64 bit (AMD64)]
pytorch version: 2.11.0+cu130
Python version: 3.13.12 (tags/v3.13.12:1cbe481, Feb 3 2026, 18:22:25) [MSC v.1944 64 bit (AMD64)]
ComfyUI version: 0.21.0 comfy-aimdo version: 0.3.0 comfy-kitchen version: 0.2.8 ComfyUI frontend version: 1.43.18

Кроме тритона отсюда больше ничего не надо ставить? https://github.com/DazzleML/comfyui-triton-and-sageattention-installer

>>1613038 →
> не должно, комфи полностью портабл
Дело в амнезии похоже упоротой
Аноним 15/05/26 Птн 21:07:11 1613128 3
output00272.png 3037Кб, 1184x1776
1184x1776
output00273.png 2996Кб, 1184x1776
1184x1776
output00274.png 3032Кб, 1184x1776
1184x1776
output00275.png 3031Кб, 1184x1776
1184x1776
Аноним 15/05/26 Птн 21:08:15 1613130 4
output00278.png 2231Кб, 1440x1440
1440x1440
output00279.png 2229Кб, 1440x1440
1440x1440
output00280.png 2343Кб, 1440x1440
1440x1440
output00281.png 2351Кб, 1440x1440
1440x1440
Аноним 15/05/26 Птн 21:10:38 1613131 5
>>1613128
A woman in a dress made entirely of shattered mirror shards, light scattering across the walls around her, standing in an empty ballroom, hyperreal with surreal elements

>>1613130
A portrait of a woman in a dentist's chair. As the dentist uses a drill, the \"tooth\" shatters to reveal a tiny, perfectly detailed miniature office cubicle inside the jawbone, complete with a tiny, glowing computer screen. The woman’s eyes are covered with thick, Industrial-grade silver duct tape.
Аноним 15/05/26 Птн 21:37:03 1613138 6
anima1.02026051[...].png 2156Кб, 1536x1536
1536x1536
anima1.02026051[...].png 2634Кб, 1536x1536
1536x1536
жаль русский текст не понимает
Аноним 15/05/26 Птн 21:39:45 1613139 7
anima1.02026051[...].png 2460Кб, 1536x1536
1536x1536
но клоузапы как бута бы заебись
Аноним 15/05/26 Птн 21:59:37 1613144 8
Поставил Комфу. У меня видеокарта RTX 3060. А Комфа мне пишет, что у меня RTX 4090. Я посмотрел, сколько она стоит. А стоит она 200тыс.руб. Это что, такие системные требования, что ли?
Аноним 15/05/26 Птн 22:14:21 1613151 9
anima1.02026051[...].png 2869Кб, 1536x1536
1536x1536
anima1.02026051[...].png 3271Кб, 1536x2048
1536x2048
anima1.02026051[...].png 3243Кб, 1536x2048
1536x2048
anima1.02026051[...].png 2677Кб, 1536x1536
1536x1536
Аноним 15/05/26 Птн 22:33:26 1613157 10
anima1.02026051[...].png 2210Кб, 1536x1536
1536x1536
anima1.02026051[...].png 1910Кб, 1536x1536
1536x1536
anima1.02026051[...].png 2041Кб, 1536x1536
1536x1536
>>1613130
ну не прям не по промту
Аноним 15/05/26 Птн 23:59:18 1613186 11
anima-1.0.jpg 160Кб, 1152x768
1152x768
anima-1.0-anime.jpg 287Кб, 1152x768
1152x768
Аноним 16/05/26 Суб 06:28:37 1613292 12
Аноним 16/05/26 Суб 06:54:54 1613295 13
>>1613138
>русский текст не понимает
модель-русофоб, не иначе.
Аноним 16/05/26 Суб 08:56:25 1613306 14
>>1613186
В аниме стиле все смотрится получше изначально, но даже на второй как то скудно. Анима умеет композиции получше и вариативность, надо стиль менять мб
Аноним 16/05/26 Суб 09:13:22 1613309 15
anima1.02026051[...].jpg 199Кб, 2048x1536
2048x1536
anima1.02026051[...].jpg 193Кб, 2048x1536
2048x1536
anima1.02026051[...].jpg 234Кб, 2048x1536
2048x1536
anima1.02026051[...].jpg 221Кб, 2048x1536
2048x1536
Аноним 16/05/26 Суб 10:05:26 1613327 16
Аноны, а вы теперь только через комфи генерите? Фордж и другие форки автоматика уже не актуальны?
А то поменял карточку и вспомнил как пару лет назад фордж ставил. Попробовал запустить - а он по какой-то причине не работает больше
Аноним 16/05/26 Суб 11:00:12 1613349 17
>>1613130
Покажи воркфлоу с sage?
Для тестов не лучшую сцену имхо выбрал. Большая часть кадра рендерит пустой фон
Аноним 16/05/26 Суб 11:03:06 1613350 18
>>1613327
Теперь только ComfyUI portable. Всё остальное, если хочешь себе создать трудности на ровном месте, а потом их героически преодолевать.
Аноним 16/05/26 Суб 11:08:09 1613352 19
>>1613074
>Python version: 3.13.12
>pytorch version: 2.11.0+cu130
Ох, ебать, ты прям мои версии юзаешь. Для других могу позже скинуть батник, который всё устанавливает. Прогнал установку ещё раз, сегодня почему-то винда агрится на dll numpy, блочит и крашит всю установку и запуск с включённым Smart App Control.
>>1613144
Тебя надурили и продали 4090 под видом 3060. Нашли лоха, который будет за электричество платить.
Аноним 16/05/26 Суб 12:09:04 1613376 20
>>1613352
> Ох, ебать, ты прям мои версии юзаешь.
Я щас обновляю CUDA до 13.2 и буду ставить тот тритон+sageattention c гита.
Не знаю чего ждать, ничего не знаю
Аноним 16/05/26 Суб 13:13:14 1613429 21
>>1613350
А по какой причине все на комфи перешли-то? Раньше же не пользовался популярностью
Аноним 16/05/26 Суб 13:18:05 1613431 22
Этот сраный тритон и вся хуета - получается это всё слетит при любом следующем обновлении или обновлении dependencies, и INT8 перестанет нормально работать.
Почему через очко всё так? Можно ли ожидать, что INT8convrot станет так же просто юзать как щас mxfp8 например, где просто засовываешь в load diffusion model и работает?
Аноним 16/05/26 Суб 13:32:05 1613438 23
>>1613431
если не говно, то значит добавят в комфи, если не добавят значит говно и похуй
Аноним 16/05/26 Суб 15:07:20 1613490 24
>>1613048 (OP)
> Nunchaku ускоряет модели в 2-4 раза
уберите это говно с шапки, ускоряет трату времени в сутках только чтобы установить этот кал с миллионом ошибок
Аноним 16/05/26 Суб 15:13:25 1613500 25
ComfyUItemplouu[...].png 1957Кб, 1280x720
1280x720
ComfyUItempapyq[...].png 2005Кб, 1280x720
1280x720
Странная хуйня произошла после установки тритона, а может еще раньше после обновления pytorch / pyton.

Идентичный воркфлоу из картинки стал генерить с изменением.

Пик1: 5 дней назад
Пик2: щас

Что на это влияет и почему такая большая разница в деталях с одинаковыми настройками? Ставил еще Nvidia cuda 13.2.1 с их инсталлера.
Есть ли вероятность, что что то стало хуже?
Аноним 16/05/26 Суб 15:25:48 1613513 26
>>1613500
вообще всё влияет на генерацию, версия дров куды прошивки видеокарты комфи питонобиблиотек и тд. не хуже не лучше, просто чуток сид поменялся
Аноним 16/05/26 Суб 15:39:23 1613525 27
image.png 420Кб, 1589x1139
1589x1139
image.png 181Кб, 1295x835
1295x835
Поставил тритон, теперь INT8ConvRot работает быстрее чем FP8.
Теперь пытаюсь понять что такое Complile и sage attention и как это подключить.

Почему когда подключаю TorchCompileModel, начинают лететь ошибки? Скорость становится хуже чем FP8.
Без TorchCompileModel - быстрее работает.
Аноним 16/05/26 Суб 15:56:55 1613536 28
>>1613525
> sage attention
опцию запуска добавь --use-sage-attention
нода есть в KJ Nodes вроде патч называется а может просто сажа аттн
а компиль хз
Аноним 16/05/26 Суб 16:09:53 1613540 29
Анончики, ку!

Подскажите, пожалуйста, как правильно сконфигурировать настройки оптимизатора Prodigy под Аниму. Просто пока такое ощущение, что хоть с ним, хоть без него значение функции ошибок[loss] упирается в плато где-то после 75% эпох, при чём упирается в те же значения, что и на оптимизаторе AdamW, хотя, казалось бы, темп обучения должен оптимизироваться... Да и качество генераций лоры заставляет желать лучшего.

Параметры такие:
learning_rate = 1.0
text_encoder_lr = 1.0
optimizer_type = "Prodigy"
optimizer_args = [
"lr=1.0",
"betas=0.9,0.999",
"beta3=0.999",
"weight_decay=0.05",
"decouple=True",
"use_bias_correction=True",
"safeguard_warmup=True",
"d0=0.000001",
"d_coef=0.75",
"growth_rate=1.1",
"fsdp_in_use=False",
"slice_p=10"
]
lr_scheduler = "constant"
lr_warmup_steps = 0
gradient_accumulation_steps = 1
Аноним 16/05/26 Суб 16:18:25 1613546 30
>>1613500
Далее следует субъективное IMHO (хотя мне встречалось частичное подтверждение, так что я не одинок в этом суждении):
Использование triton и attention механизмов даёт прирост производительности за счёт снижения качества деталей изображения (которого и так немного, везде артефакты геометрии лезут на мелких деталях). Оно не влияет напрямую, но косвенно измененяет результат. Заметишь ты это, если будешь сравнивать два изображения рядом. Если об этом не знать, или не акцентировать на этом внимание, то можно с этим смириться. Я мириться не стал, поэтому без крайней необходимости все эти ускорялки не использую.
Аноним 16/05/26 Суб 16:23:49 1613550 31
>>1613540
> Prodigy
Просто забей. Ковырял его еще в эпоху флюкса, потом под нуба разные вариации, но в итоге остался на AdamW8bit - наше все. Продиджи даже когда работает - слишком грубый и лоры с ними неприятные какие-то.
Аноним 16/05/26 Суб 16:26:08 1613551 32
msedge202605161[...].png 44Кб, 524x509
524x509
cmd202605161819[...].png 37Кб, 1654x311
1654x311
>>1613525
влепил эту ноду с деф настройку на аниму без инт8 потому что его у меня нет и получил ускорение на 1/5, но при первом запуске тоже в логи просрался и чо-то там накомпилил и в последующие разы уже не делал так
отличий считай что нет чуть тень передвинулась
Аноним 16/05/26 Суб 16:47:21 1613565 33
>>1613550
Почему на AdamW8bit, а не AdamW? Если Флюкс мог запустить, то по идее карточка у тебя вообще не нищая, а может даже карточки
Аноним 16/05/26 Суб 16:56:35 1613572 34
>>1613565
Потому что никакого смысла нет. Почитай папиры, потрень, посравнивай или просто поверь.
Аноним 16/05/26 Суб 16:58:06 1613573 35
image.png 122Кб, 1752x581
1752x581
>>1613546
Не знаю что именно изменилось, но если ты посмотришь мои картинки с идентичного воркфлоу и железа - на втором явно детализация увеличивается, не просто погрешность.
А по поводу качества деталей, учту. Не понятно на примере с экспрессивными мазками. Да и что именно и как откатывать что бы получить старое изображение и сравнить я не понимаю. В рамках сессии комфи это не поменять насколько я понял.
Аноним 16/05/26 Суб 17:01:12 1613578 36
>>1613572
Ну если не сложно скинуть ссылки на сравнения, то дай, пожалуйста, если не сложно, а то по теме через поисковики достаточно сложно релевантное и не говно найти.

> потрень, посравнивай
У меня мощностей нету, а знакомые с мощностями уже нахуй шлют.

> Потому что никакого смысла нет
Что-то хз, из того, что читал - было написано, что AdamW8bit это оптимизированный AdamW, который чуть быстрее работает и не слишком требователен к объёму vRAM, вот и решил уточнить.
Аноним 16/05/26 Суб 17:02:12 1613580 37
>>1613578
> а знакомые с мощностями уже нахуй шлют.
Аренду видеокарт и googlecollab чур не предлагать.
Аноним 16/05/26 Суб 17:23:56 1613597 38
cmd202605161834[...].png 86Кб, 1640x759
1640x759
>>1613551
после перезапуска комфи разница ещё больше стала
но я нашёл минус, все генерации зависят от разрешения первой генерация если установлено авто на строке dynamic. если тру или фальш то всегда одинаково. а если авто то появляется третий вариант.
после запуска 1ая генерация 1024 вторая 1536, тогда авто даёт 3 вариант, если 1ая и 2ая генерации по 1536 то выдаёт вариант фальш.
такие дела
Аноним 16/05/26 Суб 19:00:14 1613641 39
anima2026051620[...].jpg 316Кб, 1536x1536
1536x1536
anima2026051620[...].jpg 326Кб, 1536x1536
1536x1536
msedge202605162[...].png 91Кб, 1068x547
1068x547
ещё имба +50% к детализации, дополнительно к +50% скорости

было/стало/ноды
Аноним 16/05/26 Суб 19:30:50 1613652 40
>>1613641
>triton not found; flop counting will not work for triton kernels
Аноним 16/05/26 Суб 19:40:13 1613657 41
anima1.02026051[...].jpg 353Кб, 1024x1536
1024x1536
anima1.02026051[...].jpg 471Кб, 1536x1024
1536x1024
anima1.02026051[...].jpg 411Кб, 1536x1024
1536x1024
anima1.02026051[...].jpg 403Кб, 1536x1024
1536x1024
Аноним 16/05/26 Суб 19:42:40 1613658 42
Аноним 16/05/26 Суб 19:42:59 1613659 43
image.png 24Кб, 606x246
606x246
>>1613641
Раз у тебя всё збс, можешь показать какое у тебя current installation?
.\python_embeded\python.exe .\tools\comfyui-triton-and-sageattention-installer\comfyui_triton_sageattention.py --show-installed

У меня вот с этим >>1613573 даже бывший klein 9b fp8 дистил 70 секунд рендерил в первый раз. И все не INT8 модели будто бы медленней стали работать и иначе.
Аноним 16/05/26 Суб 19:49:15 1613661 44
powershell20260[...].png 47Кб, 1240x497
1240x497
Аноним 16/05/26 Суб 20:00:24 1613669 45
Я что думаю.
RTX 3060 12Gb стоит 20т.р.
RTX 3090 24Gb стоит 70т.р.
А что, если поставить две RTX 3060? Материнка позволяет. Имеет ли смысл?
Аноним 16/05/26 Суб 20:08:24 1613675 46
>>1613669
Только для текста. Для картинок и видео - плохо делится на несколько карт. Почти никак.
Аноним 16/05/26 Суб 20:15:53 1613677 47
>>1613661
я не понял только откуда у тебя приросты нисхуя без INT8 да еще с детализацией
Аноним 16/05/26 Суб 20:17:07 1613678 48
>>1613675
Скачал модель для видео WAN. Она состоит из нескольких safetenzors, два из которых имеют размер около 13Гб. Ведь, Комфа могла бы их загнать каждого на отдельную видеокарту?
Аноним 16/05/26 Суб 20:20:29 1613682 49
>>1613669
5070ТИ за 70к лучше, производительнее чем 3090 во всём, а за 40к лучше 5060ТИ, а во второй слот можно для клипа засунуть теслу за 10к.
Аноним 16/05/26 Суб 20:24:27 1613687 50
>>1613682
детализация за счёт доп шума от эпсилон штуки, а прирост за счёт торчкомпиль, я по диагонали прочёл его описание, получается он преобразует какой-то питонокод в торч??-код на Си или типа того и поэтому быстрее исполняется, но точность один х уменьшается, эпсилон компенсирует, без него хуже
Аноним 16/05/26 Суб 20:24:47 1613688 51
>>1613677
детализация за счёт доп шума от эпсилон штуки, а прирост за счёт торчкомпиль, я по диагонали прочёл его описание, получается он преобразует какой-то питонокод в торч??-код на Си или типа того и поэтому быстрее исполняется, но точность один х уменьшается, эпсилон компенсирует, без него хуже
Аноним 16/05/26 Суб 20:30:37 1613690 52
image.png 105Кб, 626x900
626x900
>>1613551
охуенно, просто менял модельки анимы, и стало крашить даже та которая вот только что работала же
Аноним 16/05/26 Суб 20:34:57 1613694 53
>>1613682
А какую теслу посоветуешь? Если что, уже в одном PCI стоит RTX 3060.
Аноним 16/05/26 Суб 20:44:23 1613697 54
>>1613678
>>1613669
С диффузионными моделями это так не работает. Нельзя. совсем никак.
Аноним 16/05/26 Суб 20:53:55 1613701 55
>>1613694
p100>k80>m60 или ещё что в городе есть, заходи на авито, смотри какие теслы есть, гугли сколько у них куда ядер, где больше то и лучше
Аноним 16/05/26 Суб 21:12:57 1613711 56
эта хуйня с тритоном мутная не понятно как работает,
на клейне 9b vae decode висит 10-20 секунд,
почему что то меняется на не INT8 моделях?

надеюсь бэкап папки python_embeded полностью откатит эту хуйню невнятную

клейн 9b дистил стал городить галлюцинации стабильные, хотя раньше было терпимо
Аноним 16/05/26 Суб 21:26:26 1613719 57
А зачем вам ускорение, если вы генерируете практически один текст итт? Вот я бы наоборот согласен ждать х2, но чтобы гарантированно качественнее было.
Настройка карбюратора на машине без колес, имхо. Ну, гудит лучше, ага.
Аноним 16/05/26 Суб 21:49:08 1613725 58
>>1613711
я кляйн попробовал с торчком запустить тоже самое как и у тебя. скинул гугл гельминту всё море говноошибок говорит на винде хуй сосать только. и инт8 скорее всего к этому всему непричёмный
но зато напомнил про TensorRT,я как раз сегодня на живой форк наткнулся https://github.com/NubeBuster/ComfyUI_TensorRT надо проверить сможет ли он флюх2 переделать, но сегодня уже лень


>>1613719
либо генерируется в основном порнуха и эдиты конфидециальные. оба нельзя постить.
либо просто спортивный интерес заставить гудеть лучше
Аноним 16/05/26 Суб 21:51:03 1613726 59
>>1613376
Жди троян.
Тритон и сажа ставятся просто с uv pip install sageattention triton-windows
Аноним 16/05/26 Суб 21:51:12 1613727 60
>>1613719
>А зачем вам ускорение
Ну, как то неприятно, когда на твоём суперкомпьютере 10 секундный ролик генерируется 6 часов.
Аноним 16/05/26 Суб 22:01:06 1613731 61
>>1613138
gbljhfcs yf[ez z ghtdm. rrfxfk gfhe lytq yfpfl
Аноним 16/05/26 Суб 22:04:26 1613732 62
>>1613429
По причине того что илюха пидорас и все бросает.
Аноним 16/05/26 Суб 22:05:00 1613733 63
>>1613726
на пипи сажа нерабочая, а тритон хз
Аноним 16/05/26 Суб 22:06:32 1613736 64
>>1613678
WAN 2.2 состоит из двух последовательно применяемых моделей. Вторая должна получить на вход полный результат первой.
Аноним 16/05/26 Суб 22:11:55 1613740 65
>>1613731
lf nfv rfxfnm nj ujcgjlb gznm ubujd
Аноним 16/05/26 Суб 22:19:25 1613747 66
>>1613740
>lf nfv rfxfnm nj ujcgjlb gznm ubujd
Текст на изображении написан случайным набором английских букв из-за забытой раскладки клавиатуры. В правильной русской раскладке эта фраза означает: «да там чачатм то господи пять убижд» (с опечатками автора, исходно задумывалось: «да там зачать-то господи пять секунд»).
Аноним 16/05/26 Суб 22:22:16 1613750 67
shockfactorai17[...].mp4 2462Кб, 720x1280, 00:00:11
720x1280
Я ведь прав, что стационарная генерация картинок и видео - в прошлом? Сейчас это лишь удел маргиналов, порно-делов и прочих лоликонщиков? Просто, ни одна стационарная модель не даст такое качество и контроль, как условная Нано Банана
Аноним 16/05/26 Суб 22:24:04 1613753 68
>>1613701
Я так думаю, да и Гугл ИИ тоже так думает, что telsa p40 - оптимальный выбор. Я понимаю, что это говно мамонта, но на нём 24Гб памяти. Да и стоит, блэт, в среднем 20т.р. Многовато для говна. Но, всё-таки, это - оптимальный выбор.
Аноним 16/05/26 Суб 22:25:19 1613754 69
>>1613750
Ты расценки на генерацию видео видел? И, если генерация не удалась, никто деньги не возвращает.
Аноним 16/05/26 Суб 22:27:59 1613755 70
>>1613719
Потому что время фундаментальная метрика. В треде реддита не только плюс по времени, но и по каким то метрикам точности (синтетическим).
Т.е. ты получаешь нечто более быстрое чем FP8, но точное как Q8. А Q8 вроде как почти не отличается от BF16 - который тупо не заводится на 16гб например. А INT8 заводится и работает быстрее чем даже mxfp8.
Тут выйгрыш времени над FP8/mxfp8 просто скорей как бонус.

В совокупности всё лучше (на бумаге).
На практиктике лично я получил кучу еботы, потому что я даже команды Powershell запускать не умею. В итоге хуйня вроде ускоряется реально, но какие то действия воркфлоу вызывают ошибку, которая до ребута комфи блочит всё даже если вернуть вокрфлоу на прежнее рабочее состояние.

Будет збс, если технари всё нормализуют и на блюдечке завезут.
Мне бы ускорение клейна true v2 который на базе klein 9b base сделан с 20-25 шагами очень было кстати без потери качества. Потому что это единственный клейн, который может что то адекватное выдать. Потому как дистил это чистый слоп, с дегенеративным t2i. А 25 шагов v2 достаточно долгий, особенно в хайрезе.
Аноним 16/05/26 Суб 22:36:36 1613759 71
1.jpg 130Кб, 1024x1024
1024x1024
Аноним 16/05/26 Суб 22:40:42 1613762 72
>>1613736
Ну, вообще никаких проблем. Одна модель на одной видеокарте, другая - на другой. И работают попеременно. И не нужно постоянно делать swap между RAM и VRAM, как в случае одной видеокарты на 12Гб.
Аноним 16/05/26 Суб 22:48:53 1613765 73
>>1613747
Пиздец. опять труханы менять.
Аноним 16/05/26 Суб 23:05:41 1613768 74
>ЧТО НОВОГО АКТУАЛЬНОГО
> Lens (3.8B) от Microsoft
и где оно чет не могу найти? И почему нет ernie и еще там куча моделей была. оп хуй
Аноним 16/05/26 Суб 23:47:02 1613772 75
>>1613750
>Я ведь прав, что стационарная генерация картинок и видео - в прошлом?
Прав, только не стационарная, а диффузионная. Будущее за авторегрессионными моделями. Быть может, через два три года появятся и годные локальные авторегрессионки
Аноним 16/05/26 Суб 23:48:31 1613774 76
>>1613768
> моделей была. оп хуй
Кстати недавно в тред вкатился и потому вопрос - на каких моделях аноны генерят и какие сейчас актуальны?
Аноним 16/05/26 Суб 23:50:22 1613777 77
>>1613750
>Просто, ни одна стационарная модель не даст такое качество и контроль, как условная Нано Банана
А пизду с хуем кто тебе даст? Грок - всё. Лоукал все равно нужен для инпейнта.
Аноним 17/05/26 Вск 00:08:29 1613789 78
>>1613777
>Грок - всё.
Один фиг он та же диффузионка
Аноним 17/05/26 Вск 00:58:15 1613807 79
FLUX2dk00029.png 2930Кб, 1920x1088
1920x1088
>>1613750
Ты (или такие как ты) уже который раз приходят в тред локальной генерации с этим набросом. В частности про Nano Banana.

Было бы интересно узнать как она работает на самом деле, потому что при беглом поиске информации есть только рекламные слоганы и красивые слова.
Для того, чтобы это было коммерчески успешным и конкурентоспособным, должны решаться задачи минимизации компьюта и максимизации profit.
То есть как затрачивать на каждого конкретного юзера поменьше вычислительных ресурсов, чтобы при этом выдать ему качество и детали изображения, которое его устроит. Там должно быть интересно под капотом. Может там всё происходит как на локальной генерации, только видимый уровень результата достигается за счёт upsampling prompt, reasoning, какого-нибудь хитрого прохода edit-refine и ещё какой-нибудь пост-обработки. Только это всё оптимизировано по производительности и загрузке железа, чтобы большая часть ценника за генерацию изображения уходила в карман корпоратам, а не на обслуживание накладных расходов на инфраструктуру генерации.
Впрочем, может, я неверно представляю бизнес-модель и всё просто едет на надутом пузыре AI, а когда накачка кончится, напишут «всем спасибо, все свободны» и прикроют лавочку.

В локальных моделях хотя бы примерно понятно что и откуда получается, видны их недостатки, понятно как комбинировать различные модели и применять различные приёмы и костыли для получения удовлетворительного результата.

Для меня было любопытным открытием, когда я вычитал где-то на сайте BFL, что их платная FLUX.2 [max] сама использует prompt enhancer (upsampler), в отличие от FLUX.2 [klein] 9B, которая работает чётко только по токенам из prompt:
https://docs.bfl.ml/guides/prompting_unified_technical#prompt-upsampling
Кроме того, при этом она сама ещё и подтягивает из интернета изображения товаров или объектов по словам из prompt в качестве reference image для edit:
https://docs.bfl.ml/flux_2/flux2_overview#which-model-to-choose
>FLUX.2 [max] includes grounding search: when prompted, it performs web searches to access real-time information to visualize trending products, current events, or the latest styles without manually sourcing reference material.

Я считаю, что с помощью таких вот фокусов или чего-то подобного в комбинации с тем, о чём я писал выше, и создаётся та самая «крутизна» корпоративных моделей, после которых такие как ты пишут:
>Просто, ни одна стационарная модель не даст такое качество и контроль, как условная Нано Банана
Аноним 17/05/26 Вск 00:58:43 1613808 80
shockfactorai17[...].mp4 2462Кб, 720x1280, 00:00:11
720x1280
>>1613777
Дык, скоро крупнейшие сервисы видео-генерации выкатят опцию платного nsfw. Ну, или не скоро, но точно выкатят. Ибо это огромный рынок и доход. Прозреваю, что первыми будут китайцы или жапонцы
Аноним 17/05/26 Вск 01:13:27 1613812 81
>>1613807
Ничего не читал но могу точно сказать что САМА флюха там ничего не энхансит и не ищет. Прикручена обычная фришная ллм вроде мистраля и квена с вебсеч костылем и виженом. вижен может быть отдельно кстати для проверки что там нагуглила первая ллм. енхансит промт, гуглит пикчи, все это закидывает уже в флюху. Хоть сейчас тако можно напердолить в комфи, максимум довайбкодить пару нод и закидывать хоть в кляйн хоть в квен. Банана работает также судя по всему. Там видно что генерация текста и пикчи идут раздельно. Если банану не просить генерить а просто с ней общатся как с асистентом нам мозг где то как у флешки кстати, до 3 про ей далеко.
Аноним 17/05/26 Вск 01:23:48 1613815 82
>>1613774
>какие сейчас актуальны
Смотря для чего тебе. Каждая модель в чем то лучше в чем то хуже. Плюс зависит от доступного железа. То что в шапке то и есть актуально плюс тюны sdxl.
Аноним 17/05/26 Вск 01:37:47 1613816 83
FLUX2dk00030.png 3206Кб, 1920x1088
1920x1088
Аноним 17/05/26 Вск 01:37:51 1613817 84
GrcIlsOEx3.png 17Кб, 693x638
693x638
gChGluTg7T.png 18Кб, 589x559
589x559
OVb3h7cTR0.png 16Кб, 615x601
615x601
ChatGPT Image 6[...].png 2326Кб, 1536x1024
1536x1024
>>1613807
> Там должно быть интересно под капотом. Может там всё происходит как на локальной генерации, только видимый уровень результата достигается за счёт upsampling prompt, reasoning, какого-нибудь хитрого прохода edit-refine и ещё какой-нибудь пост-обработки. Только это всё оптимизировано по производительности и загрузке железа, чтобы большая часть ценника за генерацию изображения уходила в карман корпоратам, а не на обслуживание накладных расходов на инфраструктуру генерации.

Я убежден, что именно так. Изучая результаты нового генератора от ГПТ, который даже в бесплатной лимитке выдает охуенный результат - можно заметить, как она работает с задачами, где нужно синтезировать в реализме то, чего в реализме модель не видела. Не города / природу и обычных людей и одежду, с чем и локальные модели неплохо справляются, а что то экстримальное, постапок, сиберпанк или что угодно еще. Она создает иллюстрационный замыленный задник, который выглядит похоже на реализм, расфокус это маскирует, при этом в фокусе могут быть фотореалистичные объекты, лица, либо материалы с качественным освещением, отражениями.
О чем это говорит? Она не пытается нагенерить однобокие и унылые реалистичные шаблоны, известные модели (как клейн например), она создает лэндскейп в виде иллюстрации и рефайнит его под реализм.
При этом, я не знаю других моделей, которые обеспечивают принципиально то же что может ГПТ, мб потому что хорошее продают за деньги. Все что бесплатное сейчас, включая у гемени - это кал в основном, чуть ли не хуже чем локалка.

Как она строит сюжеты и композицию - почти всегда очень хорошо, независимо от твоего промта, даже если это одна строчка. Здесь дело не только в энхансере промта (промт в принципе не способен описать композицию и постановку кадра достаточно точно, если совокупный генератор этого делать не умеет). Здесь полноценная оркестрация разными моделями, либо одной мощной с разными системными промтами в сочетании с ризонингом LLM.
Прикол в том, что этот подход доступен и локально, просто это требует инжиниринга или как минимум поиска и тестирования подходов вручную, где пока что ты выполняешь роль оркестратора.
У ГПТ "есть вкус" потому что они каждый худ. аспект обернули в отдельный цикл, с возможным ранкингом и отбраковкой вариантов.
Представь, что сперва подточенная на эстетику LLM энансит промт и отправляет на основе него нужные инструкции для генерации эскиза. Получает сразу 5-10 эскизов, анализирует и выставляет ранг, берет лучший, и отправляет дальше, подбирает так же композицию. В итоге и так мощная диффузия, генерит качественную картинку по УЖЕ созданным условным контролнетам, а потом еще делает 2-3 Edit прохода с улучшением текстур, освещения и деталей.

Пиздатость ГПТ это именно оркестрация и воркфлоу в первую очередь, уже потом большая диффузионная модель.

Я убежден что потенциал в локальной генерации при правильных подходах может давать результат лучше 90% корпоративных генераторов, приближаясь к ГПТ. Но это даже вопрос не лор или сложных ворклофоу а подходов и инжиниринга. Например поиск моделей и шаблонов промтов, которые могут закрывать определенные задачи по созданию предварительных генераций, начиная с черновиков, с хорошей стабильностью и пригодные для конверта в последующих проходах.
Аноним 17/05/26 Вск 01:57:26 1613824 85
>>1613808
>Дык, скоро крупнейшие сервисы видео-генерации выкатят опцию платного nsfw.
Ну точно! Именно об этом и говорят все события вокруг грока! Анон, ты гений!
Аноним 17/05/26 Вск 02:02:34 1613826 86
GPT-Dithering-01.png 3797Кб, 3649x1881
3649x1881
GPT-Dithering-02.png 7140Кб, 3617x1889
3617x1889
>>1613817
Смотри, Анон, какую штуку заметил.
Я уже давно писал про артефакт half-tone dithering pattern на линейке Qwen-Image.
Я частично бросил Qwen ещё и из-за этого, хотя знаю как с этим бороться.
Так вот, я очень удивлён, когда увидел half-tone dithering pattern на твоём пикриле, который, к слову сказать, выглядит достойно при просмотре на 1x.
Вообще, как я понял, на Qwen-Image это является, как мне кажется, не столько косяком и болячкой, сколько намеренным способом искусственного «повышения» чёткости и детализации изображения: https://en.wikipedia.org/wiki/Dither
Но когда делаешь минимальный зум, это сразу замечаешь и искусственность генерации становится очевидной, это хуже чем скрытая watermark.
Более того, когда этот dithering убираешь, изображение как бы теряет в чёткости (хотя деталей там изначально и не было, это оптическая иллюзия).
Аноним 17/05/26 Вск 07:21:00 1613872 87
>>1613826
> Более того, когда этот dithering убираешь, изображение как бы теряет в чёткости (хотя деталей там изначально и не было, это оптическая иллюзия).
ну добавь в негативый дизер сеткой и в промт рандомный дизер, получится как на кадрах фильмов и не будет читаемого паттерна как на сканах комиксов
Аноним 17/05/26 Вск 07:33:12 1613875 88
image.png 278Кб, 712x807
712x807
>>1613750
>Сейчас
Это не сейчас, это было всегда. И в этом плюс локалок. Какой даун будет соевый рафинированный кал генерить, да ещё и онлайн
Аноним 17/05/26 Вск 08:22:17 1613884 89
image.png 3473Кб, 1800x1200
1800x1200
Это zit. Что писать в промте, чтобы гроздья винограда и яблоки были такими-же чёткими как и мандарин, то есть сделать фокус не таким коротким. depth of field куда бы я его не совал, в промт или негатив ничего не даёт.
Аноним 17/05/26 Вск 08:28:14 1613887 90
Аноним 17/05/26 Вск 08:30:10 1613888 91
>>1613884
Infinity focus может быть или погугли его синонимы
Аноним 17/05/26 Вск 10:44:34 1613928 92
>>1613762
> Ну, вообще никаких проблем. Одна модель на одной видеокарте, другая - на другой. И работают попеременно. И не нужно постоянно делать swap между RAM и VRAM, как в случае одной видеокарты на 12Гб.

Ты долбаёб? На 12 гб ван и так по сути весь свапнутый в оперативу, и туда-сюда гоняет для каждой итерации
Аноним 17/05/26 Вск 11:17:05 1613953 93
anima1.02026051[...].jpg 473Кб, 2560x1440
2560x1440
anima1.02026051[...].jpg 463Кб, 2560x1440
2560x1440
Аноним 17/05/26 Вск 11:38:35 1613962 94
>>1613928
>долбаёб
Этот с периодичностью раз в месяц лезет сюда со своей сверх-ценной шизой, из теоретиков, судя по всему, потому что если ты хотя бы раз в жизни работал в лапше, то наверняка видел, что Лоры грузятся ТОЛЬКО в своп в независимости от того сколько у тебя памяти (какой угодно). В лапше нет никакого параллелизма, пока не выполнится один блок, второй всегда будет ждать.
Аноним 17/05/26 Вск 11:52:11 1613967 95
anima1.02026051[...].jpg 514Кб, 2560x1440
2560x1440
Аноним 17/05/26 Вск 11:52:31 1613968 96
image.png 1119Кб, 1034x557
1034x557
image.png 371Кб, 450x599
450x599
>>1613826
Это не единственный паттерн-артефакт.
Там еще бывает заметное характерное перенасыщение точками-световыми пятнами в областях с высокой детализацией, будь то персонаж, мокрый асфальт или задник.
А так же крупная пятнистость в задниках.

Вот только такие артефакт сложно назвать большой проблемой. На фоне проблем локальной генерации - это вообще ерунда.
В локальные генераторы будто бы делают всё, что бы не позволить генерить разнообразно и главное красиво. Отдельная модель, может сделать красиво что отдельное, анима композицию, цвета, фантазию, клейны зиты - точные формы, реалистичный свет и текстуры. Но всё разом - принципиально нет. Даже в маркетинговых демонстрациях того или иного, показывают исключительно функциональные кейсы, больше пытающиеся наебать "бизнес".
Учитывая, что даже ГПТ рисует с множественными генерациями, 1 проходный подход на локалке это уже просто васянство, и работает только для узкого типа сценариев, типа 1girl и т.п.
Аноним 17/05/26 Вск 12:02:29 1613973 97
>>1613968
У меня только один вопрос: нахуя ты генерить на этом говне? Там же всё засрано артефачьём, нахуя?
Аноним 17/05/26 Вск 12:03:24 1613974 98
Аноним 17/05/26 Вск 12:07:34 1613976 99
>>1613974
ну значит глаза замылились, пойду траву трогать
Аноним 17/05/26 Вск 12:13:19 1613979 100
>>1613973
Что бы смотреть какой уровень достижим, как минимум. Артефакты это мелочь. Основная ценность - то как целостно, художественно и стабильно получается результат. Ты можешь на локале сгенерить что угодно без заметных артефактов и глюков, но бедность наполнения, композиционная нелепость и уровень фантазии не будет вызывать интереса. Поэтому все в основном и генерят любительские портретки - там все эти проблемы - не проблемы а специфика таких кадров даже ИРЛ.
Аноним 17/05/26 Вск 12:14:41 1613980 101
Этот ваш 8интхуйврот про скорость через костыли, а не про качество, которое он херит даже. Хватит мне его в рот совать, прекратите
Аноним 17/05/26 Вск 12:16:33 1613981 102
Аноним 17/05/26 Вск 12:17:13 1613982 103
anima1.02026051[...].jpg 892Кб, 3072x2048
3072x2048
>>1613974
а вопрос ещё, как называются эти отпечатки хлопковой ткани? это из-за самплера или из-за шедулера или сама модель?
Аноним 17/05/26 Вск 13:43:17 1614023 104
>>1613980
Ты че у красноглазого в реддите таблички показывают лучше метрики превосходящие даже q8 иногда. Т.е. инт8 может быть лучшей опцией юзать модель, при этом быстрее чем мхфп8.
Но работает криво, лоры не понятно как юзать и ошибки срывают сессию комфи
Аноним 17/05/26 Вск 14:10:12 1614038 105
>>1613981
Ты не понял, анима бф16 весит 4 врама, а уквантованная в говно 2 гига. Очевидно такие изваращения никому не нужны. Анон совсем днищук с карточкой в 2-3 врама.
Аноним 17/05/26 Вск 15:09:31 1614073 106
>>1613982
На скедулер похоже.
Аноним 17/05/26 Вск 16:21:48 1614103 107
>>1613808
Точно-точно выкатят, нужно немного подождать. Примерное время ожидания такое же как у "коммьюнити дофайнтюнит" у каждого нового опенсорса. Еблан, законы про дипфейки принимают. Нет, какую-то рандомную хуиту может тебе и дадут генерить, но нахуй она нужна?
Аноним 17/05/26 Вск 16:48:47 1614122 108
>>1614103
>законы про дипфейки
И правильно делают. Это как автомат в руках обезьяны. Ебанутые школьники уже училок дипфейкают и выкладывают на всеобщее. Не говоря уже про обиженок, которые своих тянок сливают. Даже тебе не понравится увидеть фото/видео, где ты насасываешь парочку чернокожих стволов.
Аноним 17/05/26 Вск 16:58:32 1614132 109
>>1614122
А тебя почему это беспокоит?
Аноним 17/05/26 Вск 16:59:46 1614134 110
>>1614122
Так это неизбежно теперь. Остается рассуждать как с этим жить, нежели надеяться на какие то цензуры.
Аноним 17/05/26 Вск 17:08:03 1614142 111
>>1614122
Фотошоп тоже нужно запретить. Ведь там можно сделать дипфейк где ты насасываешь парочку чернокожих стволов.
Еще нужно запретить ножи и газовые плиты. Они смертельно опасны.
Аноним 17/05/26 Вск 17:29:54 1614152 112
>>1614142
ЭТОГО МАЛО!

Нужно еще запретить:
1. Во-первых буквы. Потому что ими можно написать, как он насасывает даже не парочку, а МИЛЛИОН(!) черных стволов;
2. Во-вторых воздух и воду! Он ими дышит и пьёт, а может в это время начать генерировать. Ну и Гитлер тоже дышал и пил. Связь очевидна!
Аноним 17/05/26 Вск 18:02:10 1614163 113
zal inux.ru/?p=10581
перец говорит квен без задней мысли генерит нужное. Мысли? Мнение?
Аноним 17/05/26 Вск 18:23:51 1614168 114
image.png 128Кб, 286x278
286x278
>>1614163
А квен может не пикрил слоп генерить?
Клейн же то же самое делает без слопа, у него только с задниками часто проблемы бывают, но у квена dithering pattern слишком заметный
Аноним 17/05/26 Вск 19:58:31 1614219 115
>>1614132
Не беспокоит, но я понимаю тревогу персонажей принимающих решения.

>>1614142
>Фотошоп
Для начала фотошоп нужно освоить. Даже освоив фотошоп, ты и половины не сможешь сделать, что ИИ делает одним нажатием кнопки.

>>1614152
>запретить ножи и буквы
Как вычислить ололо-школьников без регистрации и смс? Они любой аргумент гипертрофируют и доводят до абсурда.
Аноним 17/05/26 Вск 20:03:17 1614221 116
Очень давно не заходил, хотел поинтересоваться, завезли ли на зит сисик нормальный? Последний раз когда пробовал даже размер задать не давал толком.
Аноним 17/05/26 Вск 20:21:17 1614229 117
ComfyUI00024.png 1445Кб, 752x1392
752x1392
qwen2511.jpeg 118Кб, 768x1376
768x1376
grok-imagine-im[...].jpeg 324Кб, 752x1360
752x1360
gemini-3-pro-im[...].png 6035Кб, 1536x2752
1536x2752
>>1614168
1. локалка
qwen_image_edit_2509_fp8_e4m3fn.safetensors
Qwen-Image-Lightning-4steps-V1.0.safetensors
qwen_image_vae.safetensors
qwen_2.5_vl_7b_fp8_scaled.safetensors
comfyai
ryzen 5 7500f
gygabyte b850 gaming wifi6
ddr5x2 32 gb 2600 MGz 40-40-40-80-120
gigabyte geforce rtx 5060 windforce max oc 8gb
2. qwen_2511 на arena.ai
3. grok-imagine-image на arena.ai
4. gemini-3-pro-image-preview-2k (nano-banana-pro) на arena.ai
промт: Milky-white uniform suit, skirt and epaulets, highly detailed fabric texture, photorealistic
исходник, очевидно, у всех единый.

Думайте.
П%;№":. Подписаться.
Аноним 17/05/26 Вск 20:33:14 1614236 118
Аноним 17/05/26 Вск 20:35:30 1614239 119
111.png 1585Кб, 768x1376
768x1376
Аноним 17/05/26 Вск 20:44:18 1614249 120
>>1614239
>>1614229
гельминт почти топ, если бы нормально по маске вставил кусок изображения, остальные кал, ты в комфи тоже мог по маске вставить, а не кропать и пересоздавать всё изображение
Аноним 17/05/26 Вск 20:59:19 1614265 121
Полностью откатил python_embeded папку, которая была до установки triton-о хуйни.

Генератор всё равно выдает измененную картинку по прошлым сидам.
До этого обновлял только это >>1610677 → для Hidream.
Получается апдейт комфи меняет генерацию?
Нельзя откатиться назад, или это бессмысленно?
У меня ощущение, что тестовые генерации klein 9b distil стали выдавать куда больше глюков, кривой анатомии и коллизий.
Мб накатить с нуля комфи с fast install для спокойствия души. Эти узкоглазые обновы для хуиты ничего не дали только нервы треплют.
Аноним 17/05/26 Вск 21:13:25 1614269 122
>>1614168
Интересно, а если ему фотку члена скинуть - он сможет его реалистичным сделать?
Аноним 17/05/26 Вск 21:21:10 1614272 123
>>1614265
вот >>1613513
ты обречён никогда не повторить свои генерации, поэтому это дрочево хуйня
но есть кое-что интересное/позитивное, ты можешь сохранять свои латенты
Аноним 17/05/26 Вск 21:24:44 1614273 124
ComfyUI00025.png 1338Кб, 752x1392
752x1392
qwen-image-edit[...].jpeg 111Кб, 768x1376
768x1376
gemini-3-pro-im[...].png 5852Кб, 1536x2752
1536x2752
>>1614249
хз, не совсем согласен.
> в комфи тоже мог по маске вставить
Если я в своей локалке обвел ее пиджак, это были бы нечестные условия эксперимента. Я ведь браузерным ии не подсказываю вручную, что именно надо редактировать

1 место - локалка
2 место - гельминт
3 место - илон
4 место - qwen 2511

Поясняю
Моя нейронка с первого прогона не последней версии на железе для кс-го на средних настройках очень неплохо переодела ее, но гельминт получше. Сохранила структуру ткани, оригинально оставила погоны цвета и стильные полоски цвета прокурорской формы. Не замазала ебло и не проебала качество. Но очень сильно засветила левую сторону пиджака, что, я уверен, фиксится

Гельминт с технической точки зрения справился (детализация измененной ткани, освещение), наверное, лучше локалки. Однако проебал элементы одежды (щит и меч распидорасило) и руки теперь у нее красные на какой-то хуй, и морда лица покраснела. + у меня локалка решила проебать перекраску погонов, с другой стороны, получилось довольно таки стильно

Илон в целом неплохо сделал. Из минусов - засветил левую сторону пиджака, руки немного красные.

И последний ваще проебался. Глаза сильно распидорасил, качество проебал, все элементы одежды на хуйню иишную заменил. Ткань какая то тоже мудная, неестественная. + засветил.

Пруф ми вронг


Генерилось 148 сек. остальные +- чуть меньше минуты.


Я это к тому, что локалка не хуже справляется, модель правда сильная. но браузерная модель того же семейства новее qwen2511 сильно хуже справилась. Но что самое удивительное - даже на моей бомжесборке.
Вопрос в зал, замена видюхи кардинально решит проблему качества изображения и глубины проработки, или там будет вопрос скорости генерации?

1. локалка
2. qwen_2511 на arena.ai
3. gemini-3-pro-image-preview-2k (nano-banana-pro) на arena.ai
Илон сказал не будет генерить такую пошлятину
промт: Summer uniform, lightweight short-sleeved white shirt with epaulets, same colour blue lightweight fabric skirt, highly detailed, photorealistic, natural lighting

Тут червяк однозначно топ. Запрос уже сложнее. Погоны сохранил типовые. А у меня проебал и повесил несуществующие иишные морские. По освещению и детализации вроде оба норм, юбка на локалке правда не очень. qwen_2511 опять проебался, юбку ей поменял нахуй и погон левый в воздухе, лицо перекосоебило, иишные элементы одежды ввел.
Аноним 17/05/26 Вск 21:48:19 1614285 125
DSC00262.jpg 787Кб, 1365x2048
1365x2048
>>1614273
> Если я в своей локалке обвел ее пиджак, это были бы нечестные условия эксперимента. Я ведь браузерным ии не подсказываю вручную, что именно надо редактировать
так и грок и гельминт пользуются роем своих агентов для выполнения задачи (квен на арене аи я хз что это наверное тоже), поэтому тут ты добровольно поддаёшься им.

> Не замазала ебло и не проебала качество
проебала, причем значительно размазала

> щит и меч распидорасило
это даже мой человеческий глаз не понял, пятно было пятном и осталось

> морда лица покраснела
> руки немного красные
это пережарка от того что оно регенерировало картинку целиком в своё кратное разрешение

> локалка не хуже справляется
локалка лучше справится потому что у неё оператор человек а не бездушная база ragов

> Вопрос в зал, замена видюхи кардинально решит проблему качества изображения и глубины проработки, или там будет вопрос скорости генерации?
единственная проблема которую замена решит это толерантность к количеству инструментов ввиду значительного ускорения генерации

> Тут червяк однозначно топ. Запрос уже сложнее. Погоны сохранил типовые. А у меня проебал и повесил несуществующие иишные морские.
мне локальный вариант больше нравится, у гельминта эта рубашка будто мужская рубашка лежит на лежачем женском маникене. онлайновый квен просто решил что сисек там не может быть
Аноним 17/05/26 Вск 22:47:26 1614298 126
>>1614273
смысл тестировать на такой изначально всратой картинке с всрато сгенеренным ебалом?

ты не мог взять фотку с норм качеством или норм генерацию?
Аноним 17/05/26 Вск 23:42:46 1614333 127
Мудрые аноны, столкнулся с проблемой, вкатился в Qwen image edit GGUFF q50, характеристики компа nvidia5060 8gb vram. Проблема вот в чем, редактирование изображения занимает примерно 130-170 сек, это с лора на 4 шага хотел уточнить норм ли это для моих характеристики, потому что чат джпт нормально ответить не может и если ли какие то лайфаки как можно сделать генерации быстрее, это первое.
Второе, я заметил что comfy постоянно заново грузит модель, хотя из изменений я вношу только промт что соответственно влияет на скорость, джпт говорит что это не норм, но обосравшись он так и не смог помочь это исправить
Аноним 17/05/26 Вск 23:55:59 1614349 128
>>1614333
Всё норм. Edit процесс не быстрый. Ещё и зависит от разрешения изображения и reference.
А сколько у тебя RAM?
Я уже не помню, но для линейки Qwen-Image-Edit нужно где-то более 30 Гбайт памяти. Возможно у тебя не хватает RAM и переливается уже на SSD.
Есть разные средства для оценки того, что происходит, но самое простое и доступное, это держать открытой вкладку «Производительность» диспетчера задач и смотреть что происходит.
Аноним 17/05/26 Вск 23:59:30 1614351 129
Аноним 18/05/26 Пнд 00:04:25 1614352 130
>>1614351
Печально.
В общем, можешь открыть вкладку производительность и посмотреть: (сначала заполнится VRAM, затем RAM) если после этого пойдёт активная запись на SSD в процессе загрузки моделей и генерации, то это оно.
Лечится только увеличением объёма VRAM/RAM.
Аноним 18/05/26 Пнд 03:49:36 1614425 131
1.jpg 262Кб, 1152x768
1152x768
2.jpg 229Кб, 768x1152
768x1152
Не ну анима норм
Аноним 18/05/26 Пнд 04:14:12 1614431 132
>>1613327
У меня фордж работает.
Настройки видимо со старой карточки мешают запустится. Или слишком долго не обновлялся и он теперь не может обновится а без обновления не запускается.
Аноним 18/05/26 Пнд 04:18:18 1614432 133
>>1613429
Ну я перешел потому что все новинки сразу поддерживаются там, а другие хз. Неудобная она конечно очень.
Аноним 18/05/26 Пнд 06:51:21 1614450 134
>>1614333
возьми лучше клейн, он менее требователен и картинка получаемая мне больше квена нравится
Аноним 18/05/26 Пнд 07:51:23 1614462 135
image.png 3003Кб, 1800x1200
1800x1200
жду ваших сверх-детальных высокохудожественных натюмортов от профессоров-теоретиков до суровых неулыбчивых мужиков профессионалов за 40. Только реалистик, только хардкор, только читый промтинг без gemini костылей и промт-экстендеров. Это zit, если что.
Аноним 18/05/26 Пнд 09:55:53 1614515 136
>>1614462
> только читый промтинг без gemini костылей и промт-экстендеров.
Ну не ты решаешь, что и как делать. Если ты сам для себя что то решил, это ничего не означает
Аноним 18/05/26 Пнд 10:11:14 1614523 137
>>1614515
>ничего не означает
окээээй, сделай как сможешь.
или поздно, и ты уже обиделся?
я часом не спугнул тебя, оленёнок бэмби?
Аноним 18/05/26 Пнд 12:36:33 1614620 138
>>1613815
а на 16vram что пойдет?
Аноним 18/05/26 Пнд 13:18:33 1614643 139
Аноним 18/05/26 Пнд 13:33:38 1614653 140
изображение.png 1737Кб, 1248x1000
1248x1000
>>1614462
>жду ваших сверх-детальных высокохудожественных натюмортов
Мы целый день ждали пока ты с фокусом справишься, а в итоге смог только сгенерить яблоки с тыквенными семечками. Предыдущая генка вышла лучше
Аноним 18/05/26 Пнд 13:49:19 1614664 141
>>1614653
>с тыквенным
латтэ? Хочеь отлебнуть?
>Мы
Кто?
Эти твои "Мы" сейчас находятся с тобой в одной комнате?
Так, я от "Вас" дождусь чего-нибудь, или тебе просто попизднть охота?
Аноним 18/05/26 Пнд 15:38:14 1614749 142
>>1613641
Странный этот Epsilon Scaling. Я только его подключил - получил некоторое увеличение скорости. Но если любую лору еще подключить - скорость возвращается к изначальной.
Аноним 18/05/26 Пнд 15:44:13 1614757 143
>>1614462
Щас только штаны надену и кабанчиком побегу натюрморты делать по ТЗ с харкача, ведь просил сам ты, не хуйбыкто, для этого же я локалочки держу, да и вознаграждение стоящее! Не зря потрачу время своей жизни.
новая t2i, t2v, edit модель от китайцев Аноним 18/05/26 Пнд 15:52:50 1614763 144
image.png 12530Кб, 2342x3799
2342x3799
image.png 3364Кб, 1553x1437
1553x1437
кто помнит что Wan мог генерировать картинки

теперь у нас есть еще одна модель которая может как в t2i так и t2v (+edit на обоих)

и о сюрприз сюрприз - от китайцев да ты шо как обычно

еще более удивительно, что все это умещается в 3b параметров.

https://huggingface.co/bytedance-research/Lance
https://lance-project.github.io/
новая t2i, t2v, edit модель от китайцев Аноним # OP 18/05/26 Пнд 15:54:51 1614764 145
t2v-fg-sp-0009-[...].mp4 2760Кб, 1664x896, 00:00:09
1664x896
t2v-fg-sp-0014-[...].mp4 2787Кб, 1664x896, 00:00:09
1664x896
t2v-fg-sp-0041-[...].mp4 5377Кб, 1664x896, 00:00:09
1664x896
t2v-sp-fg-0005-[...].mp4 4633Кб, 1664x896, 00:00:09
1664x896
>>1614763
и да, это первая 3b видео модель в таком качестве?
Аноним 18/05/26 Пнд 16:44:23 1614809 146
>>1614757
>хуйбыкто
попыталось дерзить, но потом осеклось, и тихо заплакало утирая сопли.
Аноним 18/05/26 Пнд 17:19:41 1614840 147
>>1614763
>GPU не менее 40 ГБ
Спасиба, конешна, но в 5080+32РАМ не влезет
Аноним 18/05/26 Пнд 17:43:21 1614853 148
ComfyUItempuukl[...].png 3057Кб, 1599x903
1599x903
Аноним 18/05/26 Пнд 19:16:45 1614919 149
>>1614840
видео модели необязательно грузить во ВРАМ, можно в ОЗУ подержать, ну с ван и лтх работает так с норм скоростью
Аноним 18/05/26 Пнд 19:57:24 1614955 150
>>1614122
Сколько платят за пост? В целом приятно работать или заёбывает такое писать?
Аноним 18/05/26 Пнд 19:59:41 1614957 151
>>1614764
Проиграл. Да это первая 3B модель в таком копрокачестве. 1.3B ван отъебёт.
Аноним 18/05/26 Пнд 20:09:34 1614969 152
>>1614955
Ну давай разберем по частям тобой написанное. Китаезы заявляют в ТТХ не менее 40 ГБ, но о конкретных цифрах умалчивают. 16+32=48, тоесть это чуть больше, чем минимальные требования. Как мы знаем, нам доступна не вся видеопамять и 10-15 Гигов оперативки будет занято под текущие задачи. А это значит, что нехватка станет покрываться за счет ссд. В связи с чем вопрос: ты просто вредитель или таки продаван ссдшников?
Аноним 18/05/26 Пнд 21:57:01 1615029 153
2.jpg 2837Кб, 2880x1616
2880x1616
1.jpg 4703Кб, 3600x2240
3600x2240
>>1614462
SDXlя с чужим. Zетка с котом
Аноним 18/05/26 Пнд 22:12:53 1615033 154
>>1615029
Чужого знает даже полторашка. В любой модели вбить xenomorph hug pink plush heart выдаст миджорную местерписю 10/10
Аноним 18/05/26 Пнд 22:22:19 1615040 155
anima1.02026051[...].jpg 548Кб, 1200x1920
1200x1920
anima1.02026051[...].jpg 326Кб, 1200x1920
NSFW Нажмите, чтобы открыть
1200x1920
Аноним 18/05/26 Пнд 22:31:36 1615043 156
anima1.02026051[...].jpg 378Кб, 1920x1200
1920x1200
Аноним 18/05/26 Пнд 22:43:18 1615049 157
202501091921550[...].png 2135Кб, 1280x1280
1280x1280
202501091930250[...].png 3876Кб, 1760x1760
1760x1760
202501070158560[...].png 1415Кб, 1024x1024
1024x1024
>>1614749
епсилон как tcd lora срёт грязью и почему-то выпрямляет улучшает картинку, но больше 1.005 постоянно в 90% случаев грязная хуета, а вот ниже уже кое-что можно даже на постоянку оставлять для небольшой коррекции, даже на ровно 1.000 эффект есть в геометрии
на скрине тсд лора чуть-чуть и много, третий прост по приколу нр тоже тсд
Аноним 18/05/26 Пнд 23:09:08 1615061 158
anima1.02026051[...].jpg 551Кб, 2560x1440
2560x1440
Аноним 18/05/26 Пнд 23:22:41 1615069 159
>>1614749
а ну и епсилон не ускоряет, ускоряют торчи тритоны через торчькомпил
макака ебаная со своими лагами и всратой капчей шла в пизду
Аноним 19/05/26 Втр 00:14:02 1615103 160
>>1615040
>nsfw
Чёт орнул от соевости. Доска буквально про еблю
Ты ещё пиши дисклеймер епта лол
Аноним 19/05/26 Втр 00:35:13 1615113 161
image 1194Кб, 1024x1024
1024x1024
image 1180Кб, 1024x1024
1024x1024
image 1164Кб, 1024x1024
1024x1024
image 1562Кб, 1024x1024
1024x1024
Аноним 19/05/26 Втр 01:04:02 1615118 162
zit (7).png 1312Кб, 1024x1024
1024x1024
>>1615103
а ты постить что-то можешь или только в рот брать?
Аноним 19/05/26 Втр 03:32:36 1615138 163
>>1614969
Услышал тебя, братик. Напиши анекдот про платные сообщения, но с уклоном в дорогую оперативную память.
Аноним 19/05/26 Втр 05:04:45 1615152 164
>>1615113
кончил на 3ю, можете удалять
Аноним 19/05/26 Втр 06:16:30 1615160 165
>>1615061
>+чучуть
Было лишним.
Они у тебя словно стоят в строю, на одной линии, лук явно добавлен чуть позже, у меня при запекании была проблема с коротким фокусом, объект который занимал в промте чуть больше внимания чем остальные, сильно тянул на себя одеяло. Приходилось по чуть-чуть добавлять подробностей остальным, чтобы выровнить ситуацию ничего не сломав.
Аноним 19/05/26 Втр 06:20:12 1615161 166
>>1615043
>>1615160
У тебя тоже самое кстати, поверхность стола + - 2-3 см и уходит из фокуса, как с этой фото-ебалой бороться? Никакие заклинания про фокус и глубину резкости не работают.
Аноним 19/05/26 Втр 06:21:37 1615162 167
Аноним 19/05/26 Втр 11:39:41 1615276 168
image.png 628Кб, 1433x687
1433x687
image.png 504Кб, 1429x702
1429x702
Кто-нибудь пробовал реалистичную аниму?
Аноним 19/05/26 Втр 12:06:25 1615294 169
Аноним 19/05/26 Втр 12:25:08 1615301 170
Порекомендуйте модель для красивого нейрослопа? Какие там годные последние?
Аноним 19/05/26 Втр 12:29:37 1615305 171
>>1615301
смотря что в твоем понимании красиво
Аноним 19/05/26 Втр 12:47:04 1615316 172
ебучая bad анатомия не позволяет творить
Аноним 19/05/26 Втр 12:55:30 1615322 173
1.jpg 287Кб, 1024x1408
1024x1408
144964798p0mast[...].jpg 1606Кб, 1200x1200
1200x1200
133125858p0mast[...].jpg 1196Кб, 1200x960
1200x960
132556564p0-Cut[...].png 3625Кб, 2304x1536
2304x1536
>>1615305
Постарался выбрать из разного что приглянулось. Ну вот например красиво. Я не уверен как это правильно называется. Сверхдетализированное реалистичное аниме?
Аноним 19/05/26 Втр 13:02:13 1615325 174
>>1615322
>Я не уверен как это правильно называется
Дети.
Аноним 19/05/26 Втр 13:13:23 1615333 175
>>1615322
Для аниме-даунов есть отдельная ветка, здесь только суровые мужики профессионалы за 40 с диагнозом: гиперреализм.
Аноним 19/05/26 Втр 13:15:49 1615337 176
>>1615333
Понял, и правда, съебал туда.
Аноним 19/05/26 Втр 13:15:54 1615338 177
Аноним 19/05/26 Втр 13:18:50 1615342 178
image.png 656Кб, 1493x701
1493x701
>>1615294
Свежайшая, буквально на днях вышла, сетка, которая заточена под генерацию аниме, в том числе без цензуры. Более-менее слушается промта.

Кстати, какая локальная сетка будет самой точной, в плане следования промту?
Аноним 19/05/26 Втр 13:33:59 1615362 179
Надо новую 5090 обкатать.
Какие щас актуальные тяжелые модели?
Из не тяжелых - СДоХЛя сдохла так понимаю?
Комфилапша еще актуальна?
Аноним 19/05/26 Втр 13:37:29 1615369 180
>>1615342
> какая локальная сетка будет самой точной, в плане следования промту
Это не полноценная метрика. Клейн и ZIT отлично слушаются промта, до определенной степени. Но ни какой промт не заставит их нарисовать красиво
Аноним 19/05/26 Втр 13:39:08 1615372 181
>>1615362
>Какие щас актуальные тяжелые модели?
Флюкс 2 Девочка
Аноним 19/05/26 Втр 13:48:05 1615377 182
image.png 1080Кб, 896x853
896x853
>>1615369
Да мне, просто чтобы понимала позиционирование и учитывала кучу добавленных деталей и персонажей.

Так-то та же Нанобанана, в своих первых вариациях, когда она еще имела другое название, генерировала довольно всрато(пример на пикриле), где-то на уровне полторашки.
Но при этом какая же она послушная была! И уже отлично работала с текстом.
Аноним 19/05/26 Втр 13:50:17 1615379 183
>>1615342

хзчето
Она же как сдохля функционально. Зачем нам еще одна сдохля когда есть миллион поней и илюструсов?
Аноним 19/05/26 Втр 13:51:35 1615383 184
Клейн edit расхайпленная говнина. Анатомию не фиксит, не понимает отдельных банальных инструкций. Выборочно-абсолютно слепой и не вменяемый в сложных сценах.
Не существует костылей для этого. Inpaint не понятно на какой модели юзать, да и сложные косяки этим не пофиксить
Аноним 19/05/26 Втр 14:15:16 1615402 185
564x3181.jpg 15Кб, 427x318
427x318
>>1615383
>Клейн edit
>Inpaint
>анатомию не фиксит
лол, буквально на днях перегонял кривульки из сдхл
Аноним 19/05/26 Втр 14:30:59 1615413 186
image.png 12Кб, 475x100
475x100
image.png 69Кб, 627x521
627x521
За 23-24 год накопилось 100 гигов всяких SDXL и полторашек.
Они же теперь все неактуальны, как я понимаю и можно смело тереть?
Аноним 19/05/26 Втр 14:36:11 1615420 187
Аноним 19/05/26 Втр 14:41:44 1615426 188
Аноним 19/05/26 Втр 14:53:01 1615437 189
image.png 60Кб, 244x238
244x238
>>1615413
Удаляй всё это. Сориентирую тебя. Сейчас из картиночных актуальные только 2: реалистик flux 2 (klein edit 9b destill не больше сдохли жрёт, быстрей, качество и функционал выше) и манямекал anima 1.0 (требования врам ниже чем у любой сдохли, качество выше). Есть ещё z-image-turbo это чисто для t2i без edit фичи, качество текстур ниже флюскала, но результат не отличим вообще от кадра из фильма.
Аноним 19/05/26 Втр 14:53:35 1615439 190
Что скажете про Ernie?
Аноним 19/05/26 Втр 14:54:25 1615440 191
>>1615413
Не все. Я не знаю что за чудо, но лучшие лоры у меня обучались на натвиз 2, и работали на ластифай. Вот их есть смысл оставить. Новая восьмая внезапно начала лучше работать с этими лорами чем 5-7. Но это всё просто как разнообразие к Klein и ZIT.
Аноним 19/05/26 Втр 14:54:30 1615441 192
>>1615439
Уже обсосали. Проходной кал
Аноним 19/05/26 Втр 14:59:09 1615446 193
>>1615437
>Сейчас из картиночных актуальные только 2
А как же Люмина и Квен?
Аноним 19/05/26 Втр 15:29:18 1615470 194
Аноним 19/05/26 Втр 16:18:49 1615499 195
изображение.png 1740Кб, 1280x640
1280x640
изображение.png 746Кб, 1280x640
1280x640
изображение.png 3471Кб, 1120x1488
1120x1488
изображение.png 1017Кб, 880x1168
880x1168
>>1615439
Мне понравился base. Он быстрый, сходится за 20 шагов. У него меньше плесени. Хорошо с вариативностью, пониманием большого промта и структурированными изображениями, терпимо с цензурой изкоробки. Из проблем - анатомия иногда разваливается, практически всё пиздоглазлое, стилей меньше чем в zib, вместо плесени - шакалы сжатия.
По сути что-то между zit и zib. Я оставил
Аноним 19/05/26 Втр 17:50:58 1615573 196
postapoc.arabic[...].webp 340Кб, 1920x1080
1920x1080
postapoc.chines[...].webp 288Кб, 1920x1080
1920x1080
postapoc.englis[...].webp 263Кб, 1920x1080
1920x1080
postapoc.french[...].webp 292Кб, 1920x1080
1920x1080
zit, 1 промт, 1 сид, 10 языков
Аноним 19/05/26 Втр 17:51:19 1615574 197
postapoc.german[...].webp 390Кб, 1920x1080
1920x1080
postapoc.indone[...].webp 335Кб, 1920x1080
1920x1080
postapoc.italia[...].webp 341Кб, 1920x1080
1920x1080
postapoc.japane[...].webp 340Кб, 1920x1080
1920x1080
Аноним 19/05/26 Втр 17:52:17 1615575 198
postapoc.russia[...].webp 341Кб, 1920x1080
1920x1080
postapoc.spanis[...].webp 292Кб, 1920x1080
1920x1080
Аноним 19/05/26 Втр 17:58:19 1615581 199
>>1615379
Она на современных трансформерах сделана. Какая ещё сдохля?
Аноним 19/05/26 Втр 18:00:27 1615582 200
>>1615581
Он не поймет, не старайся зря.
Аноним 19/05/26 Втр 20:14:38 1615681 201
sdxl01.jpg 327Кб, 1024x1024
1024x1024
Имба, имбища...
Аноним 19/05/26 Втр 20:26:04 1615692 202
Аноним 19/05/26 Втр 20:40:32 1615701 203
>>1615692
кляйн так не умеет, потому что расхайпленная говнина
Аноним 19/05/26 Втр 20:45:53 1615705 204
>>1615681
Звенящая пошлость.
Аноним 19/05/26 Втр 21:40:51 1615741 205
Sdxl00068.jpg 165Кб, 1024x1024
1024x1024
А так ваш клян умеет?
Аноним 19/05/26 Втр 22:03:28 1615773 206
image.png 18Кб, 427x222
427x222
есть норм нода для разрешения? где можно выбирать стандартные разрешения разных форматов

пикрил хуета не позволяет выбрать 1280х720, у неё до десятых только ввод, не ввести 0.92
руками вводить неудобно
Аноним 19/05/26 Втр 22:12:12 1615785 207
>>1615701
а судя по шуму и соскам голимый кляйн...
Аноним 19/05/26 Втр 22:33:11 1615804 208
Аноним 19/05/26 Втр 22:46:37 1615810 209
image.png 170Кб, 2205x618
2205x618
>>1615773

На пике не множитель, а большая сторона сторона задается, но ты понял.
Аноним 19/05/26 Втр 22:53:20 1615815 210
image.png 219Кб, 1460x603
1460x603
>>1615402
эта не работает
дай вф пж
Аноним 19/05/26 Втр 23:30:40 1615843 211
>>1615773
Многим моделям с VAE необходимо, чтобы разрешение по любой из сторон было кратно 32.
Если не ошибаюсь, отдельно для FLUX.2 [klein] вроде бы 16 (но я на всякий случай, всё равно 32 делаю).
Сколько этот узел у тебя выдаёт? 1280×736? Если так, то всё правильно. 1280×720 ровно не будет (только если потом сам лишнее обрежешь).
Точно так же будет с 1920×1088.
Аноним 19/05/26 Втр 23:34:40 1615846 212
Кто то пробовал LLM-in-the-loop Evaluation с зацикливанием в комфи?
Аноним 20/05/26 Срд 02:24:58 1615920 213
anima.jpg 364Кб, 768x1152
768x1152
1girl, solo, long hair, shirt, brown hair, black hair, dress, holding, standing, short sleeves, outdoors, barefoot, medium hair, water, tree, bare legs, bird, grass, bug, scenery, nature, fish, reflection, backlighting, silhouette, watercraft, river, boat, lake, fishing rod, fishing, holding fishing rod, fishing line, oar
Аноним 20/05/26 Срд 05:34:46 1615939 214
anima1.02026051[...].jpg 275Кб, 1200x1920
1200x1920
Аноним 20/05/26 Срд 05:39:56 1615940 215
Аноним 20/05/26 Срд 05:46:20 1615941 216
>>1615920
>1girl, solo,
Миссия провалена, как большинство аниме-моделек с разной степенью реалистичности по злой иронии плохо умеют в вангёрл)
Аноним 20/05/26 Срд 05:53:56 1615943 217
>>1615843
>необходимо
Для чего необходимо, что-бы дико переврать уже сгенеренное, похезав добрую половину деталей? У меня для тебя плохие новости, говняному (как правило) vae похуй что гробить и с каким дименшином. От того, что ты на пару-тройку пикселей увеличишь одну из сторон лучше не станет. Это копиум и блохоискательство, кстати это прекрасный девиз для этого треда.
Аноним 20/05/26 Срд 06:19:45 1615948 218
anima1.02026052[...].jpg 672Кб, 1920x1200
1920x1200
Аноним 20/05/26 Срд 10:20:10 1616008 219
>>1615920
>>1615948
Впервые вижу кого-то с фетишем на рыбалку. Оказывается, бывает и такое.
Аноним 20/05/26 Срд 10:28:30 1616014 220
изображение.png 747Кб, 768x1152
768x1152
изображение.png 863Кб, 768x1152
768x1152
изображение.png 1235Кб, 768x1152
768x1152
изображение.png 954Кб, 768x1152
768x1152
Аноним 20/05/26 Срд 11:02:01 1616037 221
zit (20).png 1234Кб, 1024x1024
1024x1024
>>1616014
> выгружено 1 час назад
кто же это может быть!? неужели еблан с номером поста 1616014
Аноним 20/05/26 Срд 14:11:39 1616159 222
>>1616014
>>1616037
Самое быстрое детективное расследование.
Аноним 20/05/26 Срд 16:45:17 1616325 223
anima.jpg 222Кб, 1152x768
1152x768
>>1616008
Разнообразие для лечения десенсибилизации
Аноним 20/05/26 Срд 17:14:50 1616352 224
>>1616325
>десенсибилизации
Это когда копро уже не вставляет?
Аноним 20/05/26 Срд 17:32:46 1616366 225
Аноним 20/05/26 Срд 20:47:31 1616535 226
ComfyUItempsrny[...].png 1939Кб, 1024x1024
1024x1024
Аноним 20/05/26 Срд 20:59:26 1616542 227
ComfyUItempsrny[...].png 5759Кб, 1760x1760
NSFW Нажмите, чтобы открыть
1760x1760
Аноним 20/05/26 Срд 22:18:46 1616607 228
Sdxl00232.jpg 154Кб, 1248x832
1248x832
Аноним 20/05/26 Срд 22:21:20 1616608 229
>>1616535
Найс, куда свечку проебал?
Аноним 20/05/26 Срд 23:07:43 1616647 230
Аноним 21/05/26 Чтв 02:01:32 1616740 231
А можно ли как-то получить прозрачность, не грубо вырезав фон, а чтобы полупрозрачные пиксели были на волосах там итп?
Аноним 21/05/26 Чтв 02:16:11 1616745 232
>>1616740
>прозрачность, фон, полупрозрачные пиксели
Не понял.
Пикрил с примером того, что ты хочешь получить запости. И модель на которой собрался делать.
Аноним 21/05/26 Чтв 05:13:13 1616770 233
anima.jpg 323Кб, 768x1152
768x1152
>>1615939
>пикрел
Анон, по тонкому льду ходишь... Эту модель надо запретить я считаю
Аноним 21/05/26 Чтв 08:10:38 1616790 234
>>1616770
кляйн то же самое может только реалистичней
Аноним 21/05/26 Чтв 08:13:06 1616791 235
>>1616740
Можно, просто ллм скажи что бы ноды накидала раз ничего не умеешь. Блюришь маску и пиздец.
Аноним 21/05/26 Чтв 11:33:54 1616861 236
>>1616790
> кляйн то же самое
Ты про качество с 1.5?
Аноним 21/05/26 Чтв 11:34:24 1616864 237
F2Kupscaled00009.png 2395Кб, 1850x1044
1850x1044
Еще один бенчмарк для генерации (не промт). Сгенерить красиво практически невозможно.
Никакая сдохля, клейн или зит вам не помогут. Вы будете получать либо унылый бедный слоп, либо недостаточный реализм, но обычно будет и то и другое одновременно. пикрандом


Формат: фотореализм
Эпоха/сеттинг: любые
Освещение/атмосфера/цвета: любые
Сюжет: Осмотр места преступления (труп) в мире с антропоморфными животными.
Условия и детали: любые

Персонажи и их детали:
- Детектив: Антропоморфное животного любого вида. Имеет роботизированные протезы лапы и ног.
- Офицер полиции: Антропоморфная самка любого животного.
- Жертва: Труп любого антропоморфного животного.
- Толпа/массовка: Aнтропоморфные животные, собравшиеся вокруг места происшествия.
- Задний план: Любой
- Время суток / погода: Любые

Всё что не уточнено - допустимо.
Аноним 21/05/26 Чтв 11:41:08 1616865 238
>>1616790
Это да, может и похлеще на самом деле, и внезапно быстрей
>>1616861
Анима буквально полторашка в мире полуреалистика и на самом деле так её использовать тупо

Поэтому так и использую мхе
Аноним 21/05/26 Чтв 11:41:17 1616866 239
image.png 3243Кб, 1920x1072
NSFW Нажмите, чтобы открыть
1920x1072
собака разбила банку с малиновым вареньем и лежит грустит
Аноним 21/05/26 Чтв 11:42:42 1616867 240
>>1616866
Ещё и с такой ехидной ухмылкой, мол эти дебилы думают что это варение, а на самом деле кетчуп
Аноним 21/05/26 Чтв 12:35:57 1616891 241
изображение.png 1123Кб, 1068x785
1068x785
>>1616864
Будем честными. Всё начнёт ломаться ещё на комбинации "фотореализм" и "антропоморфные животные".
Аноним 21/05/26 Чтв 12:51:41 1616897 242
image.png 1190Кб, 1280x720
1280x720
>>1616891
В принципе допустимо хоть реалистичные ебала собак, не искаженных человеческими чертами. В принципе вообще какая угодно реализация бы сгодилась, если бы это было реалистично и +- красиво. Гпт вот так делает. Локалка стабильно хуйню городит
Аноним 21/05/26 Чтв 13:22:40 1616917 243
>>1616897
> красиво
>> дат пик
Летсо этого сгенерировали? С кем я сижу на одной доске...
Аноним 21/05/26 Чтв 13:40:19 1616924 244
>>1616897
> Гпт вот так делает. Локалка стабильно хуйню городит
тебе платят за это?
Аноним 21/05/26 Чтв 13:54:19 1616938 245
>>1616917
Где ты прочитал, что я сказал что у гпт красиво?
Ты сам это выдумал.
А теперь покажи, что по твоему красиво. Предвкушаю унылое кало-говно, потому что ты ничего кроме этого в глаза не видел. Отъебись от меня
Аноним 21/05/26 Чтв 14:10:34 1616951 246
ComfyUItempokcq[...].png 7275Кб, 2352x1328
2352x1328
>>1616924
ты как человек молекула на гпт триггеришься, начинаю уже орать с этого
Аноним 21/05/26 Чтв 14:30:58 1616958 247
>>1616951
я тебе впервые написал и в последний, иди на хуй
Аноним 21/05/26 Чтв 14:41:56 1616966 248
Не заходил в тред год. Уже появились модели хотя бы отдаленно по качеству на уровне копро моделей? Вот в текстовых локалках есть гемма, которая уже на уровне старших копро моделей. А что здесь? Всё так же по старому?
Аноним 21/05/26 Чтв 14:45:36 1616968 249
>>1616966
Да.

> гемма, которая уже на уровне старших копро моделей
Ты уже вытекаешь из треда.
Аноним 21/05/26 Чтв 14:49:11 1616969 250
>>1616968
Хуй на. Пробежал сейчас несколько тредов по диагонали и вижу всё тот же пластик и эмбос деталей сваливающий все в один визульный шум. Ничего не поменялось со времен 1.5
Аноним 21/05/26 Чтв 15:52:37 1616993 251
>>1616951
И в чём он не прав? Ну пару раз написал ты про свой гпт, сравнил и ок, не? Цель, смысл, зачем каждый тред трястись и плакать сравнивая? Чтобы что?
Аноним 21/05/26 Чтв 15:54:58 1616994 252
>>1616969
Тогда нахуй ты спрашивал?Цель, смысл, чтобы что?
Аноним 21/05/26 Чтв 15:58:38 1616996 253
photo2026-05-07[...].jpg 97Кб, 512x768
512x768
>>1616966
> отдаленно по качеству
Можно сказать, что да.
На 16gb:
Реализм в простых casual сценариях практически полностью достигнут.
Реализм в сложных сценариях разваливается даже у GPT.
Детализация и разнообразие в некоторых генераторных локалках уже неплохая, та же anima, хоть и без реализма.
Из коробки стабильность низкая, нужно гриндить сиды и подбирать промт. - в этом плане корпы принципиально лучше.

Так же не существует AIO универсальная для всех специфичных задач. - Всё только через разные модели/лоры руками.
Но самое качество локальных моделей в плане текстур и стабильности сейчас достаточно высокое.

Если ты хочешь локально из коробки и за сразу за 1 клик - то такое будет не раньше чем через 5-10 лет, когда корпоратка уже будет генерить фотореалистичные видео бесплатно, тогда ты тоже придешь спрашивать, может ли локалка генерить по клику фильм?

>>1616969
Ты сказал
> хотя бы отдаленно

> эмбос деталей сваливающий все в один визульный шум
Лучшая корп модель делает так же в ряде случаев. А то что ты описываешь - это в основном черта ZIT, а еще такое и в ИРЛ бывает.
Аноним 21/05/26 Чтв 16:03:32 1617001 254
>>1616996
Смысл ему объяснять, он же думает, что все итт только годноту выкладывают. Я сюда года 4 только шлак недавшийся кидаю ради рофла, смысл мне хорошее постить, я лучше это монетезирую на лохах и на эти коины обучу лора или моделью зафайнтюню нахаляву.
Аноним 21/05/26 Чтв 16:03:58 1617002 255
>>1616966
Корпоратки это не просто модель, а сложный агент-рисовальщик. Если в локале генерить на базовом воркфлоу - разница всегда будет принципиальна.
Если запариться и подобрать хорошую методику, то потенциал локалки намного выше, даже без учета NSFW. Но это всегда личное время
Аноним 21/05/26 Чтв 16:04:46 1617003 256
>>1616993
Что бы вас тупорылых вахтеров триггерить очевидно
Аноним 21/05/26 Чтв 16:07:02 1617004 257
image.jpeg 32Кб, 600x225
600x225
Аноним 21/05/26 Чтв 16:11:46 1617008 258
>>1617001
> смысл мне хорошее постить
особенно когда у тебя этого нет, а цп запрещено
Аноним 21/05/26 Чтв 16:21:58 1617017 259
.jpg 359Кб, 832x1216
832x1216
>>1617008
Не вынуждай меня постить годноту, снова
Аноним 21/05/26 Чтв 16:35:12 1617028 260
>>1617017
Это не годнота, это 1girl крупным планом в плохом качестве. Сейчас ZIT / Klein такое в один проход с несложного промта рисует. То что ты надрочил там типа РФ декорации - вряд ли чего то стоит.

Плохое качество выражается в:
- Пластиковые глаза при таком размере лица в кадре
- Перекрученный микроконтраст (проблема сэмплера/скедьюлера) в итоге картинка даже на phone casual shot не похожа и не приятна визуально
Аноним 21/05/26 Чтв 17:10:35 1617054 261
>>1617001
сабтлшейдер заебал сделай нормальный датасет вместо женерика
Аноним 21/05/26 Чтв 19:36:23 1617146 262
.png 72Кб, 226x213
226x213
Аноним 21/05/26 Чтв 19:39:34 1617149 263
>>1617017
Опять свою чувырлу страшную с раком рожи высрал. Высри уже чёнить поновее, от старых уже блевать не тянет.
Аноним 21/05/26 Чтв 19:43:28 1617155 264
>>1617149
Ну хз, я сам до сих пор блюю. Ты какой-то иммунный
Аноним 21/05/26 Чтв 19:44:03 1617158 265
image.png 38Кб, 445x462
445x462
Как в клейне с SamplerCustomAdvance добавить контроль Denoise который есть в KSampler?
И какие еще можно штуки прикрутить и ковырять, что бы менять поведение в i2i режиме в частности?
Аноним 21/05/26 Чтв 19:46:00 1617160 266
>>1617146
я не по цыганкам

можешь сгенерить кадр из фильма "Цыгане танчат под техницо"?
Аноним 21/05/26 Чтв 20:04:25 1617171 267
>Имеет роботизированные протезы лапы и ног
Этот больной человек ещё со времён сд1.5 уже сколько лет тащится по протезам и апмутациям. Не потакайте его шизе. Всю тему запакостили с его подачи.
Аноним 21/05/26 Чтв 20:14:23 1617183 268
>>1617171
я не он

> всю тему запакостили с его подачи.
Ты про тред? Было бы что пакостить, тред мертвый почти. У кого нездоровье, так это у тебя с твоей тряской о треде по лично твоим, выдуманным критериям и стандартам. Причем уверен ты большую часть времени воняешь, сам нихуя не выкладываешь, но очень переживаешь за то, что кому то что то нравится, что тебе не нравится
Аноним 21/05/26 Чтв 20:30:33 1617200 269
555.mp4 480Кб, 512x512, 00:00:03
512x512
>>1617171
Это я, а не он.

>>1617183
>я не он
Все норм, не обращай внимания, этот шиз тут с 21го горит. Человек безкультурный он, обычный кривозубый крестьянин.
Аноним 21/05/26 Чтв 20:59:14 1617217 270
А клейн edit то похоже с 4mpx входящей картинкой в 4mpx почти перестает слушать промт.
Аноним 21/05/26 Чтв 21:12:46 1617230 271
>>1617217
Знаешь что такое вае и как оно работает?
Аноним 21/05/26 Чтв 22:32:57 1617276 272
>>1617230
поверхностно, с тупыми абстракциями
я не ебу в математику и как выглядит латентное пространство, что из него можно достать сверхточные детали для 4mpx картинки
Аноним 21/05/26 Чтв 23:24:28 1617305 273
RES4LYFSigmas.png 637Кб, 2977x1361
2977x1361
>>1617158
Забудь про denoise. Это искусственный конструкт для KSampler и упрощения понимания schedule удаления шума по шагам.
Вникай в sigmas и осваивай custom sigmas.

>И какие еще можно штуки прикрутить и ковырять, что бы менять поведение в i2i режиме в частности?
Какого результата ты хочешь добиться конкретно?
Аноним 21/05/26 Чтв 23:35:28 1617311 274
>>1617217

Я опытным путём пришёл к тому, что reference image стоит делать несколько меньше 4 Мп. 4 Мп это заявленное маркетинговое значение:
https://docs.bfl.ai/flux_2/flux2_image_editing
и подаётся оно:
>…with advanced controls and up to 4MP output
Что такое «up to» в маркетинговых терминах всем известно.
Аноним 21/05/26 Чтв 23:51:51 1617325 275
11.png 8037Кб, 2048x3072
2048x3072
>>1617305
Ответил так, что лучше бы не отвечал. Просто пусть использует SplitSigmasDenoise, нижние сигмы. Правда, шаги будут тоже сплиттиться, хз как сделать, чтобы интерполировать нижние сигмы под нужное количество шагов (есть customsigmas от киджая, но там на вход строку надо)
Аноним 22/05/26 Птн 00:00:13 1617331 276
>>1617325
>Ответил так, что лучше бы не отвечал.
Это как нельзя лучше характеризует твой пост (и подобные ему).
Куда ты лезешь как затычка в каждую бочку? Каждый раз!
Если он ответит, то поговорю с ним предметно.

>хз как сделать, чтобы интерполировать нижние сигмы под нужное количество шагов
Есть ExtendIntermediateSigmas.
А ещё есть Sigmas Rescale и Sigmas Resample.
Аноним 22/05/26 Птн 00:10:03 1617332 277
>>1617331
Так он тебе не ответит, чую в нем залетуху. А про эти ноды не знал, надо попробовать.
А вообще комбинаций семплеров/шедулеров/шума/... не счесть, я хз вообще зачем в это упарываться. Все равно все не попробуешь, всегда будет казаться, что идеальный еще впереди. Эйлер симпл наше все, ну и бета57.
Аноним 22/05/26 Птн 00:24:59 1617348 278
FLUX2dk00032.png 3384Кб, 1920x1088
1920x1088
>>1616864
>унылый бедный слоп
Пусть будет комичный слоп.
Аноним 22/05/26 Птн 00:45:08 1617360 279
>>1613048 (OP)
Шота я не зрозумию.
В комфи выбираю произвольный темплейт текст_то_имейдж, жму в менеджере install missing custom nodes и он нихуя не находит, в ручную если переписываю тоже ничего не находит.
ЧЯДНТ? Помогите ньюфажке.
Аноним 22/05/26 Птн 00:46:04 1617362 280
Ну и посоветуйте, по-братски, текст то имейдж для ньюфага.
С 16врам и 64озу.
Аноним 22/05/26 Птн 00:50:19 1617366 281
>>1617362
Очевидные Z-Image-Turbo и FLUX.2 [klein] 9B.
Default workflows есть в Templates ComfyUI.

>>1617360
>В комфи выбираю произвольный темплейт текст_то_имейдж
В Templates, как правило, стараются на базовых узлах всё делать, с минимальным количеством custom nodes.

Кидай скрины, нужна конкретика.

В целом, там обычно в workflow есть узел Note (или Markdown note) в котором написано что нужно скачать и в какие папки положить (особенно актуально для portable ComfyUI).
Аноним 22/05/26 Птн 01:23:51 1617383 282
1779400968576-0[...].png 1462Кб, 768x1376
768x1376
1779401085369-0[...].png 2057Кб, 1024x1536
1024x1536
ComfyUI00357.png 1176Кб, 752x1392
752x1392
банан - гопота - дефолтный qwen на локалке
Аноним 22/05/26 Птн 07:23:37 1617442 283
>>1617158
Никак, гы-гы-гы....)
Там даже нет крутилки между следованием референсу и собственной (больной) фантазией, это даже не денойз в привычном понимании, а скорее ослабление влияния референса. Ты типа должен вместо этого промтом влиять на степень следования. Более ебанутой конструкции придумать трудно. Ловить блох через сигмы, как предлагает любитель сигм здесь: >>1617305 - путь в никуда, поиск философского камня на ощупь в коробке со старыми носками.
Аноним 22/05/26 Птн 07:54:59 1617449 284
>>1617305
> Какого результата ты хочешь добиться конкретно?
Хотел регулировать влияние референс картинки.
Клейн в ряде кейсов игнорит промт либо задевает лишнюю часть.
Например не меняет фон по описанию в большинстве сидов, либо меняет фон с частью среднего плана.
Судя по тому, что меняя следование референсу это будет действовать глобально и появятся другие проблемы - это вряд ли будет решением. Но я все же хотел попробовать и посмотреть можно ли это хоть как то использовать.
Аноним 22/05/26 Птн 08:56:54 1617469 285
image 185Кб, 852x286
852x286
Аноним 22/05/26 Птн 09:11:50 1617472 286
>>1617469
segment anything + контролнет уже 3 года существует, ещё до эдит моделей можно было словами указывать что менять.
а тут какая киллер фича?
Аноним 22/05/26 Птн 09:41:10 1617493 287
Аноним 22/05/26 Птн 09:45:21 1617495 288
>>1617383
>дефолтный qwen
Кокой смысол в 2026 катать qwen1 на локалке, когда локальный кляйн его ебёт и онлайновый qwen2 так же ебёт?
Аноним 22/05/26 Птн 09:56:44 1617503 289
Дожили блять, уже комфи не могу без впн обновить, пидарасы
Аноним 22/05/26 Птн 10:11:57 1617510 290
>>1617469
> а тут какая киллер фича?
Как во флаксе стабильно инпайнтить выбранную область без еботы? Я вот так и не нашел рабочий воркфлоу, только абстрактные советы которые не понятно как делать, в перемешку с "в клейне инпейт не работает, забей"

Там так же написано:
> ComfyUI's standard "fix the bad hand" workflow is: generate, save the image, open MaskEditor, paint a mask, route the mask + image + a new sampler config back into the graph, re-queue. It works but it's friction-heavy.
То есть допустим даже если метод на клейне есть - он муторный, а здесь вроде как быстрее можно это делать, почти на лету.
Аноним 22/05/26 Птн 10:42:57 1617522 291
image.png 17Кб, 478x197
478x197
Что это за хуета происходит каждый раз и длится всегда долго?
Что с этим делать?
Аноним 22/05/26 Птн 10:58:18 1617523 292
>>1617449
Понял тебя.
Скорее всего у тебя с этим ничего не получится.
Тем не менее, можешь попробовать вот это:

https://github.com/xmarre/ComfyUI-Flux2Klein-Conditioning-Toolkit

https://github.com/capitan01R/ComfyUI-Flux2Klein-Enhancer

Тот, который ниже (вторая ссылка) был первым по времени выхода и там принцип действия описан. Прочитать лучше readme от него. А ставить тот, который в первой ссылке.
Аноним 22/05/26 Птн 11:06:14 1617526 293
Аноним 22/05/26 Птн 11:08:34 1617528 294
>>1617510
Если речь про замену части изображения на FLUX.2, то вопрос решается использованием:

https://github.com/lquesada/ComfyUI-Inpaint-CropAndStitch

С помощью этого узла получаешь укрупнённый фрагмент в котором делаешь Edit на FLUX.2 [klein] твоим обычным workflow.

Потом это фрагмент будет вклеен обратно. Может потребоваться незначительная коррекция цвета для совпадения с исходником, это делается добавлением ещё пары узлов вроде https://github.com/lucasgattas/ComfyUI-Egregora-Adaptive-Colorfix
Вклеивает хорошо, без швов, если настроишь правильно размытие маски. Читай readme и смотри примеры.
Аноним 22/05/26 Птн 11:11:43 1617529 295
>>1617522
Ничего.
Тем более это происходит в фоновом режиме и на использование ComfyUI напрямую не влияет.
Дожидаться до конца необязательно.
Если обновляешь узлы, то ComfyUI-Manager ещё раз принудительно подтянет, если нужно.
Аноним 22/05/26 Птн 11:12:53 1617530 296
>>1617469
Еще не пробовал, но смущает то, что там скедьюлер не подключить, и flux 2 scheduler не выбрать например, и не подкорректировать ничего, power sigma не подключить никак.
Делают для флакса, и игнорят flux 2 sched, непонятные блять.
Аноним 22/05/26 Птн 12:20:35 1617570 297
Посидел в комфи, вышел. Ничего не сохранял, не свопал, но минус 5 гигов на диске. Кайф
Аноним 22/05/26 Птн 14:31:16 1617659 298
>>1617469
по описанию выглядит как имба, на деле автор забыл бубен положить к клейну
Аноним 22/05/26 Птн 15:11:09 1617689 299
>>1617659
Кстати заметил хуйню, на civitai до сих пор какие-то шизы тренят лора для каллюстриус и какие-то там сдохли, нахуя и для кого не ясно. Многие застряли в прошлом
Аноним 22/05/26 Птн 15:13:23 1617690 300
Аноним 22/05/26 Птн 15:45:28 1617714 301
f2e3d87f-38f3-4[...].jpeg 506Кб, 768x1024
768x1024
По какому принципу, ебанутые с цивиты разделяют модели на блу и ред? Раньше на ред были только порнушные модели, теперь там всякая хуйня лежит: картины пикассо, вязаные игрушки, реалистик природа... Рисование цветными карандашами, с какого-то хуя, лежит на ред. На блу - такой лоры нет.
Аноним 22/05/26 Птн 16:19:56 1617733 302
>>1617230
в 1мп > 1мп ничего не мешает работать
1mp > 4mp так же вполне работает

что мешает работать 4мп > 4мп?
Аноним 22/05/26 Птн 17:05:15 1617764 303
Аноним 22/05/26 Птн 17:06:23 1617768 304
Аноним 22/05/26 Птн 17:12:11 1617777 305
>>1617366
Просто я не понмаю зачем мне нужен менеджер, если они нихера не работает и мне все нужно делать вручную.
Аноним 22/05/26 Птн 17:23:57 1617790 306
>>1617714
блу ж прибили.
Теперь есть базовый .com - без порнухи.
И .red - с порнухой.
Процесс миграции еще продолжается, скорее всего.
А может там в превьюхах сильно много 18+ накидали.
Аноним 22/05/26 Птн 18:58:01 1617887 307
>>1617325
покажи свой воркфлоу для чманимы
Аноним 22/05/26 Птн 20:44:33 1617950 308
anima1.02026052[...].jpg 248Кб, 1280x1600
1280x1600
Аноним 22/05/26 Птн 20:55:27 1617958 309
.png 81Кб, 270x232
270x232
Аноним 22/05/26 Птн 21:09:32 1617967 310
anima1.02026052[...].png 2156Кб, 1536x800
1536x800
Аноним 22/05/26 Птн 22:16:57 1618004 311
ComfyUItempeopn[...].png 4073Кб, 1936x1072
1936x1072
>>1617230
>>1617311
>>1617305
>>1617442
>>1617523
>>1617526
>>1617528
Вот эта штука >>1617469, хоть и в некоторых решениях ебланская, но реально РАБОТАЕТ с klein edit 4mpx > 4mpx.
Выделяешь маску, хоть весь бэкграунд, и едит промт с клипа его рефайнит, либо перегенрирует. Причем слитность превосходная, с лорами от референса вообще с цветами проблем нет, переход безшовный.
Там буквально есть КРУТИЛКА силы reference image: Denoise. Выше 0.5-0.6 может генерить подобное но другое, 0.5 и ниже близко к референсу рефайнит.

Рефайнит норм, свободные руки может пофиксить. Holding hands и хваты на клейне - нет, если вы не хотите ролить 6 часов.
Аноним 22/05/26 Птн 22:34:44 1618018 312
ComfyUI02479.png 1315Кб, 1344x768
1344x768
>>1618004
> Holding hands и хваты на клейне - нет, если вы не хотите ролить 6 часов.
Хуйня это, значит. Нахуй её рекламить?
Аноним 22/05/26 Птн 22:42:51 1618030 313
ComfyUItempjprt[...].png 4201Кб, 1920x1072
1920x1072
>>1618018
> Хуйня это, значит
Судя по всему это именно клейн хуйня, который не может в руки. Он точно так же и в t2i работает.
У тебя нет решения лучше. Или есть? Фикси holding hands за полчаса тогда в норм качестве.

> Нахуй её рекламить?
Потому что одной нодой+воркфлоу завозит работающий edit с маской. Это лучше чем абстрактные советы, которые не все понятно как создать, и не факт что это даже работает.
Аноним 22/05/26 Птн 22:57:49 1618037 314
>>1618030
тебе даже гопатыч и гельминт не помогли, пиздец лох
Аноним 22/05/26 Птн 23:00:18 1618039 315
>>1618037
Я не юзаю гпт в локальных генерациях, не интересно
Гемини вообще хуже локалки выдает штуки
Аноним 22/05/26 Птн 23:35:35 1618065 316
>>1617777
>зачем мне нужен менеджер
Чтобы упростить процесс отслеживания и установки обновлений custom nodes в ComfyUI.
>все нужно делать вручную
На portable ComfyUI файлы моделей, text encoders, vae, LoRAs и прочая лабуда скачиваются и раскладываются по соответствующим папкам вручную.
Кто-то переделал Z-Image, теперь уже БЕЗ VAE Аноним 23/05/26 Суб 07:43:13 1618182 317
image.png 948Кб, 1024x1024
1024x1024
image.png 770Кб, 1024x1024
1024x1024
image.png 1615Кб, 1390x1396
1390x1396
image.png 423Кб, 1024x1024
1024x1024
Аноним 23/05/26 Суб 09:20:13 1618218 318
Почему же не запилили поддержу инт8 в комфи? Ведь это геймченджер прорыв в индустрии, тупо всё на нём должно рождаться же говорили они
Аноним 23/05/26 Суб 10:14:45 1618234 319
Теперь версии Комфу нумеруются вот так?
хх.0 - Бета
хх.1 - Норма
хх.2 - Стабильность
23/05/26 Суб 10:39:06 1618239 320
>>1618004
Вопрос, почему в генерации по большой маске в ширину в 2-4мпх генерит много грязного шума.
23/05/26 Суб 11:29:56 1618261 321
image.png 189Кб, 1416x762
1416x762
Ебучие татарские переименованные ноды неизвестного происхождения прикладывают на хагинге к лорам. Узкоглазые вредины
Аноним 23/05/26 Суб 12:12:39 1618271 322
image.png 58Кб, 290x174
290x174
Аноним 23/05/26 Суб 12:14:46 1618273 323
image.png 2Кб, 50x50
50x50
>>1617360
>В комфи выбираю произвольный темплейт текст_то_имейдж, жму в менеджере install missing custom nodes и он нихуя не находит, в ручную если переписываю тоже ничего не находит.
>ЧЯДНТ? Помогите ньюфажке.
Пойти на гит, скачать джонсоны, и всунуть руками, даун.
Аноним 23/05/26 Суб 12:17:50 1618276 324
>>1617950
>там рефайн зиткой
У меня есть обе. Это что тупо прогон через две модели?
Аноним 23/05/26 Суб 12:30:56 1618289 325
>>1617360
В начале обычно так и бывает. Система такая - это факт (уебищная, не до конца user-friendly), автоматика настроена только на более низком уровне, обновление комфи и его компонентов и стабилизация совместимостей. В воркфлоу такого нет, но это всё бесплатное ПО и работает относительно стабильно. Нужно искать вручную.

Гугли напрямую comfy ui + название ноды, часто гугл находит ПАКЕТ нод, в котором конкретная нода находится. Название пакета нод как правило находится в Manager- после установки пакета и ребута ноды подтягиваются.

Это работает в 95% случаев. Но в редких случаях может быть неизвестного происхождения нода, которую искать выкапывать будет сложнее, но тебя это может не коснуться.
Удачи
Аноним 23/05/26 Суб 13:10:46 1618308 326
>>1618218
Объясните что там за пляски вокруг int8? Вообще нагуглить не могу. Чем это отличается от q8_0? Это очередной нескучный квантователь типа нунчаки, который ёбко квантовать и ёбко инференсить?
Аноним 23/05/26 Суб 13:17:50 1618313 327
>>1618239
Вопрос можешь адресовать к автору узла для edit-inpaint, который ты используешь.
Не видя артефактов сложно сказать что-то конркетное.
В целом, чем выше разрешение и больше мелких деталей, тем больше они пострадают.
Аноним 23/05/26 Суб 13:23:27 1618317 328
>>1618182
Неправильные китайцы какие-то.
Аниму пусть переделают.
Аноним 23/05/26 Суб 13:46:11 1618321 329
>>1618308
Вкратце:
https://github.com/BobJohnson24/ComfyUI-INT8-Fast
Надежда 2000-й серии видеокарт. Мол, они ещё ого-го. Победитель в точности по циферкам и в скорости генерацим (на старых картах).
По сути gimmick и snake oil, который нормально работает только в красноглазой версии triton и нативно в ComfyUI не добавлен.
В целом повторяет христоматийную историю очередного «геймчейнджера», который толком не помогает и забывается на следующий день после релиза.
Аноним 23/05/26 Суб 13:54:23 1618324 330
изображение.png 518Кб, 1280x720
1280x720
>>1618321
> Победитель в точности по циферкам
>¹Z-Image Base weights have been Deprecated in favor of Convrot OTF, which is higher quality.
>²Tensorwise models are worse than on the fly quantization since we switched to row-wise INT8
Спасибо большое за объяснение, подожду пока кто-то большой это запилит
Аноним 23/05/26 Суб 14:06:16 1618330 331
>>1618308
> Чем это отличается от q8_0?
Быстрее чем FP8 работает, и по синтетическим тестам точнее чем q8. Но реальное качество на уровне изображения никто не может подтвердить или опровергнуть, т.к. различия на уровне погрешности сида.
Но к этому подключается непонятный мутный гемор с лорами.
Мне не удалось получить выгоду по скорости против клейна mxfp8 у меня не получилось, но мб я перегнал как то некорректно bf16 модель
Аноним 23/05/26 Суб 15:00:16 1618364 332
>>1618182
где сейфтензор одним куском и вф к нему?
Аноним 23/05/26 Суб 15:37:50 1618379 333
изображение.png 1217Кб, 1024x1024
1024x1024
изображение.png 1464Кб, 1024x1024
1024x1024
изображение.png 890Кб, 1024x1024
1024x1024
изображение.png 749Кб, 1024x1024
1024x1024
Аноним 23/05/26 Суб 16:56:42 1618419 334
>>1618379
Почему л2п хуже ванилы? Ах ну да, китайцы курсовые пишут, снова
Аноним 23/05/26 Суб 18:01:25 1618448 335
>>1618379
а нахуя вообще пиксельные нужны*
Аноним 23/05/26 Суб 18:19:19 1618453 336
Здравствуйте товарищи. Встал такой вопрос. Когда то на заре нейронок генерил в автоматике еще на 1.5 модели, потом забросил, вроде как слышал что AMD что-то там оптимизировали под нейронки чуть чуть. Собственно вопрос rx 6600 xt восьмигиговая на винде что-то еще может или ее участь гонять тухляк 512х512 в деплибирейшоне2
Аноним 23/05/26 Суб 18:54:03 1618473 337
17647610605630.mp4 1723Кб, 1080x1080, 00:00:15
1080x1080
Аноним 23/05/26 Суб 19:44:51 1618504 338
>>1618473
А злуду разве не ебнули из конторы зеленых солнышек? Когда хотел потестить года два назад нигде ничего небыло по ссылкам
Аноним 23/05/26 Суб 19:47:59 1618505 339
>>1618473
Амуз вообще как будто бы чисто по рофлу сделали без поддержки половины xl моделей (по крайней мере раньше так было).
Выходит максимум это перекатываться на линукс и крутить вермишель на xl ках, понял
Аноним 23/05/26 Суб 19:56:57 1618509 340
Аноним 23/05/26 Суб 21:04:19 1618529 341
dwqdwq.jpg 61Кб, 540x368
540x368
IMG202605041040[...].jpg 535Кб, 1216x832
1216x832
В какой нейронке можно сделать так? Как я понял, сделано это было в каком-то онлайн сервисе. Возможно ли подобное делать локально? Хваленные supir и seedvr2 так не делают. В стэйбл дифужок gfpgan неплохо восстанавливал лица, но он сильно ретуширует и работает только с лицом. Сколько не спрашивал - никто не знает.
Аноним 23/05/26 Суб 21:12:35 1618535 342
Аноним 23/05/26 Суб 21:13:16 1618536 343
>>1618529
сделать что долбоёб?
Аноним 23/05/26 Суб 21:35:28 1618546 344
image.png 310Кб, 1477x668
1477x668
Это гениальный китайский замысел или бурят мискликнул?
Пикрил с workflow этой лоры https: / / huggingface.co/dx8152/Flux2-Klein-9B-Consistency
Аноним 23/05/26 Суб 21:39:20 1618554 345
>>1618529
Зависит от твоего железа, видеопамяти. С 16gb изи можешь конвертить как угодно, что угодно в х4 разрешении, с лорами на консист и телефонное качество получаются неотличимые от ИРЛ фотки. Можешь сохранить даже синюшный цвет и смаз движения если постараешься.
Модель flux 2 klein 9b fp8 - потому что проще всего из коробки всё работает почти с 1 строчкой промта.

На 8gb и ниже скорей всего тоже можно, но я не ебу конкретные возможности конфигураций. Подозреваю что хороший результат можно получить даже на 4gb под такую задачу.
Аноним 23/05/26 Суб 22:31:32 1618592 346
image.png 593Кб, 1835x1032
1835x1032
image.png 3632Кб, 1632x1264
1632x1264
image.png 3644Кб, 1632x1264
1632x1264
Против знатоков играет залетуха из урала.
Внимание на экран.

Есть воркфлоу с 2мя казалось бы одинаковыми пайплайнами: пик 1
При генерации они всегда должны выдавать идентичный результат.
Так и происходит, если на вход давать example.png комфи (1024х1024).
Но если подать другое изображение, например 1152x896 (и не только), то изображения отличаются: пик2 и пик3

Внимание вопрос: Почему так нахуй
Аноним 23/05/26 Суб 22:45:37 1618597 347
177956469226302[...].png 523Кб, 1835x1032
1835x1032
Аноним 23/05/26 Суб 23:06:49 1618605 348
>>1618597
блять я сам же это нашел и благополучно забыл изменить у китайца, окей спасибо

не понятно, почему после исправления и запуска - картинка фиксится без генерации за 0.5 сек, но если изменить обратно - то перегенерирует полностью
Аноним 24/05/26 Вск 00:09:07 1618656 349
>>1618448
В теории, чтобы обойтись без latent пространства и VAE.
Только при этом существенно растут требования к объёму памяти.
Аноним 24/05/26 Вск 00:25:11 1618658 350
Flux2-Klein-9b-[...].png 3223Кб, 1536x1536
1536x1536
>>1618529
Конкретно то, что у тебя на пикрил сделает FLUX.2 [klein] 9B в edit режиме с prompt: reconstruct the photo (или подобным Restore and reconstruct photo from image 1. Keep the facial expression. Add "2CH" engraving on the golden tooth. High resolution, fine skin texture details.).
Как на пикриле он потеряет исходное освещение, но навалит псевдореальных деталей.
Аноним 24/05/26 Вск 00:31:20 1618660 351
yuylu93qn3i91.jpg 66Кб, 1024x755
1024x755
>>1618546
В той части, что ты показал, это ошибка. Макаронину из width нужно в width тянуть.
Хотя по пикрил, можно представить, что китаец так sigmas, которые будет выдавать узел Flux2Scheduler специально корёжит, как будто для квадратной генерации.
Ну или Да Винчи style с намеренно перепутанными шестерёнками, ради лулзов (хотя влиять сильно не должно, там минимально sigmas изменятся).
Выбирай любой вариант, который считаешь более правдоподобным.
Аноним 24/05/26 Вск 01:32:13 1618699 352
>>1618453
> вроде как слышал что AMD
Тут я перестал читать.
Аноним 24/05/26 Вск 01:35:11 1618703 353
FLUX2dk00033.png 2222Кб, 1920x1088
1920x1088
Meanwhile.
Аноним 24/05/26 Вск 07:25:15 1618749 354
>>1618261
Когда прям надо название ноды и полей, можно скопировать (ALT+drag) и recreate node или посмотреть инфо справа.
ABS Аноним 24/05/26 Вск 08:03:51 1618755 355
У кого-нибудь получалось в ZIT описать абс? все лоры с мускулатурой для zit - откровенный кал, может где-то и что-то они и добавляют, но обасть живота остаётся нетронутой.
И да, я таки спрашивал у джемини, но то, что он мне надиктовал не работает абсолютно.
Аноним 24/05/26 Вск 08:45:53 1618761 356
>>1618755
Без примеров, что тебе нужно и что получается не понятно о чем ты.
Модель явно умеет рисовать пресс
Аноним 24/05/26 Вск 09:48:42 1618775 357
>>1618699
Ну мы же должны быть толерантны к людям с особенностями
Аноним 24/05/26 Вск 10:29:02 1618792 358
Аноним 24/05/26 Вск 10:33:50 1618795 359
image.gif 14Кб, 220x220
220x220
Интересно, а что если я пожалуюсь на всяких техцыган с бусти хачатура-подобных, которые продают свои паки чужих нод - типа я собрал всё для вас. Это прямое нарушение лицензий этих нод и прочего, где запрещено коммерческое использование и продажа. Надо будет заняться на досуге чисткой.
НАКОНЕЦ-ТО новая моделька не от китайцев Аноним # OP 24/05/26 Вск 10:36:50 1618797 360
image.png 3129Кб, 1248x1664
1248x1664
image.png 3414Кб, 1440x1440
1440x1440
image.png 2931Кб, 1664x1248
1664x1248
image.png 3125Кб, 1248x1664
1248x1664
ЧТОО
Новую опенсурс модель выпустили НЕ КИТАЙЦЫ?

и не кто-то из запада, а даже сами мелкософты выпустили
да еще и в доступном для масс формфакторе 3.2b на 8 ГБ в bf16 (кванты можно ждать сразу на 3-4 гб)
только жаль чистый text2image без эдита

https://huggingface.co/microsoft/Lens
https://huggingface.co/Comfy-Org/Lens
Аноним 24/05/26 Вск 10:43:42 1618804 361
>>1618797
По какой причине они удаляли прошлый репозиторий с ней полгода назад? Провели соефикацию или что?
Аноним 24/05/26 Вск 10:59:50 1618812 362
.png 52Кб, 1113x206
1113x206
>>1618797
> НЕ КИТАЙЦЫ?
Совершенно точно не они. Абсолютно точно.
Аноним 24/05/26 Вск 11:58:02 1618831 363
Аноним 24/05/26 Вск 12:41:04 1618843 364
Аноним 24/05/26 Вск 13:06:46 1618852 365
>>1618831
Дебильнейшая тряска за выдуманный вред в фактически безобидных генераторов картинок.
Полное бессилие в будущем, против реальных угроз от ИИ.
Жалкая мудота, будучи хоть трижды Computer Science и экспертами в любых сферах, остаются жалкой мудатой уровня пятитиклашек. Лицемеры
Аноним 24/05/26 Вск 13:12:38 1618856 366
Не сидел в треде несколько лет. Когда всё начиналось была сборка SD портабельная от ХАЧАТУРЯНА, когда ставил туда расширения, плагины и всякую хуйню малафью, она не ебла и не мусорила на системный диск, а ставила всё это в свою папку.

Сейчас хач забил на это дело, есть ли что-то подобное современное от других авторов?
Аноним 24/05/26 Вск 13:23:35 1618865 367
>>1618856
comfy ui portable не мусорит и даже питон там портабл
Аноним 24/05/26 Вск 13:55:30 1618878 368
.webm 8986Кб, 848x432, 00:00:33
848x432
Аноним 24/05/26 Вск 14:06:03 1618887 369
anima1.02026052[...].jpg 384Кб, 1280x1600
1280x1600
Аноним 24/05/26 Вск 14:15:41 1618892 370
посоветуйте сетап клейна 9b / зита, в которой разлочена гурятина,
т.е. что бы мог рисовать биологические повреждения, внутренности, разрушения, мб болезненные состояния,
есть flux2-klein-9b-uncensored-q8_0.gguf, но он вроде как ни на что не влияет, но ллм не должна блочить описание точно

накрайняк другие модели могу рассмотреть, но если это какие то сдохли - то надо воркфлоу+набор лор понимать, т.к. не застал её вообще,
Аноним 24/05/26 Вск 14:45:13 1618911 371
anima1.02026052[...].jpg 446Кб, 1280x1600
1280x1600
>>1618892
гурятину можно только в noobai/illustrious, дальше уже кляйном эдить или наоборот базу картинки в кляйне а потом с контролнетами инпаинть в нубае/люстре
Аноним 24/05/26 Вск 14:47:26 1618912 372
>>1618911
почему так
а в пони?
Аноним 24/05/26 Вск 14:55:07 1618916 373
>>1618892
Кляйн и зит турбо в это не могут - ключевое слово не могут, а не не хотят, так же как ты не можешь видеть ультрафиолет.
Кляйн base и зит не турбо в принципе могли бы, если долго танцевать с бубном.
А для того, чтобы получить гуро наверняка, нужно, как анон уже отметил, смотреть в сторону специально заточенных на это решений.
Аноним 24/05/26 Вск 14:58:16 1618918 374
anima1.02026052[...].jpg 223Кб, 1280x1600
1280x1600
Аноним 24/05/26 Вск 15:03:42 1618921 375
>>1618892
noobai vpred гугли там пиздец полный
Аноним 24/05/26 Вск 15:09:26 1618927 376
>>1618911
>гурятину можно только
Не только. В аниме можно.
Я бы скинул примеры, но тут забанят.
Аноним 24/05/26 Вск 15:11:29 1618928 377
>>1618911
В смысле, анима может в гуряниту.
Если конечно не нужно разрезание вдоль, и детальные внутренности.
Аноним 24/05/26 Вск 15:29:20 1618938 378
В связи с тем, что вопрос с платным иностранным трафиком и впн, практически решен, как считаете нужно уже сейчас трястись и скачивать все необходимое. Или подождать осени и скачивать уже платно?
Аноним 24/05/26 Вск 15:35:00 1618942 379
>>1618921
мне аниме не надо, vPred без конкретики ничего не ищет
пока что хуету советуешь
Аноним 24/05/26 Вск 15:35:59 1618943 380
Аноним 24/05/26 Вск 15:36:27 1618944 381
>>1618942
>>1618921
конкретные файнтюн лоры есть, которые могут рисовать гору хотя бы даже в детальном арт стиле?
Аноним 24/05/26 Вск 16:08:21 1618961 382
>>1618938
Зачем дожидаться?
Всё, что тебе реально необходимо уже давно должно быть скачано и сохранено. В идеале, ещё подогнано и протестировано для изолированной автономной работы без необходимости в обновлениях и доступе в интернет.
С другой стороны, если что-то нужно для работы, это найдут и оплатят. В зависимости от того, кто является работодателем, конечно, и, как следствие, его возможностями взаимодействия с госмашиной.
А для праздного баловства скорее всего станет недоступным и об этом можно будет тихо вполголоса побухтеть на кухне.
Заниматься чем-то серьёзно целесообразно там, где есть для этого условия. А превозмогать и залезать к себе домой через форточку, удел тех у кого много лишних сил и здоровья.
Аноним 24/05/26 Вск 16:35:19 1618979 383
>>1618273
Чо рвешься, греча? Вопрос состоял в необходимости менеджера, который основную свою функцию не выполняет.
Аноним 24/05/26 Вск 16:38:38 1618982 384
>>1618797
Погонял. В генерации картинок в чём-то лучше клейна и зетки, но в целом такой же мусор как они. Хотя бы не эти хайдримы и эри которые вообще кал кала, тут модель хотя бы что-то может.
Аноним 24/05/26 Вск 17:19:32 1619007 385
>>1618982
жаль что на imageboard под названием 2ch нет функции выгрузки картинок, очень жаль
Аноним 24/05/26 Вск 17:27:54 1619011 386
>>1619007
Картинками я это назвать не могу, дерьмо-слоп, такой же как делает клейн/зет, в целом хуже, но местами где-то лучше. Такое после анимы/гпт2 загружать стыдно.
Аноним 24/05/26 Вск 17:33:55 1619013 387
>>1619011
Я вижу ты прошареный, что думаешь про кляйн и зит в сравнении? А то ты ни слова о них
Аноним 24/05/26 Вск 17:45:02 1619018 388
>>1619011
> загружать стыдно.
если дело только в текстурках и реализме то это отчасти вторично, если креативность хорошая, то можно юзать как и аниму
Аноним 24/05/26 Вск 17:49:02 1619022 389
>>1619018
Все под креативностью разное подразумевают. Кинь промпт или промпты, прогоню их.
Аноним 24/05/26 Вск 17:52:30 1619026 390
Аноним 24/05/26 Вск 18:06:18 1619031 391
Standart.png 1540Кб, 896x1440
896x1440
Turbo.png 1444Кб, 896x1440
896x1440
>>1619026
Оно не может в nsfw. Только кое-как в голые телеса.
Аноним 24/05/26 Вск 18:08:43 1619036 392
anima1.02026052[...].jpg 224Кб, 768x1280
768x1280
anima1.02026052[...].jpg 207Кб, 768x1280
768x1280
764097097108350[...].mp4 353Кб, 576x576, 00:00:28
576x576
>>1619011
> загружать стыдно
понятное дело что любой хуйнёй вайпить не надо, но это тоже выливается в другую крайность, что все пики должны быть ультрапиздатыми иначе лох. такие завышенные требования к себе и окружающим и породило текущее состояние треда, где генерируется в основном текст и тухлые байты от одного семёна.

короче сами себя загнобили
не надо так

надо вот так
я запостил свой слоп с пальцами клубком и чиркашом на жопе и мне не стыдно
Аноним 24/05/26 Вск 18:26:27 1619045 393
>>1619036
К сожалению за 5 лет локальные модели по реализму никуда не уехали от идеально черрипикнутой картинки с сд1.5, в отличии от аниме моделек. Поэтому я даже не стараюсь над пикчами. Качаю, прогоняю свои тесты, удаляю. А постить хочется хоть что-то адекватное.

С анимой же наоборот, беру заготовленную мною базу промпта, пишу туда любой бред и она выдаёт часто даже с 1 прогона то что не стыдно постить и на всякие бору.

Это скорее проблема направленности треда на реализм, чем загноблённости. Реализм пока это очень тяжело для локалок.
Аноним 24/05/26 Вск 18:41:53 1619060 394
>>1618938
Это для мобильного трафика, ты ёбу дал? Никто стационарный не будет ограничивать
Аноним 24/05/26 Вск 18:44:51 1619062 395
>>1613048 (OP)
Дайте вебмки(сукк помню только вебм вместо гиф появились в 2012/13 на даче))) милой прекрасной волшебной Анны Тейлор Джойс в русском быту

А Самара Уивинг и Софи Тэтчер есть?
А 180 см ада вонг в колготках в сетку и обтягивающем платье водолазке?
Аноним 24/05/26 Вск 18:54:04 1619068 396
>>1618321
>Надежда 2000-й
И 3000-й. Причем более новые может и не выиграют много в скорости, но выиграют в качестве.
>По сути gimmick и snake oil, который нормально работает только в красноглазой версии triton и нативно в ComfyUI не добавлен.
Сколько fabrics, сколько details. Я не удивлен, что в очередной раз у спермоглотов что-то не работает.

>>1618330
>непонятный мутный гемор с лорами.
Какой гемор, о чем ты? С нативными лоадерами все работает.

>>1618324
Ты хоть понял, о чем там речь идет, прежде чем гринтекстом срать?

Пиздец, тред ин эн натшелл. Не осилили запустить на спермосистеме - значит говно и нинужно.
Аноним 24/05/26 Вск 19:07:11 1619075 397
>>1619022
промт под каждую модель нужно индивидуально подбирать, мб адаптировать,
при этом, судя по тому, как работает анима - не обязательно выдрачивать детали сцены настолько, что бы получить хорошую интеракцию, сцену, композицию

адаптируй это как хочешь и пороль че даст
cinematic detective scene in a futuristic city at night. A serious and intelligent dog detective with a robotic prosthetic paw and digitigrade legs interacts with a beautiful anthropomorphic female dog police officer looking at the detective with pleasure. All creatures has digitigrade legs. A small anthropomorphic animal corpse with bloody injuries lies in a natural, lifeless posture on wet pavement and has a bedraggled, lifeless appearance, surrounded by a pool of blood. Yellow crime scene tape is strung in the air around the perimeter, enclosing the corpse and small clues like a broken device, footprints, and a dropped object. Heavy rain falls through the scene, creating sharp reflections on the asphalt, while red and blue police lights glow softly through the rain. A crowd of anthropomorphic animals gathers around. The background features a dense array of diverse, gargantuan futuristic buildings. Cinematic composition, dark environment with focused light, volumetric lighting, rain particles, detailed textures, moody atmosphere, cinematic color grading.
Аноним 24/05/26 Вск 19:08:14 1619079 398
>>1619068
>Не осилили запустить на спермосистеме - значит говно и нинужно.
В чём твоя проблема красноглазик? На винде с тритоном оно запускается, качество там такое же как и в фп8скейледмиксед, по скорости проигрывает тензоррт. Нахуя оно нужно с кривым кодом по умолчанию?
Аноним 24/05/26 Вск 19:18:07 1619091 399
>>1619079
>по метрикам качество лучше
>я скозал не лучше
Аноним 24/05/26 Вск 19:22:28 1619097 400
>>1618797
> в доступном для масс формфакторе 3.2b на 8 ГБ в bf16
> gpt-oss:20b как текст энкодер
Охуеть доступности навалили
Аноним 24/05/26 Вск 19:45:57 1619110 401
Standart1.png 3469Кб, 2887x1800
2887x1800
Standart2.png 3452Кб, 2887x1800
2887x1800
Turbo1.png 3419Кб, 2887x1800
2887x1800
Turbo2.png 3399Кб, 2887x1800
2887x1800
>>1619075
У меня подход простой, модель либо работает либо не работает. Их сейчас всех дрочат на натуральный язык. Если не понимает=модель тупица. (Анима это комьюнити тюн, а не релиз корпоратов, поэтому там подход другой)
Аноним 24/05/26 Вск 20:15:14 1619118 402
>>1619060
>Никто стационарный не будет ограничивать
От авторов «никто YouTube блокировать не будет» и подобного.
Плавали, знаем. На стационарном домашнем интернете и так половина зарубежной сети недоступна нормально уже сейчас (даже статьи с medium.com, гайды от BFL). Некоторые даже здесь на hugging face бочку катили, что ничего выгрузить не могут, а проблема была на их стороне.
Кончится всё MITM росгоссертификатом в браузере ЧМакс и белыми списками. (И не только у нас).
Anyway, запас карман не тянет. Будет работать — хорошо. Очебурнетят окончательно, всё нужное сохранено.
Аноним 24/05/26 Вск 20:52:47 1619136 403
zit (30).png 1064Кб, 1024x1024
1024x1024
anima1.02026052[...].png 1021Кб, 768x1280
768x1280
в итоге банят и за порнуху и за гурятину, такие дела
Аноним 24/05/26 Вск 22:41:00 1619166 404
172.png 4028Кб, 1536x2560
1536x2560
Аноним 25/05/26 Пнд 00:24:15 1619227 405
image.png 1283Кб, 827x828
827x828
БУ! испугался?)
Аноним 25/05/26 Пнд 01:12:58 1619245 406
>>1618938
>нужно уже сейчас трястись и скачивать все необходимое
>>1619118
>запас карман не тянет.

Запас, извиняюсь, чего? Ежедневно устаревающего кала, на который ты через месяц без рвотных позывов смотреть не будешь? Каждый раз в голос с ебанутых хордеров. Отрежут тебе кабель или нет - у всех этих чмоделей (ну у 99% точно) ценность нулевая.
Аноним 25/05/26 Пнд 01:14:46 1619246 407
>>1619110
>Если не понимает=модель тупица. (Анима это комьюнити тюн, а не релиз корпоратов
Так по факту анима как раз и не понимает. Я радостный думал щас начну ей писать, а она по большей части только теги жует.
Аноним 25/05/26 Пнд 01:38:02 1619249 408
Аноним 25/05/26 Пнд 01:49:42 1619253 409
>>1619245
Скажу так.
Для локальной генерации у меня есть:
Изображения: FLUX.2 [dev]/FLUX.2[klein] 9B, Z-Image-Turbo (которой не пользуюсь);
Видео: LTX 2.3;
Аудио: Ace-Step-1.5, MMaudio.

Чего там у тебя ежедневно устаревает, не знаю. На текущий момент из доступного, вполне неплохо для баловства и экспериментов.

>на который ты через месяц без рвотных позывов смотреть не будешь
При определённых обстоятельствах других доступных моделей уже может больше и не быть. Будешь в Алисе AI дегенерировать.
Аноним 25/05/26 Пнд 02:30:25 1619266 410
FLUX2dk00033.png 2901Кб, 1920x1088
1920x1088
>>1619068
>Я не удивлен, что в очередной раз у спермоглотов что-то не работает.

А я не удивлён типичным поведением юного красноглазого сектанта, который зашёл не по адресу и видимо не в курсе того, что люди владеют одновременно разными ОС, которые используют как инструменты, а не средства дифференциации цвета штанов и стаи.

Тебе >>1619079 совершенно правильно написал. Те, кому было любопытно, всё сами запустили (да-да, и на Windows и на Linux) и проверили результат. Я согласен с его выводами, потому что полученный результат оцениваю визуально по тестовым prompt.
Разница в том, что Аноны здесь всё запустили и сами проверили, пока ты прочитал в readme, что:
>>по метрикам качество лучше
Аноним 25/05/26 Пнд 08:43:03 1619307 411
>>1618938
>нужно уже сейчас трястись и скачивать все необходимое
Нахуй забей. Что надо с DC скачаешь.
мимо_скуфидон_из_доинтернетовой_эпохи
Аноним 25/05/26 Пнд 09:53:51 1619337 412
image.png 3841Кб, 1870x1056
1870x1056
>>1619118
> От авторов «никто YouTube блокировать не будет» и подобного.
Ошибка с аналогией. Youtube - один развлекательный портал.
Интернет - базовая часть современной инфраструктуры во всех сферах жизни. Суть не в том, что блокировка невозможна, а в том, что если именно такого уровня блокировка произойдет, файлики на компьютере будут последним, что тебя будет беспокоить. Станет литерали похуй из за смещения по пирамиде маслоу.
Так что гриндить файлы на харды - это уровень копания частных бункеров в США в период холодной войны второй половины 20го века. Ядерная катастрофа была вполне вероятна, но бункер тебя бы не спас, скорей обрек бы на более мучительную смерть впоследствии.
Аноним 25/05/26 Пнд 10:13:37 1619345 413
ComfyUItempsrmp[...].png 7383Кб, 2048x2048
2048x2048
>>1619045
> К сожалению за 5 лет локальные модели по реализму никуда не уехали от идеально черрипикнутой картинки с сд1.5,
Во первых скорей всего уехали, просто в глаза долбятся.
Во вторых, когда реализм достигнут - ехать уже и не куда. Можно улучшать только креативность, наполнение и детализацию. Реалистичные клейн и зит и в этом отношении скорей всего получше чем СД, рассматривая t2i генерацию. Как минимум в затратах времени для получения того что нужно. Но все они говно в плане плотности деталей и вариативности. Но это проблема не локальной модели, а подхода однопроходной генерации. Она всегда будет калом

> направленности треда на реализм
А она есть? Просто реализм сложен и вместе с тем доставляет. А в не реализме интерес создавать сложнее, он уже требует творческого подхода, а творчество как правило разбивается почти об любую модель, которая не может одновременно и то что ты замыслил и еще и красиво - даже не говоря про реализм. Даже анима, при всех плюсах имеет очень низкую стабильность и контроль, и получить то что нужно и еще и годное достаточно сложно. Но выбора особо нет. Аниму по эстетике кадра текущие реализм модели не догонят принципиально никогда. Я вообще забросил t2i клейна на пару недель, если не надо сгенерить какой-нибудь телефонный слоп неотличимый от реальности.
Аноним 25/05/26 Пнд 10:28:25 1619349 414
>>1619245
>ценность нулевая
Ты не прав. Это инструмент прежде всего. Если модель закрывает текущие потребности, то ее ценность уже не нулевая. Просто если сравнивать условную Сдхл с Зеткой или какой-то другой новой моделью, то конечно все быстро меняется и по сути это устаревший кал. Но когда у тебя будет выбор между платной Алисой или бесплатной Зеткой с коллекцией лор, то выбор будет очевиден.

>>1619337
Китай тебе ни о чем не говорит? Для них даже кастрированные Плейстейшн отдельно выпускаются, хотя казалось бы.
Аноним 25/05/26 Пнд 10:32:35 1619351 415
>>1619253
>Видео: LTX 2.3
Поясни за видео, плиз. Какой стул сейчас актуален? Полгода назад вроде Wan был топчиком.
Аноним 25/05/26 Пнд 10:43:24 1619355 416
Есть у кого воркфлоу для comfyUI чтобы можно было одежду примерять, т.е. фото с человеком, фото с одеждой и человек в одежде как результат. Чтобы было качественно
Аноним 25/05/26 Пнд 10:47:10 1619356 417
>>1619337
Сорт яблок не подскажешь?
Аноним 25/05/26 Пнд 10:52:43 1619357 418
>>1619351
Всё зависит от задач.
Wan никуда не делся и для своих (NSFW) целей годится.
С Wan у меня как-то не задалось (хотя раньше я его low модель для рефайна картинок использовал в связке Qwen-Image to Wan; пока не отказался сначала от Wan, а потом от Qwen-Image).
LTX 2.3 мне удобнее для более быстрых генераций с поддержкой keyframes, да и ещё со звуком и lip-sync практически из коробки.
Качество среднее, возможно даже слабее Wan в чём-то, но поддерджка community в виде LoRAs, и workflows от Rune это нивелируют.
Аноним 25/05/26 Пнд 10:54:42 1619358 419
>>1619355
Бери из Templates для FLUX.2 [klein] 9B. Два референса. Первый — фото модели, второй — фото одежды.
Аноним 25/05/26 Пнд 10:58:59 1619359 420
>>1619356
> Сорт яблок не подскажешь?
Подскажу. Персики
Аноним 25/05/26 Пнд 11:04:25 1619360 421
>>1619358
>Бери из Templates
т.е. из встроенных шаблонов комфи?
Аноним 25/05/26 Пнд 11:11:59 1619361 422
>>1619246
Анима тренировалась на теговую систему данбору. При этом энкодер у неё 0.8b. Ещё бы она понимала натуральный язык. Это файнтюн, а не модель сделанная с нуля.
Аноним 25/05/26 Пнд 11:12:11 1619362 423
>>1619357
>low модель
Это 5В которая? Как она по сравнению с 14В, сильно проигрывает?

>от задач
В основном для оживления картинок. Видео правда долго генерится, по 5-10мин?
Аноним 25/05/26 Пнд 11:22:59 1619367 424
>>1619337
Аналогия точна и говорит лишь о том, что никогда нельзя доверять обещаниям властьимущих кабаньерос о том, что плебсу надо расслабить булки, и это всего лишь «на полшишечки».
Постепенно расширяя окно Овертона добрались до того, что в нулевые было немыслимо, и продолжают это делать дальше.
Речь не идёт про ядерный апокалипсис, а скорее про то, что плебс изолируют в местном аналоге кванмёна, чтобы гопсподам смерды и холопы дорогой международный трафик не жрали, так как арбитраж в долларах не дешёвый, а полстраны теперь через Нидерланды в интернет ходят.
Как в Иране и Северной Корее у властьимущих и подсосов из шлейфа в плане доступа в интернет, да и вообще остальных благ, особо ничего не изменится, благодаря системе номенклатурного спецраспределения на манер совка, а холопам не положено. Для гномиков с галер частично доступ оставят на работе, чтобы они гос-айти поддерживали. Всем остальным — чебурнет и платные местные сервисы (которые будут продавать за деньги то, что раньше было бесплатно, обеспечивая доход нужным кабаньерос).
Но гопсподам, к слову, кроме зарубежных соцсетей для ярмарки тщеславия этот интернет особо и не нужен.
Это всякие гики будут переживать, что остатки их старой жизни рассыпались в прах с отвалом интернета как окна в мир и доступа к актуальной информации и репозиториям. Но, поскольку, их меньшинство и они, в целом, безвредны, то в расчёт то, что они будут на кухне бухтеть никто не берёт.
Именно поэтому какие-то модельки open-source и стоит сохранить локально, если, они, конечно вообще вам нужны.
Аноним 25/05/26 Пнд 11:24:05 1619368 425
>>1619360
Да, из них. Для твоей задачи это самое простое.
Аноним 25/05/26 Пнд 11:34:02 1619372 426
>>1619361
>энкодер у неё 0.8b
0.6 же
Аноним 25/05/26 Пнд 11:35:49 1619373 427
>>1619362
Под low имелись в виду детали, high frequency и low frequency https://share.google/aimode/la5D9fhT4ImgwBrcy Модели wan были разбиты на две. Одна для деталей низкой частоты, другая для высокой. Половина denoise в workflow шла на одной, половина на другой.
Для изображений предлагалось использовать refine с помощью отдельной high frequency (я их путаю) модели, чтобы детали реалистичные дорисовать, так как формат latent Qwen-Image и WAN совместимы.

5-10 минут это не долго. Вот полчаса и дольше, когда модели WAN из маленькой 16 Гбайт VRAM в RAM туда-сюда гоняет для генерации видео на десяток секунд, мне показалось муторнее.
На LTX 2.3 ещё химия с spatial upscaler, который ускоряет процесс.
Аноним 25/05/26 Пнд 12:24:24 1619394 428
>>1619367
Что за шаблон промпта у тебя для ллмки?
>ты опытный харкачер-ыкперд, {user} даёт тебе пост, на который должна ответить
?
Аноним 25/05/26 Пнд 13:30:37 1619415 429
dolboris.png 84Кб, 1152x648
1152x648
ComfyUItempuzre[...].png 6616Кб, 2144x1200
2144x1200
ComfyUItempuzre[...].png 4976Кб, 2144x1200
2144x1200
ваша сдохля так может?
Аноним 25/05/26 Пнд 14:21:26 1619447 430
image.png 30Кб, 951x292
951x292
image.png 105Кб, 666x714
666x714
image.png 2160Кб, 1358x893
1358x893
>>1619415
У тебя там все проебано. Но ничего, Скам тоже обдристался, рисовал говно постить не буду достаточно скрина. Один только гемини молодец. Причем я ему даже не оригинал кинул, а превью.
Аноним 25/05/26 Пнд 14:34:28 1619457 431
image 3094Кб, 1672x941
1672x941
Аноним 25/05/26 Пнд 14:38:02 1619460 432
Аноним 25/05/26 Пнд 15:03:13 1619476 433
>>1619457
у сдохли есть dithering?
Аноним 25/05/26 Пнд 15:07:40 1619480 434
>>1619447
> У тебя там все проебано.
Это вообще вторично для модели без ризонинга, фиксится легко
Аноним 25/05/26 Пнд 15:08:50 1619481 435
изображение.png 329Кб, 640x360
640x360
Аноним 25/05/26 Пнд 15:14:12 1619489 436
Аноним 25/05/26 Пнд 16:20:45 1619538 437
image.png 781Кб, 721x669
721x669
Клейн говно ебучее рэндомное
Аноним 25/05/26 Пнд 16:33:28 1619540 438
Nvidia сделала какую-то крутейшую штуку. Замена мутного, мыльного vae под названием PiD. Pixel diffusion decoder.
Аноним 25/05/26 Пнд 16:56:24 1619557 439
image.png 108Кб, 882x572
882x572
image.png 1678Кб, 1024x1024
1024x1024
Аноним 25/05/26 Пнд 17:29:57 1619574 440
ComfyUI00162.png 2339Кб, 1850x1034
1850x1034
Аноним 25/05/26 Пнд 18:06:31 1619593 441
Аноним 25/05/26 Пнд 18:07:51 1619595 442
Пожалуйста подскажите какую видео модель лучше поставить если меня интересуют фурри нсфв анимации в 2d стиле, делать референсы для 2д анимаций
Аноним 25/05/26 Пнд 18:21:35 1619600 443
Аноним 25/05/26 Пнд 19:12:15 1619616 444
image.png 3021Кб, 1664x928
1664x928
>>1619593
ага как RTX и Physix в свое время
куртка умеет прогреть в свободное от анальной ебли время
Аноним 25/05/26 Пнд 19:36:08 1619624 445
Аноним 25/05/26 Пнд 19:42:22 1619630 446
>>1619593
Не уверен.
В части FLUX.2 [dev] там bullshotы. На указанных шагах результаты будут не такие. На 20 шагах уже будет почти готовое изображение. А там на 36 будто всё развалено ещё.
Про достоверность остального ничего сказать не могу.
Аноним 25/05/26 Пнд 20:05:32 1619641 447
>>1619266
Ебаный твой блядский рот, так хуле ты сам себе противоречишь, используя спермоподелие не по назначению? Пиздец, некоторые настолько потужно стараются выглядеть умными, но за умными словами скрывается пук в лужу.
>по тестовым prompt
Как погодка на брайтон бич?
>Разница в том
что тебе надо закрыть свой блядский рот. Ты сам лично можешь ориентироваться хоть на мнение твоей мамаши, но нормальные люди измеряют отклонение кванта от полновесной модели именно в цИфЕрКаХ, а не по мнению хуепуталы с двача. Я тебе разрешаю дальше сидеть на винде в fp8, но я тебя буду каждый раз попускать, если ты этот способ будешь транслировать как непреложную истину.
Аноним 25/05/26 Пнд 20:15:13 1619650 448
msedge202605252[...].png 1975Кб, 3137x1460
3137x1460
Flux2-Klein00002.png 2377Кб, 1024x1024
1024x1024
Flux2-Klein00003.png 1430Кб, 1024x1024
1024x1024
Аноним 25/05/26 Пнд 20:25:04 1619658 449
>>1619650
ты просто не задонатил достаточно куртке
Аноним 25/05/26 Пнд 20:28:34 1619661 450
civitai шатает что-ли? Нихуя скочять не дает.
Аноним 25/05/26 Пнд 20:31:15 1619662 451
>>1619650
Ты неправильно сделал, судя по их ПАПЕРУ 2k это для скейла с
>2k — trained at 2048px, used as a 4× decoder (512 LDM → 2048 px), or as an 8× decoder for the Scale-RAE backbone (256 → 2048).
Латент твой должен быть 256 ))000 на выходе будет 2к
Аноним 25/05/26 Пнд 20:49:11 1619670 452
410.jpg 62Кб, 640x512
640x512
>>1619481
Чья мамка, признавайтесь
Аноним 25/05/26 Пнд 21:03:53 1619677 453
nvidiaKalShift0.png 6005Кб, 2048x2048
2048x2048
nvidiaKalShift5.png 6553Кб, 2048x2048
2048x2048
vaekal512.png 380Кб, 512x512
512x512
vaekal1024.png 1430Кб, 1024x1024
1024x1024
>>1619662
все равно хуита
если делать 1024-4096 эта параша занимает 30 гигов и не может просраться за полчаса на 5070ти
Аноним 25/05/26 Пнд 21:13:52 1619684 454
2ksrazu.png 5575Кб, 2048x2048
2048x2048
>>1619677
ну и контрольно 2к сразу инфернировать
Аноним 25/05/26 Пнд 22:07:50 1619690 455
>>1619677
>>1619684
Какая-то сомнительная хуита. Смысл в прогреве тренда на безвае понятен если встать на место хуанга: модели от нвидиа мало врама занимают, а пиксели без латента жрут больше, вывод - выпускаем карточки с нихуяврама в будущем, но с новыми быстрыми тензорами.
>>1619630
Тоже поржал с их скама, что на 50 шагах флюкс дева выходит кал мутный
Аноним 25/05/26 Пнд 22:09:23 1619691 456
Аноним 25/05/26 Пнд 23:16:16 1619709 457
Вот я хуею https://github.com/Comfy-Org/ComfyUI/pulls 300+ пулреквестов, последний апдейт компикала 5 дней назад, вышло дохуя моделей ленс, пикселдит, прочая хуйня, я что должен вручную себе всё делать сука
Аноним 26/05/26 Втр 00:16:13 1619724 458
>>1619593
Это что то даст хорошего клейну в текстурках?
Аноним 26/05/26 Втр 00:24:59 1619728 459
image.png 1611Кб, 1397x791
1397x791
>>1618658
А как максимально близко к исходному генерить? Это промптом добивается или какими-то параметрами?
Аноним 26/05/26 Втр 00:56:25 1619733 460
HighFreq.png 549Кб, 2769x1537
2769x1537
>>1619728
Вообще, другой моделью, FLUX.2 [dev], там Edit мощнее, но и то не всё хорошо будет.
Чтобы максимально близко к исходному на FLUX.2 [klein], можешь попробовать prompt: preserve details of image 1, high resolution, very subtle fine texture
И ничего больше не писать ни про освещение, ни про что либо ещё.

Есть ещё фокус сделать подобие wan и вытащить отдельные детали высокой частоты через edit, а потом наложить их на оригинальный latent с помощью latent interpolate и пройтись по нему ещё одним проходом img2img на маленьких sigmas (для FLUX.2 [klein] 9B где-то 0,7–0,5) одним шагом, чтобы ghosting убрать.
Пример на пикрил. Но это довольно муторно и вряд ли захочешь возиться.
Аноним 26/05/26 Втр 01:09:32 1619738 461
image.png 124Кб, 919x844
919x844
image.png 83Кб, 607x784
607x784
image.png 80Кб, 579x606
579x606
>>1619733
На 8 гигах такая модель взлетит? Я просто гуглил для слабых видюх и там была модель как на пик 2. Она весит в 3 раза меньше.
Еще на пик3 разрешение задается вручную в ноде. Есть ноды, которые могут использовать исходных аспект, а брать только одно значение высоты или ширины? Просто оно может нормально кропнуть, а может растянуть.
Аноним 26/05/26 Втр 01:43:41 1619747 462
>>1619738
Модель на второй картинке как раз под твою видюху.
Я не думаю, что у тебя при этом много RAM.

FLUX.2 [dev] даже FP8mixed у меня на 16 Гбайт VRAM отжирает ещё 40+ Гбайт RAM, так как туда идёт offload.
Если RAM не хватает, offload идёт на SSD, на него пишутся десятки гигабайт, скорость падает, SSD укатывается. Это нужно иметь в виду.
Это речь не идёт про BF16 модель.

GGUF не поможет тебе радикально решить проблему. GGUF следует использовать, если у тебя не хватает VRAM, но есть RAM, куда можно выгружать и ты готов дополнительно мириться с некоторым небольшим overhead и потерей производительности на работу с GGUF.
Ещё вопросы качества получаемого результата. Тут единого мнения нет.
Из личного опыта, от GGUF я отказался после серии визуального сравнения результатов.
Если есть возможность, запускаю BF16, затем FP8mixed/FP8 и только потом уже GGUF если других альтернатив для тяжёлых объёмных моделей совсем нет.

>Есть ноды, которые могут использовать исходных аспект, а брать только одно значение высоты или ширины? Просто оно может нормально кропнуть, а может растянуть.

Я уже писал вроде про то, что FLUX.2 [klein] нужно разрешение, кратное 16 пикселям по любой из сторон.
Узел Empty Flux 2 Latent не даст выставить, например, ровно 1080 (будет менять на 1088).
Может можно это сделать насильно другими способами, но я не пробовал.

Что касается узлов для задания разрешения, использую простой:
https://github.com/SamLiu1000/ComfyUI_Resolution-and-Ratio

Есть переусложнённые:
https://github.com/Azornes/Comfyui-Resolution-Master
https://github.com/DazzleNodes/ComfyUI-Smart-Resolution-Calc

Всё это можно найти через ComfyUI-Manager.
Аноним 26/05/26 Втр 02:32:48 1619762 463
>>1613048 (OP)
Как в комфи искать текст в пропмте? Как аналог Ctrl +f
Я не верю что вы все шизы которые весь промпт перечитывают в поисках нужного тега.
Аноним 26/05/26 Втр 04:07:53 1619779 464
>>1619762
С 2023 года в нейрослопе и до сих пор мне не нужно было искать теги в промпте. Ты какой шиз. Лечись
Аноним 26/05/26 Втр 04:20:01 1619783 465
>>1619779
Я понимаю, что у тебя с 2023 в промте только вангёрлстендинг, так что вопрос был не к тебе.
Аноним 26/05/26 Втр 08:18:23 1619820 466
>>1619762
основу промта сам пишу а всякая копипастная хуйня для стиля и тд одинаковая всегда и хули там искать?
Аноним 26/05/26 Втр 09:00:03 1619832 467
>>1619728
>максимально близко к исходному генерить?
Подбирать промпт, роллить сид и черипикать.
Вообще задача восстановления ретуширования лица на фото на 95% делается мозгом. У тебя модель накидывает разные вариации как навалить недостающую информацию, а мозг принимает решение которая из всех этих выдумок больше всего походит на то что у меня в голове.
Аноним 26/05/26 Втр 09:58:08 1619847 468
>>1619762
> Как в комфи искать текст в пропмте? Как аналог Ctrl +f
Через Ctrl + F браузера плюс ручная вычитка.
Поэтому читаю что natural language prompting в моделях БЕЗ хорошего ризонинга в воркфлоу или самой модели - это тупорылая соевая хуйня рассчитаная на васьков.
Потому что контролировать этот натурал ланг поэмный, и формировать структуру - значительно сложнее и утомительней, чем какое более тэг-ориентированный формат. Вообще Json структура кажется самой адекватной. Она и в ручных корректировках удобна, и ллмки с ними лучше работают.
Когда у тебя расписана ебучая поэма, для коррекции одной детали, как правило требуется переписывание кучу других предложений, что бы сохранить согласованность. В ином случае - коррекция может даже не работать. Сто раз в клейне такое было
Аноним 26/05/26 Втр 10:27:05 1619852 469
>>1619650
>победа блять
фуа, фуа, фуааа...
Аноним 26/05/26 Втр 11:06:17 1619861 470
>>1619650
Чем эти текст энкодеры отличаются?
https: // huggingface.co/huihui-ai/Huihui-Qwen3-8B-abliterated-v2
https: // huggingface.co/ponpoke/flux2-klein-9b-uncensored-text-encoder
Аноним 26/05/26 Втр 11:16:23 1619867 471
>>1619861
ничем, я пробовал, разницы никакой на nsfw обсирается не текстовой енкодер а модель.
Аноним 26/05/26 Втр 11:23:46 1619871 472
>>1619861
аблитерат позволяет морально неэтичные пики едитать. обычный выдаёт черный экран
анценз хз, не проверял
Аноним 26/05/26 Втр 11:27:14 1619872 473
>>1619867
Да я в курсе, но всё же.
Почему со снофс дефолтный qwen3 для клейна - вполне нормально рисует пизду и хуи с промта? Ведь цензура на текст энкодере должна это блочить.
Кроме как на пизду/хуй для клейн модели больше ничего нет, поэтому мне даже не ясно, что именно может еще цензурироваться и как это влияет на t2i, i2i режимы.
То есть не ясно в чем разница между abliterated-v2 которая вот у тебя, и klein-9b-uncensored-text-encoder

Гемини пишет, что uncensored-text-encoder это якобы специализированная ллм специально для текст энкодинга, а abliterated-v2 якобы универсальная llm, которая и для чатинга будет работать, но её типа легко в комфи не подключить, что видимо пиздеж, раз у тебя все работает.
Аноним 26/05/26 Втр 11:27:31 1619874 474
>>1619861
обычный хуже справляется с промтом порнушным, у abliterated как-то всё легче получается и варьировать можно
а поскольку за порно банят, то постить я ничего не буду, верь на слово
Аноним 26/05/26 Втр 11:31:04 1619875 475
>>1619872
разные подходы используются
челик с реддита написал, кожаные мешки 1 : 0 тупая железяка

A lot of perople here are very short, so Ill explain some more.

Abliteration as a word, is sort of borrowed from ablating(gradually taking small bits from something). This means you figure out which parts of the model light up when it says no, and then you cut those out/reduce them in strength. Once youve done this enough with enough variation, you have a model that wont say no anymore.

However, its important to keep in mind, that a model doing everything, doesnt mean it will do it well. Not only can abliteration damage the models capabilities in difficult to predict ways, it also cant create information out of nothing.

As an example: You ask the model to explain to you how to make a certain kind of toxic chemical for a nefarious purpose. Then a normal model will have been taught, to say no to helping people commit crimes.

An abliterated model will tell you something that sounds plausible, but doesn't have to be correct, because the second and often used option of censoring model, is simply not teaching them certain things. So if the model never learned about this chemical because it was removed from the dataset, it will never be able to explain to you how to make it. Doesnt matter that it will always write something, but if it has no idea, it will just hallucinate.

Uncensored models were more clearly defined in the past, but instead of removing, they were adding. They built datasets containing nsfw content, chat examples where it helped the user commit a crime, etc. Then the model was trained on that dataset, to teach it not only new information but also to do what the user tells it to do. This wasnt as effective as abliteration, the model often refused, but it helped especially with nsfw content, because many models simply never really learned about that. So you trade a higher rate of refusals, with more accurate answers.

You can of course combine these things, first abliterated and then fix the messed up connetions by training further with uncensored datasets.

Now, in the past it was pretty easy to differentiate between uncensored and abliterated models, because abliteration was a manual and difficult process. However, now that Heretic and similar tools are out, many new users are releasing heretic'd models and calling them uncensored. Which isnt really wrong, but makes it hard to differentiate between the terms.

In general, unless the author says they trained on some material or a dataset, assume its just abliterated.
Аноним 26/05/26 Втр 11:47:34 1619884 476
>>1619872
>цензура на текст энкодере
Цензура не на энкодере, а при inference LLM.
Когда text encoder только перегоняет токены в эмбеддинги — это не имеет значения.
Разницы у тебя не будет.
Проверить просто. Генеришь одно и то же NSFW на обеих при прочих равных и смотришь.
Аноним 26/05/26 Втр 12:18:18 1619888 477
>>1619872
>вполне нормально рисует пизду и хуи
отвратно рисует, что то, что другое.
Я буквально вчера ёбнул к хуям весь этот кляйн бесполезный, и тебе советую сделать тоже самое, модель говно, не теряй с ней времени, если нужно будет с кого-нибудь трусы снять или соски уточнить - юзай фокус.
>То есть не ясно.
для меня тоже), я гонял достаточно откровенный промт, и на нём кляйн обсирался одинаково эпично со снофсом и без
Аноним 26/05/26 Втр 12:51:54 1619905 478
>>1619832
>роллить сид и черипикать
А где тут мозг подключать? Это же рандом.
Аноним 26/05/26 Втр 13:06:47 1619909 479
>>1619872
>цензура на текст энкодере
Давно я так не ржал, сделал мой день, спасибо, дебил
Аноним 26/05/26 Втр 13:26:19 1619913 480
>>1619593
Та нихуя не геймченджер это, считай тот же сид2 ток похуже.
При чем даже на их примерах видно что хуйня дает ебейшие галюны, дорисовывая хуйню всякую
Аноним 26/05/26 Втр 14:39:39 1619936 481
>>1619909
зачем их тогда делают?
Аноним 26/05/26 Втр 14:48:29 1619940 482
>>1619936
Чтоб память дорожала.
Аноним 26/05/26 Втр 15:07:33 1619944 483
>>1619847
Бля, у меня не портбл чтобы в браузере открывать. Или и обычную cumфи можно в браузере открыть?

> natural language prompting
Да как раз наоборот, искать нужный тег в куче тегов чтобы удалить, вот проблема.
Про возможности коррекции правописания я вообще молчу, когда опечатался и нихуя не работает.

Аноним 26/05/26 Втр 15:10:38 1619945 484
>>1619944
Да в браузере, удобно очень
Аноним 26/05/26 Втр 15:12:21 1619946 485
>>1619944
> Или и обычную cumфи можно в браузере открыть?
Я слышал что именно портабл комфи более надежная и актуальная, чем десктопное приложение
Аноним 26/05/26 Втр 15:22:36 1619949 486
>>1619946
>портабл комфи более надежная и актуальная, чем десктопное приложение
Всё верно.
Аноним 26/05/26 Втр 15:24:25 1619950 487
>>1619946
В ней нихуя не работает нормально когда пытаешься что-то больше ван гёрл стендинга сделать, с кастомными сложными пайпалйнами и накачиванием всякого говна, я заебался и снёс.
Не знаю может проблема была не в этом, но видел что рекомендуют декстоп.
Аноним 26/05/26 Втр 15:26:51 1619951 488
>>1619946
Потому что там тот же портебл с тем же веб-фронтэендем, но через костыли.

Кстати в след версии комфи консоль будет ещё ебучей и к тому же с пидорской раскраской разными цветами
Аноним 26/05/26 Втр 15:40:13 1619959 489
>>1619950
>видел что рекомендуют декстоп
Над тобой поглумились.
Аноним 26/05/26 Втр 15:44:07 1619960 490
>>1619959
Ты про это? >>1619949
Пукнул тебе в носик, можешь втягивать.
Аноним 26/05/26 Втр 16:09:14 1619966 491
>>1619946
>на-ду-ли
Тебя за нос поводили, а ты и рад. Портабл, это кастрированый десктоп.
Аноним 26/05/26 Втр 16:24:39 1619971 492
>>1619966
> кастрированый десктоп
совершенно верно, это что-то типа google web-view, огрызок от хрома.
Аноним 26/05/26 Втр 17:30:11 1619990 493
image.png 3363Кб, 1936x1072
1936x1072
Аноним 26/05/26 Втр 18:30:26 1620021 494
anima1.02026052[...].png 690Кб, 768x1280
768x1280
Аноним 26/05/26 Втр 18:57:28 1620030 495
msedge202605262[...].png 129Кб, 516x1001
516x1001
как в субграфах последовательность инпутов менять?
Аноним 26/05/26 Втр 19:00:15 1620031 496
image.png 3460Кб, 1936x1072
1936x1072
Аноним 26/05/26 Втр 20:25:30 1620069 497
ComfyUItempiuzf[...].png 2836Кб, 1480x816
1480x816
Аноним 27/05/26 Срд 00:08:31 1620217 498
>>1619136
Где в принципе прописаны правила? В соседнем треде пилят порно видео с фотками реальных людей. А здесь что? В /б постоянно раньше порно слоп нормально жил.
Аноним 27/05/26 Срд 00:12:30 1620223 499
>>1618792
Рельеф - в первую очередь свет. Пробовал работать со светом в сцене?
Аноним 27/05/26 Срд 00:42:45 1620233 500
FLUX2dk00034.png 2788Кб, 1920x1088
1920x1088
>>1620030
Из того, что я знаю:
https://docs.comfy.org/interface/features/subgraph


Ха-ха, до сих пор никак. Сколько нужно вайбкодеров, чтобы ввернуть лампочку?
https://github.com/Comfy-Org/ComfyUI/issues/9865

Ну и небольшая предыстория. Я не использую subgraphs. Вообще. Задумка замечательная, реализация как всегда. На практике, они до сих пор частично поломаны.
Кроме того, я успел сыграть в замечательную игру под названием Group Nodes. Их поддержку однажды дропнули одномоментно и не предложили промежуточного решения для перехода. Старые workflow поломались. С тех пор я с большой осторожностью отношусь ко всем новым вайб-свистелками и перделкам ComfyUI, а workflow стараюсь делать наиболее простые и узкоспециализированные по принципу: одна задача — один workflow. Только пару старых комбайнов поддерживаю, потому что много в своё время накрутил и бросить жалко, а распутывать долго.


Аноним 27/05/26 Срд 03:36:42 1620281 501
>>1619905
Я еще не понял с сидом. Допустим я нашел сид, который делает как надо, но этот сид будет действителен только для этого конкретного изображения или я его делаю фиксированным и он работает для всех?
Аноним 27/05/26 Срд 06:04:45 1620323 502
>>1620281
Никогда не играл в стратегии с сидами карт? Это просто рандомайзер. Можешь вообще все свои модели генерить при нулевом сиде. Если сид не меняется, то и изображение не меняется, если ты ничего больше из настроек не менял.
Аноним 27/05/26 Срд 07:50:39 1620352 503
msedge202605270[...].png 47Кб, 692x800
692x800
anima1.02026052[...].jpg 100Кб, 1024x1024
1024x1024
>>1620233
>>1620066 →
короче я неправильно использовал эту хуйню, надо просто через параметры в боковой панели добавлять нужное из адвансед инпут нажав шоу инпут и потом развернув список инпут который повыше можно перетягивать и всё работает и перемещается
а вот эту лапшу >>1620030 внутри тянуть вообще не надо
а в темплейтах сделано с разводкой лапши, поэтому про эту фичу помимо разраба знаю только я, уже теперь
Аноним 27/05/26 Срд 07:59:24 1620355 504
>>1620281
>для всех?
Если под "всеми" ты имеешь в виду Лоры персонажей, то да, меняя только Лору персонажа (с относительно малым весом) ты оставляешь всё в том-же виде. Но если ты будешь ковырять промт, особенно в начале и в середин, то твой сид может поломаться, поломать его может добавление какой-нибудь ебанутой васянской лоры, которые вы все так обожаете.
ABS Аноним 27/05/26 Срд 08:04:58 1620359 505
>>1620223
Если объект отсутствует, как абс, то и освещение работать не будет, просто такого концепта а зетке нет, и взять его неоткуда. Ещё раз для закрепления: Z-image turbo не знает что такое ABS.
Аноним 27/05/26 Срд 08:27:54 1620366 506
Ребят кто по хардкору может в общих словах пояснить за всякие там сигмы, латенты и прочее. Расскажите понятно/просто как происходит процесс генерации. Вот я подцепил диффузию, энкодер и вае, написал промпт, что дальше происходит?
Аноним 27/05/26 Срд 09:31:42 1620397 507
zit202605271130[...].png 1118Кб, 1024x1024
1024x1024
zit202605271130[...].png 1241Кб, 1024x1024
1024x1024
Аноним 27/05/26 Срд 09:33:26 1620398 508
>>1620366
Тебя в ЧатЖыпыти забанили?
Аноним 27/05/26 Срд 09:52:28 1620407 509
>>1620398
>>Тебя в ЧатЖыпыти забанили?
Ну так то не только меня.
Впны уже никакие не работают, как и в телеге.

Он всё равно хуйню пишет, хочу от людей услышать, а не гадать галлюцинация это или правда.
Аноним 27/05/26 Срд 09:55:48 1620413 510
>>1620407
В самом Комфу есть шаблон воркфлоу для генерации текста(ллм). Автономно и без регистрации.
Аноним 27/05/26 Срд 10:21:39 1620441 511
>>1620413
Там половина галлюцинаций + "ой извините я снова ошибся".
Если тебе сложно не отвечай, проходи мимо, другой анон может ответит.
Аноним 27/05/26 Срд 10:26:14 1620443 512
anima1.02026052[...].jpg 562Кб, 864x1536
864x1536
anima1.02026052[...].jpg 584Кб, 864x1536
864x1536
anima1.02026052[...].jpg 561Кб, 864x1536
864x1536
anima1.02026052[...].jpg 545Кб, 864x1536
864x1536
Аноним 27/05/26 Срд 10:26:53 1620444 513
2026-05-27122628.jpg 21Кб, 304x634
304x634
>>1620407
>Впны уже никакие не работают, как и в телеге
Пориджище...
Аноним 27/05/26 Срд 10:28:19 1620445 514
2026-05-2701-21[...].jpg 473Кб, 1400x1800
1400x1800
>>1620397
А теперь женский живот, не превращая бабу в халка через говно-лору. И без описания бала Наташи Ростовой, судя по зашумлённости.
Аноним 27/05/26 Срд 10:36:03 1620447 515
zit202605271232[...].png 1318Кб, 1024x1024
1024x1024
zit202605271233[...].png 1163Кб, 1024x1024
1024x1024
>>1620445
это не лора, прост ллмкой насрано, вф с темплейтов

тут close up of extremely muscular defined abs of woman body, ripped six-pack, strong abdominal muscles, shredded, vascularity, athletic physique, female torso, big breast, tank top, wide hips, narrow waist, toned body, bodybuilding aesthetic, studio lighting, highly detailed texture, raw style, ultra realistic, 8k --v 6.0

там close up of extremely muscular defined abs, ripped six-pack, strong abdominal muscles, shredded, vascularity, athletic physique, male torso, toned body, bodybuilding aesthetic, studio lighting, highly detailed texture, raw style, ultra realistic, 8k --v 6.0
Аноним 27/05/26 Срд 10:54:08 1620451 516
Аноним 27/05/26 Срд 10:59:49 1620454 517
>>1620451
> видюха не нужна
комп всё ещё нужен?
Аноним 27/05/26 Срд 11:02:29 1620456 518
image 89Кб, 1249x1358
1249x1358
image 3774Кб, 2614x1846
2614x1846
Аноним 27/05/26 Срд 11:18:08 1620464 519
>>1620456
Зафайнтюнят как полторашку.
Аноним 27/05/26 Срд 11:23:37 1620468 520
>>1620366
Для t2i:
Text encoder перегоняет твой prompt в токены, а токены в эмбеддинги.
Начинается процесс denoise latent, зашумлённого псевдослучайным шумом для восстановления изображения, определяемого целевым вектором на основе эмбеддингов.
Алгоритм удаления шума определяется sampler.
Количество удаляемого шума определяется scheduler. Sigmas указывают сколько шума удаляется на каждом этапе от 1.0 до 0.0, полного расшумления изображения.
Компактное представление из latent пространства с помощью VAE decode преобразуется в пиксельное пространство и сохраняется в растровом формате (png) с помощью узла save image.
Аноним 27/05/26 Срд 12:07:58 1620495 521
image.png 6Кб, 331x132
331x132
как вылечить эту хуйню в комфи воркфлоу, что в определенных случаях вместо превью с картинкой отображается Job ебучий? Когда какие то определенные ноды подключеные в конце или выключены.
Аноним 27/05/26 Срд 12:10:09 1620498 522
ABS Аноним 27/05/26 Срд 12:17:19 1620504 523
image.png 28Кб, 725x330
725x330
imaga00023.png 2786Кб, 1200x1800
1200x1800
>>1620447
>это не лора
>png
и я типа должен тебе поверить, да?)
fullbody, volumetric light, standing naked slender teen-girl (99 yo) , cute pretty face, detailed lifelike glossy skin, bronze tan, shows her defined abs, freckles, fine muscle definition, ripped six-pack, strong abdominal muscles, shredded, vascularity, athletic physique, toned body, bodybuilding aesthetic, жилистое тело, bended arm, tan-lines,
ничего из промта на картинке нет, я пробовал это на: ddim_uniform, как видишь, и даже на: beta которая цепляется буквально за любой шум пытаясь что-то там нафантазировать, но нихуя подобного.
Аноним 27/05/26 Срд 12:28:21 1620510 524
>>1620498
Ну так ты выбирай, что тебе надо, бесплатно или чтоб работало.
Аноним 27/05/26 Срд 12:32:05 1620513 525
msedge202605271[...].png 1359Кб, 2908x1172
2908x1172
msedge202605271[...].png 817Кб, 2532x1101
2532x1101
ComfyUI00001.webp 1781Кб, 1200x1920
1200x1920
>>1620504
ппц фома неверующая
ABS Аноним 27/05/26 Срд 12:33:55 1620516 526
>>1620513
>фома
я вижу васкулярити, но абс-а по прежнему нет, убежал абс...
Аноним 27/05/26 Срд 12:35:21 1620517 527
Аноним 27/05/26 Срд 12:42:08 1620519 528
>>1620510
я не собираюсь 2 раза платить за интернет
Аноним 27/05/26 Срд 12:44:00 1620520 529
>>1620519
Тебя не спрашивали. У тебя просто забрали часть интернета по тому тарифу по которому ты платил.
Аноним 27/05/26 Срд 12:47:45 1620525 530
zit202605271439[...].jpg 485Кб, 1200x1920
1200x1920
>>1620516
убежал и убежал, хуй с ним, не особо нужен был
Аноним 27/05/26 Срд 12:48:03 1620526 531
image.png 656Кб, 913x455
913x455
>>1620504
Проверь nsfw лору. Судя по всему дело в них, она ограничивает образы тел по очевидным причинам, убивая диверсити.

Один и тот же промт в клейне на одном сиде, со снофсом и без. И это стабильно так. Тебе придется выпекать пизду отдельно.

Young slender woman standing naked with zero fat vascular body revealing hypertrophied, ripped female abs. Ripped six-pack is clearly outlined. Cute pretty face, glossy skin, bronze tan. Fullbody, posing strait to the camera. Hard lighting from the side.
Аноним 27/05/26 Срд 12:50:58 1620527 532
>>1620504
Ты тот клоун, который не смог в "брусчатку"? Узнаю тебя по шизоидным тегам и пеной у рта)
Аноним 27/05/26 Срд 13:05:12 1620534 533
какие есть годные nsfw чекпоинты чтобы обучить лору для ZIT
ABS Аноним 27/05/26 Срд 13:35:27 1620548 534
>>1620526
>со снофсом
Это: >>1620504 ZIT
И у.меня в WF нет никаких nsfw лор, если не считать Лору Белладонны).Но я пробовал и без неё, результат том-же.
>>1620527
>тот
Я тот, кто каждый раз даёт тебе за щеку, это главное, что ты должен помнить.
Аноним 27/05/26 Срд 14:05:03 1620572 535
>>1620548
>нет никаких nsfw лор
>нарисована пизда
Пока, что ты жидкого даешь. В очередной раз))
Аноним 27/05/26 Срд 14:16:20 1620582 536
>>1620572
>жидкого
Ты дал, как всегда.
shaved pubies или как вариант: slightly hairy pubies и пиздёнка рисуется безо всяких pussy, которые один хер не работают. Единственное что работает в данной ситуации, это твой рабочий рот, маня...
Аноним 27/05/26 Срд 14:26:49 1620586 537
>>1620582
продолжай копротивляться, это смешно)))
Аноним 27/05/26 Срд 14:31:28 1620590 538
>>1620582
обоссан с пруфуми:
1. Брусчатка не брусчатка
2. Не видно жопу из-под юбки
3. Короткая стрижка не короткая
4. Ваш пресс не пресс
Ничего не забыл?
Аноним 27/05/26 Срд 15:37:15 1620627 539
>>1620510
Мне надо что бы работало хоть через жопу, но бесплатно.
Я не долбоеб платить за то что должно быть по дефолту бесплатно.
Аноним 27/05/26 Срд 15:58:24 1620638 540
>>1620590
>Ничего не забыл?
ты рот прополаскать забыл.
Аноним 27/05/26 Срд 15:59:39 1620640 541
>>1620627
> должно быть по дефолту бесплатно
ты просто 0айкью долбоёб который решил что ему кто-то что-то должен
Аноним 27/05/26 Срд 18:43:52 1620707 542
image666.jpg 1309Кб, 1936x1072
1936x1072
Аноним 27/05/26 Срд 20:19:02 1620756 543
Сон приснился, что я начал пользоваться моделями без вае и мне понравилось. Ебать сюр
Аноним 28/05/26 Чтв 00:19:04 1620852 544
>>1620498
>амнезия платная
Зумерище... WARP-конфиги загугли. Не платил ни цента, полностью бесплатно.
Аноним 28/05/26 Чтв 06:08:59 1620905 545
>>1620513
я чет не понял, а где здесь этот abs?
Аноним 28/05/26 Чтв 09:36:57 1620943 546
>>1619905
>где тут мозг подключать?
Имеется ввиду, что в твоей голове есть какие-то дополнительные представления, воспоминания, мысли о ретушируемом лице. Тогда вся функция мозга сводится к оценке: "да похоже, нет роллим дальше".

Если исходник лица тебе не знаком, то строго похуй - выбирай тот что больше визуально нравится.
Аноним 28/05/26 Чтв 09:39:25 1620945 547
>>1620852
"Да, я знаю, о чём вы говорите. Речь идёт об использовании протокола AmneziaWG (форк WireGuard) внутри приложения Amnezia VPN с обёрткой через Cloudflare WARP (обычно в виде wgcf-конфигов), чтобы скрыть трафик WireGuard и сделать его «невидимым» для DPI.

Однако важно сразу предупредить: полностью бесплатного и стабильного способа с «чистыми» WARP-конфигами — нет»"

Хуй там.
Аноним 28/05/26 Чтв 10:55:48 1620962 548
>>1613048 (OP)
Котаны реально ли генерить чисто на проце?
Какой минимум нужен?
Аноним 28/05/26 Чтв 11:05:51 1620968 549
>>1620962
>Какой минимум нужен?
Запредельное терпение.
Аноним 28/05/26 Чтв 11:09:09 1620971 550
Аноним 28/05/26 Чтв 14:58:35 1621069 551
ComfyUItempdpjs[...].png 3602Кб, 1034x1860
1034x1860
Аноним 28/05/26 Чтв 15:05:00 1621073 552
Аноним 28/05/26 Чтв 16:18:30 1621098 553
>>1620852
>>1621073
Оно, емнип, как ВПН все равно работать не будет.
Да, блоки РКН обойдет, но если сайт с той стороны геоблок имеет - тебя на него не пустит.
Плюс будет нужно что-то типа zapret-discord-youtube, для "обманки" входного фильтра и коннекта к самому WARPу.

По крайней мере чистый WARP у меня именно так работает, через амнезию не пробовал его пускать ибо подписка на Амнезию есть.
Аноним 28/05/26 Чтв 16:32:14 1621108 554
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов