• Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
Попробовал чужую base-лору на turbo - нулевое влияние на лицо. Турбо-лоры работают отлично, очевидно. Ну и нахуя тогда эта base-параша вообще нужна. Думали, что будем обучать на base и юзать на турбо. Разочарование года. Когда там ждать первые потуги хороших файнтюнеров? Предвещаю хуйню уровня флаксотюнов с инференсом как у хромы. Тот же турбо-тюн епикреализма - полное копро. Причем та же самая лора у него - на порядок лучше и даже заслуживает внимания.
>>1509461 Ну ты посмотри что генерят лучшие лоры на флакс и на сколько порядков хрома делает это лучше (не в руках ленивых криворуких уебанов). Хотя я всё ещё надеюсь на слова китайцев, что они вместе с базой должны были выпустить гайд как делать дистилляцию и все файнтюнеры её сделают так же идеально как турбо, ещё сильней улучшив такие детали. >>1509468 More like >anime slop
>>1509596 Какие настройки? Качаешь portable. Ставишь ComfyUI-Manager. Открываешь TEMPLATES. Берёшь типовой workflow. Качаешь модели, которые к нему идут и custom nodes, если нужны.
Версия Desktop обновляется позже всех. У многих с ней проблемы.
>>1509820 Что не надо ставить через stability, нативный или васянские "сборки", а надо ставить portable и только portable. Потому-что все сидят на portable, все гайды и траблшуты для portable, и когда анон полезет что-то искать/пердолить (а он полезет), то столкнется с тем, что придется решать кучу нетипичных проблем. Давно пора уяснить - на данном этапе просто не будет, придется пердолится, ручками зависимости править, лазить в венву. И если в portable это относительно безболезненно и у тебя все добро в одном месте, то с другими вариантами все сильно хуже. Кнопки "генерировай заебись" нет и не предвидится.
>>1509867 В стабилити ставится портейбл и все гайды на портейбл работают на стабилити версию. Только вот ебаться с комфи в стабилити не надо, ведь там весь функционал вшит
>>1510257 > половина Это какие? У меня ни одной не слетело. Может у тебя там некрота, которая джва года не обновлялась и ломается от No explicit any коммитов во фронтэнде?
>>1510255 Полагаешь, стабилити будет волшебным образом угадывать твои мысли, сама догадываться о твоих пожеланиях, скачивать воркфлоу из небесного хранилища тайных знаний, а также ставить сверхсекретные ноды? На самом деле портабле самодостаточна, и ее никуда не надо вшивать, чтобы она работала как надо.
Потыкал тут сэмплеры для кляйна, может кому пригодится. Зеленый текст - на мой взгляд лучший в линейке. Синий - уникальные без пересечений. На сером фоне приблизительно одинаковые, но есть нюансы.
>>1510668 Можешь еще exp_heun_2_x0, gradient_estimation, seeds_3 попробовать, если текст не нужен. А если нужен, то тестируй сразу с текстом, чтобы потом не было фрустраций.
>>1510692 Что для тебя сложная сцена? Тут >>1508366 → dpmpp_2m_sde_heun smg_uniform. На четвертой получился обосрамс, т.к. кошка и крыса должны были бежать справа налево и крыса должна была гнаться за кошкой. Остальное всё попало.
>>1510594 Ты в курсе, что ancestral samplers относятся к стохастическим сэмплерам и не сходятся, потому что на каждом шаге шум подмешивают? У тебя результат рандомный будет.
Очевидно, что если не выкладываешь workflow со всеми использованными prompts и настройками (для подтверждения и воспроизводимости результатов любым желающим), без prompt непонятно вообще какой должен быть конечный результат. Предположим, следования prompt на некоторых samplers/schedulers нету, колбы и предметы будут расставлены в другом порядке, с содержимым других цветов, геометрия, формы, освещение будут другими и так далее. Эти моменты только из prompt понять можно: что именно указано в prompt (что сверять), а что рисуется рандомно и не имеет значения.
>The distillation process causes some damage to text (especially very small-sized text), with rendering clarity and completeness inferior to the original Z-Image.
>>1510723 >ancestral samplers относятся к стохастическим сэмплерам и не сходятся, потому что на каждом шаге шум подмешивают? Ты в курсе, что есть стандартная нода, где уровень подмешивания шума этого семплера настраивается? И значит можно легко сделать сходимость. Хватит шуметь в тред.
>>1510829 Кстати, у ваших любимых res_2s тот же принцип подмешивания шума и их легко нечаянно превратить необдуманными настройками в анцестрал и не заметить.
>>1510829 Можно и троллейбус сделать из буханки хлеба. Я очень сомневаюсь, что в том >>1510594 «тесте» >есть стандартная нода, где уровень подмешивания шума этого семплера настраивается? И значит можно легко сделать сходимость.
Не плоди сущности без необходимости ради софистики. Когда большинство втыкает стохастические ancestral samplers они даже не знают в чём их отличие от детерминированных. Этот пост был для них. Если ты такой прошаренный, который с помощью говна и палок из стохастического семплера пытается сделать детерминированный, флаг тебе в руки.
>>1510834 > сущности без необходимости ради софистики > большинство втыкает стохастические ancestral samplers они даже не знают > они не знают > большинство, Карл, не знает > 6-й год подряд один и тот же пост Череп не жмет, теоретик?
>>1510834 >>1510840 Можно я встряну? Как вы объясните тот факт, что даже при euler_a семплере в comfy картинка получается одинаковой на одинаковом fixed sid? Даже если уйти на другой sid и вернуться потом обратно, чтобы comfy уж ТОЧНО заново перегенерировал а не из кеша вытащил? По вашим рассуждениям, картинка должна быть всегда разной несмотря на sid, не? IMHO - этот шум который он подмешивает - не случайный, а псевдо-случайный, и тоже зависит от sid. Вот и все.
Кто шарит скажите, установка ноды через manager это на 100% то же, что ручное git+pip или менеджер делает ещё какие-то микро движения? Я знаю, что будет работать и без менеджера, просто ocd дрочь. Вопрос лишь: 100% или 99%?
>>1510995 Менеджер проверяет совместимость версий зависимостей при установке. Например, долгое время для работы дохуя всего нужно было numpy<2.0, а для установки зависимостей нужен был numpy>2.0, менеджер ставил новую версию, ставил зависимости и откатывал на старую версию. Хотя вроде они какое-то время назад начали это делать в том числе при запуске комфи, так что хуй знает. Безопаснее, наверно с менеджером, чтоб потом не охуевать от отвала других нод.
>>1510666 по поводу >2 sgm на отдалении разъёбывает кисти рук при промте hand-in-hand и что-то делает с оскалом если перс улыбается. Резюмируя: тут получается рандом, на каком-то сиде с каким-то промтом лучше эйлер, где-то лучше dppm_2m_sde_ХХХХ, второй бывает, что заметно упрощает, эйлер туго реагирует на лоры-слайдеры, то есть куча недостатков одновременно с достоинствами, имбы нет, в каждом конкретном случае перебираю 2-3 семплера и смотрю кто лучше ракрывает перонажа.
>>1511056 Ну с zit много сэмплеров нормально работает. Из планировщиков в основном simple и smg_uniform, в редких случаях linear_quadratic выдает что-то годное, но это скорее спрей энд прэй, чем стабильный вариант.
>>1510834 >Я очень сомневаюсь в этом «тесте» Ой, да иди нахуй. Я вообще это делал для себя, просто решил поделится. Ну проведи тест как надо, раз такой умный, подготовь презентацию, а мы тут с умным видом пообсуждаем.
>стохастический Да мне похую, как он там. Твой ancestral на всех картинках - говно. Хоть подмешивай шум, хоть не подмешивай.
Прикол в том, что сидят тут прохфессора, с умным видом теорией размахивают, а все генерации - типа скульптура из говна
>>1511077 >прохфессора, с умным видом Тут ты прав. Как только я что-то своё выстраданное выкладывал в тред, прибегал этот профессор и требовал презентацию, всю мою цепочку исследований, воркфлоу и обязательно промпт. Хотя все понимают, кроме него, что любой совет/фича должна испробоваться и исследоваться лично. Но он пишет свои возмущения с таким контекстом, что вот если бы ему представили воркфлоу то он мгновенно бы включил совет в свой пайплан и сразу бы использовал во всех своих генерациях не глядя.
>>1511135 >бязательно промпт ну, а как ты хотел? чтобы понять насколько семплер следует промту, нужно значть что имеено в промте, иначе как ты это поймёшь? при клоузапе ты не можешь понять как отрисовывается тело, нет ли там сороконожки, лицо и руки тоже не сильно показательны, разве что для теста сигн)
В статье по ссылке была анимированная гифка с демонстрацией кота, которого корёжит на каждом шаге ancestral с добавлением шума. Она, вместе с сопровождающим текстом, конечно же совсем ничего не объясняла.
>но не смог объяснить ньюфагу Спасибо, что ты помог, или не ты. Я понимаю, я же должен 24/7 в треде сидеть. Вычтите штраф за отсутствие на рабочем месте с моего счёта в банке двощей.
Серьёзно, если полдня спустя так болит, ты там свечечки поставь или таблеточки прими.
А теперь по существу: я откровенно не понимаю, почему материалы по ссылкам избирательно игнорируются, сводя всё к битве с соломенным чучелом. Вроде не /b, а тематика. Здесь и так поддержки почти никакой. Всё, что я вижу в треде за последние полгода, это вбрасывание 1girl и подобных картинок в jpg без workflow (некоторые из них даже не сгенерённые Аноном, а индексируемые поисковиками). Исключение составляют некоторые Аноны, которые постили workflow и различные приёмы для изучения (не обязательно всё было полезным или пригождалось, но для повышения общего уровня это хорошо). Я тоже старался по возможности. Сравнения скидывал с workflow для проверки результатов. Даже те, кто тащит сюда всякое сомнительное говно с сабреддита /stablediffusion, /comfyui, CivitAI, тоже по-своему полезное дело делают. В отличие от тех, кто ведёт себя как крабы в ведре (специально они это делают или нет, непонятно), фактически способствуя гейткипингу.
>>1511147 У тебя дурацкие советы. Лучше бы ты молчал иногда. Пару тредов назад кто-то что-то про семплеры спросил и что ты ответил? Совет типа " никто не мешает тебе самому экспериментировать". Это как: если вы бездомный, то просто купите дом, если заблудились, то просто идите домой. Не пиши так. Зачем твоя вода?
Тупой вопрос, но может кто знает: не могу заставить флакс сгренерить изображение стены плашмя, т.е. без перспективы. Всегда получается ёбаная перспектива и vanishing point
>>1511147 Да, Euler_ancestral лучше чем Euler_ancestral_cfg_pp, хотя оба хуже, в чем противоречие? Пытаешься сманеврировать очком? ну ок.
>я откровенно не понимаю, почему материалы игнорируются Ты либо показываешь на конкретных примерах почему данные не верны, либо идешь нахуй со своими шизотеориями и мануалами. И я тебе еще раз говорю, это не научная работа по сэплерам, это личный рабочий процесс. Сделай как надо, подкрепи теорией, выложи в тред.
>>1511135 > если бы ему представили воркфлоу то он мгновенно бы включил совет в свой пайплан и сразу бы использовал во всех своих генерациях не глядя На самом деле все наоборот. Обычно твой совет настолько тупой, что при наличии твоего воркфлоу и результатов использования совета даже объяснять не нужно, почему совет тупой.
>>1511147 > я же должен 24/7 в треде сидеть А тем не менее сидишь и строчишь изо дня в день эти посты ни о чем, где все кругом пидорасы, а ты дартаньян. Вместо тысячи псевдоинтелектуальных строк, мог бы с первого поста в двух словах ньюфагу объяснить про ancestral семплеры, если считаешь своим величайшим долгом делиться своими знаниями. И нет, кинуть ньюфагу статью на 20 страниц из 2к23 - это не объяснить, так, чтобы вкатун понял.
>>1511200 Естественно. Вот, разгадай и бегом на реддит постить. Detailed grainy film photograph of a teenage girl 14yo holding a small handwritten note that says "Ценный Совет На 2ch 06/02/26". .This photo was captured with Bolex H16
>>1510447 половина людей не сможет поставить тритон без сотни гайдов, а стабили это делает по 1 клику плюс там расширения удобно качать, а не клонировать с гита
Как я понял в Klein Edit можно подключать гирляндой довольно много картинок на вход (сколько?). Вопрос: можно ли подключив гирлянду датасета определенного лица получить что-то хорошее? Как будто лора без самой лоры. Единственное неудобство нужно упомянуть в промпте все эти имага1, имага2... Будет ли такое работать? Кто проверял?
>>1511284 >половина людей не сможет поставить тритон без сотни гайдов. >имангине ебало дегрода, коупящего, что он не единственный, кто не в состоянии скачать давно уже собранные под все что угодно whl.
>>1511589 Можно не ебаться с говном в виде программы а скачать нормальный портабл с питоном, при условии что у тебя куда нужная нормально на сперму встанет
FreeFuse: Multi-Subject LoRA Fusion via Adaptive Token-Level Routing at Test Time https://github.com/yaoliliu/FreeFuse Нода позволяет использовать несколько лор одновременно. И не просто использовать, а объединять этих персонажей в одном кадре с сохранением консистентности каждого. Поддерживает flux и sdxl.
Я подсел на онлайн image to prompt генераторы и теперь задался вопросом - есть ли что-то для локалки? А то с грядущим чебурнетом придётся опять самому промпты писать
>>1511863 Я abliterated версии Qwen3-VL-30B и Gemma3 27B для этого использую, через llama.cpp server и ноды для OpenAI API в комфи. Они мне промпт переписывают и видят референс, если его прикладываю. Каждую генерацию перегенериваю промпт, работает как сид, вариативность генераций ахуенная. Некроту вроде джойкапшенов не рекомендую, оно слишком устарело и плохо промптится в нужный формат. Если нет лишней карты на 24 гига, чтоб параллельно гонять модель, то можно Qwen3-VL-8B попробовать, жить можно с ним.
>>1511931 Да в общем-то если обе модели влазят в ОЗУ, то оверхед туда-обратно модель выгрузить - единицы секунд. А так я первым проходом генерю пачку промтов в txt. Вторым проходом - генерю основу. Третьим проходом - апскейлю. Так только одна модель в памяти, быстрее, и можно параллельно комфортно капчевать.
>>1511928 >вариативность генераций ахуенная Я ещё добавляю немного искажений перед VLLM при помощи Image Random Transform. Столкнулся как-то, что gemma на одной фотографии упорно распознавала кота как пакет, как сид ни ролль. Вот с таким костылём VLLM действительно смотрит на референс каждый раз по разному.
Так что, сравнивал кто нибудь турбу Zimage и Base модель с дистиль лорами? Я потыкал старые гены, вроде бы лучше в вроде бы и нет, вариаций больше теперь. Может для дистилей какие то сэмплеры подходят хорошо, типа res2s или bleh?
>>1509245 (OP) Аноны подскажите. Имеет ли смысл менять 3080 на 3090 для SD? Увижу ли я какую либо сильную разницу? Или лучше сразу начинать смотреть в сторону 50хх линейки?
>>1512011 Нет. Но зашёл в тред, чтобы поделиться тестами Klein 9B base/distil и услышать выводы других об этих вариантах. В целом, ничего другого и не ожидал от того, что получил. Дистил отлично делает фото, сохраняет незатронутые детали почти безупречно, убирает что нужно, не трогает остальное, может заменить человека+позу, пытается в один стиль пиксельарта, некоторые промпты не понимает. База непригодна для фото абсолютно, превращает всё в резину, может сломать анатомию, но при этом, на мудрённых сценах может правильно всё поменять, сохранить рефы (например, сразу и вставить фото в сгенерированный телевизор и обработать это фото через лору); значительно хуже "генерит" по рефу. Единственный случай, когда база не была хуже дистилла - генерация пиксельарта по фото. По фото+арт она так же не выдала ничего сносного. Обе не могут перенести уже довольно популярный стиль по референсу (handpainted textures), серут позорной анимой позорной вместо этого. Ожидаемо, база непригодна для генерации, но чуть лучше слушает промпт, может делать больше, может пригодиться разве что как черновой набросок, когда дистил не может что-то сделать.
ZBase совершенно не тянет скачивать и сравнивать. Воспринимается как sd3 хрома, то есть нужен подход, только говно + без nsfw. Жду файнтюнов.
>>1512033 >Klein 9B distil Все бы хорошо, но почему она так всирает анатомию? При изменении позы у тянки например, она дорисовывает ей целюлит, или другую фигуру вообще. Как добится консистентости при edit? В корп. моделях такой проблемы нет, оно и понятно ведь там параметров в 10 раз выше, но все же.. Еще вопрос, можно ли в Klein 9B distil фейсвап делать полноценный?