Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1356393 → На Qwen Edit берешь картинку и используешь следующий промпт.
>Create a commercially available 1/7 scale figure of the character in the illustration, with a realistic style and environment, high quality, and maximum detail. Place the figure on a computer desk, using a circular, clear acrylic base without text. On the screen, demonstrate the modeling process of the figure using ZBrush, which is still uncolored. Next to the screen, place a BANDAI-style toy packaging box printed with the original illustration and the character name "имя"
>>1356456 → Мне не НСФВ, мне нужно Алешу Поповича из мультика для ребенка, вряд ли по промту в буржуйской нейросетке такое можно сделатьЮ, поэтому только по фото. А вот эти фигурки на фоне моника это разве не отдельная сетка, вроде даже треды по ней были?
>>1356532 Нет нормальных пиков на квут. Есть только хл и лучше моделей нет. Кто вообще мог сомневаться? И так будет всегда до тех пор, пока тебе мама не подарит что-то мощней 1650
>>1356566 Мне для 3д принтера, если это просто картинка то увы не подойдет, нормальные модели Поповича которые в сети за пейволом, причем стоят как реальная игрушка. Думал нейросетка поможет, увы, но спасибо.
>>1356578 нейронка которая из картинок делает картинки - очевидно не поможет. а нейронка, которая делает из картинок 3д - поможет. Я в них не шарю, но слышал что hunyuan3d неплохо делает. А так моделька Поповича это несложное задание.
>>1356467 >>1356578 Вот эту попробуй. Кидаешь картинку, получаешь 3д модель. Лучше кидать с однородным фоном и без всего что должно быть элементами модели. Делает не особо точно, но пока лучшая что есть для модели из одной картинки (есть сетки которые принимают несколько ракурсов)
Сгенерьте пов вид на пизду, сидящую в позе наездницы на мужике, кроп по брюхо, член лежит вне пизды, следы и нитки кама опционально
Ну наверняка, модель, обученная на анатомии, и созданная исключительно для этой задачи не может обосраться в такой простой задаче. Ну, верно же? Верно?
>>1356211 → >XL xl модели почему то не делают инпеинт. Я скачал пару, и они просто как бы генерят другую картинку, а потом миксят её с оригинальной, но стык всегда кривой и переход видно настолько, что это вообще нельзя считать инпеинтом. В обычных 1.5 такого нет эффекта.
>>1357265 >Ты сейчас инпейнт описал. Нет, инпеинт в 1.5 на превьюхе показывает оригинальную картинку просто размытую, и потому у него на выходе получается плавный переход, и это реальный инпеинт.
А XL модели почему то генерят что-то своё там вообще там контуры могут быть в другом месте, фактически другую картинку, а потом просто смешивают её, и в результате получается например идет линия плеча, потом прерывается, и заинпейнченная рука идет уже в другом месте. ХЗ почему эти модели называются инпеинт, они вообще не инпеинт.
>>1357273 > ХЗ почему эти модели называются инпеинт, они вообще не инпеинт. Инпейнт - это процесс. То, что там на модели написано инпейнт - это вторично. Используй обычные модели с InpaintModelConditioning + Differential Diffusion + Grow Mask With Blur + repaint, если на большом денойзе сильно кропаешь и без него не получается>>1343673 →
>>1357295 Это что-то непонятное. У меня автоматик111. Типа что-то нужно дополнительно поставить в автоматик, что бы в XL инпеинт работал или что? А есть туториал? Лапшу не юзаю, она у меня не запускается вообще.
>>1357302 Не запускал а1111 уже 2 года. Помнится там какую-то галочку тогда добавили на вкладку инпейнта сразу под пикчей. Вроде это и есть Differential Diffusion.
>>1357257 > но стык всегда кривой и переход видно настолько, что это вообще нельзя считать инпеинтом Может модель не очень, или денойза слишком много поставил, плюс есть soft inpainting, справляется со швами в целом по краям, если тотальных проёбов нету по анатомии конечно
>>1357277 Однако, далеко прогресс за два года шагнул. Вспоминаю, какую дичь раньше генерили - и тут, прям хорошая такая модель, с приличной топологией. Хотя зерошотом на принтер все равно генерацию не подать, руками допиливать придется. Но хоть не с нуля делать.
Анончики, хочу Chroma потестить/посмотреть. Какую версию брать, чтоб не обжечься? Их тут дохуя. По соотношению качество/скорость какой-то баланс надо. Пока склоняюсь к annealed, но побаиваюсь, что проебусь по настройкам. И есть ли смысл качать flash neun под конкретный сэмплер? Или это всё наебалово?
>>1357368 Хм-м. Вообще, мне в этом плане сложно определиться. Я побаиваюсь, что с появлениями новых версий всё большая разъёбка идёт. chroma-unlocked-v50-annealed_float8_e4m3fn_learned_svd.safetensors ща вот эту попробую
>>1357333 Я не сомневался, что дмддаун настолько тупой, что даже не знает что такое поза наездницы, не говоря уже о том, чтобы понимать как это ирл выглядит. Представь, что на тебя залазит тянка... ах да. Похуй, объясню. Это не растопырив нахуй в стороны рогатку, лежать, оперевшись на руки, именно такое говно тоннами можно генерить. Визуализируй: ты лежишь, она нормально по-человечески сидит на коленях на тебе, таз на уровне твоего, она наклонена либо ближе к тебе, либо хотя бы сидит прямо, её руки перед ней, твои похуй где, у неё на талии, или ногах, или вне кадра. Я писал про кроп клоузап брюха, ну думаю хуй с ним, пускай с лицом, если получится. Забыл про читерские аниме-копро-мерджи, на них наверное это с первого промпта генерится. Ну, хуй с ним, погнали, давай хотя бы на копро-аниме-"реалистиках". Но нормальный челендж сделать это на натвиз-подобной хуете, чтобы хоть немного на фото было похоже. Очевидно, без лор, чистая t2i генерация.
>>1357397 >по ускорению По ускорению только 50-flash, но мне не понравилась, то ли обучили плохо, то ли квант противопоказан, то ли приготовить её не сумел. Попадалась ещё любительская нунчака для одной какой-то древней версии, её не пробовал.
>>1357393 > Визуализируй: ты лежишь, она нормально по-человечески сидит на коленях на тебе, таз на уровне твоего, она наклонена либо ближе к тебе, либо хотя бы сидит прямо, В позе, которую ты описал, пизду анатомически не видно, визуализатор мамкин.
>>1357332 >Хотя зерошотом на принтер все равно генерацию не подать, руками допиливать придется А чё там с сеткой на хайполи? Покажи. Сам тридэшник, интересно что нейросетки пилят
>>1357436 Охуенно. Это на дмд так хорошо? Покажи настройки. Ну, если был бы кроп, то реально было бы, буквально в гуглофотографиях примеры. >>1357480 Приемлемо. Те же вопросы.
>>1357748 нет. сгенерировать, что надо с первого рола и заинпейнтить косяки при наличии. это ж не хрома, чтобы часами роллить что-то вразумительное, а потом не заметить пизду кроненберга в центре пика, или заметить но выложить, как есть
>>1357761 Не вижу на твоем пике > ты лежишь, она нормально по-человечески сидит на коленях на тебе, таз на уровне твоего, она наклонена либо ближе к тебе, либо хотя бы сидит прямо, её руки перед ней, твои похуй где, у неё на талии, или ногах, или вне кадра Всё еще роллишь на хроме, даун?
>>1357271 >>1357318 Так короче скачал lustifySDXLNSFW_oltFIXEDTEXTURES. Ну он естественно не делает никакой инпеинт. Пик 1, он просто сгенерил похожую картинку и обрезал по линии инпеинта, в результате ожидаемо получилась хуета.
Потом я скачал инпеинт модель lustifySDXLNSFW_oltINPAINTING. Это пик 2. Она реально делает инпеинт, тоесть объекты переходят друг в друга, но рисует какую-то полную хуету, тоесть эти объекты не делают никакого смысла в ирл, модель впринципе не понимает что такое анатомия, что такое член, откуда он должен торчать и т.д. просто хуярить паттерны пикселей.
Очевидно что с другими моделями XL будет тоже самое и качать их нет смысла. Так что вопрос остается, появилось ли за 3 года, какая-то технология, которая нормально делает инпеинт и понимает анатомию женщин людей.
>>1357977 > он естественно не делает > Очевидно что > вопрос остается, появилось ли за 3 года, какая-то технология, которая нормально делает инпеинт Для тебя - нет. Жди еще три года. Может к тому времени появится нейронка, которая за тебя воркфлоу из четырех нод сделает.
Лучший XL инпейнт получался через вот эти контролнеты с весом 0.5 Спиздил когда-то давно с какого-то цивит гайда Работало на фордже Как в комфи будет хз Юзал в комфи brushnet Лучше только тем, что можно было наколдовать маску и не марать то, что оставалось за маской
Пока что искаропки только люстранубаи такое может. Вот почему другие модели типа хромы и вана никогда не будут популярны среди эстетов высокой культуры. Участь плебсов на квенах и флюксах жрать цензуру и причмокивать, рассуждая о юзкейсах сидя на шее у мамки.
>>1358180 Беггарз борда ещё осталась? Делаешь видос, так и так залетишь в топ в галереи из-за того, что залил на борду бомжей, но получишь ещё дополнительные лайки от рандомов, следующий месяц будешь получать понемногу. Были бы минусующие дизлайки, всех таких беггаров попустили бы, но минусов нет, получаешь только плюсы за засирание топа галереи.
Кстати, а обучал кто-то на цивите? Я дженерик обучал пару раз, мне интересно - меня сразу забанят с обнулением баззов, если я полезу кого-то известного обучать? И я там видел пометку "approved" на датасетах. Их теперь ещё и проверяют заранее? >>1358099 Ван это вангерл стендинг лидер, лучше только квен, наверное Хрома ебёт нубай по промптингу Но нубай прям очень сильный по сравнению с прочим сдкалом Этим челикам бы хрому дофайнтюнить, только не на анимекале, а на фото
>>1358199 > видос У меня нет 500 баззов на видос я как увидел ценник то сразу охуел. Я сам бомж иначе генерил бы на своем железе и не ебался с онлайн помойками.
>>1358199 >Этим челикам бы хрому дофайнтюнить, только не на анимекале, а на фото Автор нубаи просирает своё легендарное будущее, не занявшись файнтюном хромого изначально. Манямекал не проблема в этом случае, здесь не в датасете дело, а в уёбищьной криворукости авторов хромы.
>>1358239 > симпсити Эта залупа отказывается присылать мне подтверждение имейла и из за этого не пускает никуда на форумы. А еще я не нашел там поиска, наверное он открыается после того как подтвердишь себя что я не могу сделать уже больше недели, акк есть а подтвердить мыло не дает.
>>1358241 Я генерю на квене фп16 фото, иллюстрации манямека на нубаи, пока нищие бомжи на хроме мечтают о возможностях нубая в 2д и ванопетухи о реалистик возможностях квена.
but GPU POOR rejoice! your CPU RAM is now VRAM. Peak GPU mem: 16,139 → 1,736 MB (on dummy mlp forward pass) Speed ratio: 0.99× (compute & comms perfectly interleaved)
>>1358244 Странно, мне пришло через некоторое время, на следующий день заметил. Пошел чекнуть тред, а там много сообщений о том, что не получается. Возможно пофиксили, возможно неумелые челы и нужно порыться по страницам и найти рабочий код. >>1358393 Так ты ж генеришь мыльный пластик. Не понял про мечты в 2д. Вы бы хоть пробовали перед тем как пиздеть. >>1358591 Ура, нищие дмдауны смогут запустить что-то сложней XL если сдадут бутылки и купят хотя бы рам.
>>1358617 а ты просто не знаешь возможностей хромы, потому что нищий. а вот если бы прочитал, что автор написал о возможностях хромы на обниморде, знал бы о её возможностях
>>1358596 Попоробовал 3, не оч понравилось что картинка теперь не такая зернистая и детальная, но зато всякие айпиадаптеры с ней работают вполне интересно, можно переодевать людей на фото подсунув в адаптер что-то
>>1358591 В Комфи простой подменой не обойтись. Пробовал подменять на загруженной модели - ООМ, при том что без этой мокрописьки модель лезет в VRAM. Если подменить в коде самой модели, то оно вообще не работает, потому что у Комфи свои линейные слои и он не может загрузить модель.
>>1358621 >нищий тупой бомж проигнорировал все тредовские гайды как пользоваться хромой и высрал говно во флеше за 4 шага в лоурезе >ВСЕ СМОТРИТЕ КАКОЕ У МЕНЯ СКИЛЛ ИШЬЮ Я ДМДПИДОРАС ХУЖЕ МЕНЯ УЖЕ НЕТ
>>1358717 Она самая, просто я не правильно прочитал все гайды типа "сгинирил, лучшая фотка втреде". Похоже какие-то инструкции пропустил в этой фразе. >>1358710 Зашивайся. Как нароллишь, приходи.
>>1358725 >>1358757 Хуя перефорс нищего дмдчма Пока в треде постят такие петухи как ты, зашкварно постить что-то стоящее Хвала тем, кто попытается это исправить и выдать нищее криворукое дмдговно
>>1358876 > ито я ни сгинирить ни магу, это я просто свой кал на посмешище выкладывать ни хачу, пока есть с чем сравневоть. кагда в треди толька текст астанится, тагда вылажу ясн) слив бомжа засчитан
>>1358876 >Хвала тем Ты уже четвёртый год себя хвалишь, semen. Почему бы не создать отдельный тред, где ты бы выкладывал свои картинки и тут же хвалил бы их? Уж лучше так, чем всем остальным поднасерать круглосуточно.
>>1358768 >я с квена ушел на 1,5 и сдохлю так как он у меня 30 мин 1 картинку генерит, не выдержал прост Так почему ты Нунчаку не поставил то. С ним Квен генерит 2k картинки быстрее, чем SDXL занимает времени на апскейл до 2k.
>>1359021 Там на главной нихуя не объяснено, и не понятно. На главной квена все четко разложено, вот тебе ван, текст энкодер и дифуз, даже варфлоу дают, а на нунчаку только дифуз, и нифуя больше. По крайней мере я не увидел минимальный набор джентельмена для старта.
>>1359091 >Там на главной нихуя не объяснено, и не понятно. >На главной квена все четко разложено, вот тебе ван, текст энкодер и дифуз, даже варфлоу дают, а на нунчаку только дифуз, и нифуя больше. По крайней мере я не увидел минимальный набор джентельмена для старта. Это уже боты, или обычная шиза?
Вот тебе минимальный набот нунчаку, ставишь сначала базу, потом запускаешь ноду установщика, для установки компонентов, потом уже делаешь воркфлоу. (если ты про это спрашивал)
>>1359529 Кринж это писать приколы не транслитом. Хрптьфу, никакого чувства стиля. >>1359554 30 шагов переборчик для флеша. Какой вообще смысл флешиться на таком количестве шагов? Могу только предложить скачать турбо лору поверх флеша и спустить количество шагов.
>>1359637 Спасибо. Если бы ты еще не путался в терминологии, цены бы твоим советам не было. А если бы еще и не обижался так с полтычка, то и уважаемым человеком был бы.
Почему лапша перестает грузится после того, как я я вместо мудовой структуры папок делаю линки командой mklink. Всё остается на месте, но при этом хуета просто не грузится, и ни выдает никакой ошибки. Пишет [ComfyUI-Manager] All startup tasks have been completed.
И нихуя не происходит.
Возвращаешь ублюдские папки назад - начинает грузится. В чем её проблема нахуй.
>>1359794 Потому что эти папки - часть гит репы и комфи ожидает увидеть там папки, а не линки сделанные командой mklink. extra_model_paths.yaml корне комфи лежит для этих целей. Всё остальное без проблем линкуется.
>>1359794 Ключ /D не забыл, когда делал mklink? Чтобы проверить что всё правильно сделал: пкм по сделанному линку -> "расположение файла". Должно открыться именно то, что ожидаешь. Всё работает на линках, не слушай сопляков, я сам так делаю.
Дайте плиз годный воркфлоу для комфи, чтобы убирать ватермарки с пикчей. Все что не пробовал, говно, не работает. В идеале чтобы GGUF модель использовалась, а то у меня всего 12гб врам.
>>1359794 Тупая пердоля пердолится ради пердолинга, даже не понимая что делает и почему это не работает. Почему поверхностным пердолингом занимаются только самые неумелые? Зачем они компенсируют таким образом? Не можешь даже с базовыми фичами разобраться, так не лезь, даже это не твой уровень, попустись.
>>1359612 Ну то есть пережарка и и цветные артефакты - неотъемлемая часть флеша, как не крути? Остаётся просто роллить промпты, в надежде что ван потом выправит детали. Дешёвого ускорения хромы не вышло, увы. Спасибо большое, ты сэкономил мне день.
>>1359881 Пердолинг это как раз раскладывать каждую хуйню в отдельную папку. Я этот аутизм пытаюсь наоборот привести к адекватному виду. Но программа видимо устроена так, что бы любое логичное действие пресекалось в угодно аутисту, который эту хуйню с миллионом папок придумал.
>>1359976 > цветные артефакты Вероятно да. > пережарка Зависит от того, какое значение ты вкладываешь в это слово. Обычно недожарка получается с недоденойзенными кусками, типа носа и глаз на пикрелейтед. То, что у тебя - это одновременно и обычная недожарка, и классическая пережарка (возмжно из-за промпта, если ты cfg не повышал и не используешь неподходящий сэмплер).
>>1359976 >делать выводы по обсеру рандомных криворучек Да, тяжело тебе будет по жизни. Хотя по пикчам это итак видно. Флеш генерит более гладкую и безартефачную картинку нежели полная хрома. Его даже как рефайнер можно юзать. У него совсем другие минусы. Если вы пиздоглазые, то хоть сами для себя тестите разные варианты, а не гоняйте один и тот же нерабочий пресет.
Когда Я посчу с не самой лучшей пикчей, вы смиренно закрываете ебальник, ни одного ответа, ни одного привета. Так что ебальники позакрывали и внемлите Лучшему.
>>1360027 Пость найствис1дмд2 и все плебсы просто захлебнуться в своей рвоте от осознания что они делают на своём кале 5 минут тоже самое, пока ты это как мусор сюда выкидываешь, сделав за 1 сек, но этого достаточно чтоб раскочегарить пердаки петушар.
>>1359021 Я как раз с апскейлос ебусь. Помоги а? Есть вменяемые модели для апскейлос? У меня ничего крупнее 1024 не получается сделать, и что бы я не делал при апскейле только ебучие шакалы получаются, исключение анимешники залупа, она как ни странно нормально апскейлится.
>>1360117 Смысл быть тредовским петухом? Для этого есть ты со своим манямирком. Про захлебнуться в рвоте это ты точно подметил, тупо жизнь тебе подобных организмов. Тащемта, ты сколько угодно можешь оставаться дмд-петухом, у которого другие модели 5 минут генерят, да ещё и хуже. Нормальные люди же отгенерили свои гигабайты дмд-хуйни и пересели на более высокий уровень. Они прекрасно знают, что может дмд, и сама хл во всех её комбинациях, им этого мало, они упёрлись в её возможности, пока ты застрял на туториале и второй год оправдываешься под видом, что ты просто мусор. Тебе только и остаётся срать в тред мусорными пикчами. Бескартиночный анон >>>>> серущего дмд-петуха.
>>1360163 > Они прекрасно знают, что может дмд, и сама хл во всех её комбинациях >>1357722 > Какой промпт? Если получится повторить, дмд в этом треде официально признается >>1360163 > Тебе только и остаётся срать в тред Seems legit. Шизло не осилившее даже натвиз+дмд считает себя познавшим дзен. Так и скажи, что ты криворукий однокнопочный даун, который ищет вот ту самую идеальную модель, которая даже такого долбоеба, как ты поймет и нарисует заказанное. А пока да, тебе только и остается срать в тред шизопостами. Модель, которая даже тебя поймет, еще не скоро появится.
>>1360122 Попробуй для начала на Qwen или Wan тупо сразу генернить в 2k, просто поставив разрешение повыше. Просто потому что можно. Если этого не хватит, то можешь на старых моделях делать апскейл, скорее всего там у тебя проблемы с слишком высоким денойзом.
На всякий случай сохранил для себя, чтобы в дальнейшем не искать. Советую всем скачивать на компы сборки так как хрен его знает что будет завтра может репозитории пропадут и их удалят Я просто на будущее продумываю всё заранее. Что ещё можно сохранить подскажите.
>>1360251 Мозг-то ты уже потерял, трясло. Если такие репо удалят, то значит всему пизда. Среди миллиона человек уж найдётся парочка, у которых оно осталось.
>>1360425 Генерить там можно только за баззы, которые нужно либо фармить, либо покупать. Подвоха никакого нет, кроме того, что баззы кончились - соси бибу.
Наконец-то я смог добавить новый функционал: вкладка Deforum появилась! Теперь могу генерировать видео и делать видео из фото по промтам с помощью лор. Ура, порадуйтесь за меня! Столько времени было потрачено — и не зря. С Comfy забил, теперь буду работать с Stable Diffusion не на своём железе, а на сервере. Ура, ура, ура!
Но рано радоваться: нужно проверить, работает ли эта добавленная функция, и ещё понять, как загружать свои лоры, так как Stable Diffusion запущен не на моём компе. Спасибо Илон Маск и его умному Искусственному Интеллекту. без его Искусственного Интеллекта я бы долго страдал с этим вонючим gpt от open ai.
>>1360428 >>1360425 Можно использовать сервера, которые предоставляют мощности центрального процессора или графические. Например, вот пруф — запущенная нейронка на сервере >>1360494. Не копейки не заплатил ни разу. Могу вас научить, но за это придётся платить копеечку, чтобы я рассказал, где запускать, и дал вам уже готовый и собранный Stable Diffusion с добавленной функцией генерации видео. Если захотите, могу и повозиться ещё — за отдельную плату для вас добавить новые функции на ваше усмотрение.
Всё, пока, пойду есть и тестировать новую добавленную функцию. Результаты тестовых генераций пришлю сюда.
>>1360502 >Могу вас научить, но за это придётся платить копеечку, чтобы я рассказал, Проспись малыш, это не /б загон нищенок-криворуких-говноделов побирающихся на онлайн говнораторах. Итт успешные профессионалы 40+ могут локально себе позволить всё. Ты даже не знаешь что на хагинсе к бесплатному акку дают халявный ЦП и развёртывание в 1 клик любого инференс провайдера или твоего конструктора к любой модели от ллм-ттс-до всяких генераторов картинок. Иди в /б, здесь тебе не место, нищук.
>>1360549 Нищук, запуская нейросеть на сервере, может работать так же, как и вы. Разницы особо никакой нет: ты запускаешь на своей пекарне нейросеть, нагружая своё железо, а я, не нагружая свой компьютер, запускаю на сервере. Правда, с настройками пришлось повозиться. Всё работает так же, как и у тебя, только запомни одно: я своё железо не нагружаю. Это тебе фото которое я обработал сняв трусы иди поспи дядя 40+ Я не нищи. На данный момент нет возможности купить мощный компьютер.
Как пользоваться Deforum? Стоит всё по стандарту генерирует рандом. Как с фото работать? Может нормальную лору загрузить? Этот видео ролик рандом сгенерировала
Пацаны, нужна помощь. Я абсолютный нюфаг и только-только решил вкатиться в нейрохрючево. Путем просмотра доступных лор остановился на SDXL. Генерить мне нужно всякие художественные эскизы и скетчи, и всё выходит заебись, кроме рук. Их просто пидорасит. Пробовал и негативные промпты, и эмбеддинги, пытался вкурить инпэйнтинг, но там как будто чересчур дохуя геморроя для моей задачи. У вас итт я вижу руки генерятся нормально. ЧЯДНТ?
>>1360728 Руки обычно фиксятся инпеинтом. Если твоя модель не совсем убогая древность с кривой тренировкой на каловых изображениях, то ничего сложного в этом нет.
>>1360812 Могу помочь, но не буду. Мне никто не помогает, сам ебусь с этим всем. Уже третьи сутки, может, больше настраиваю, чтобы работала генерация видео. Работать с фото умею.
Инпейнт модели не совсем то же самое что генерейт модели. Для лучших результатов нужна именно инпейнт модель. Можно смержить твою обычную модель с базовой инпейнтовой
Реквестую модели которые могут нормально генерить что-то кроме персонажей. Желательно рисовальные, типа как на базе illustrious. А то пиздос, хочу сгенерить фоновую картинку с пейзажем, архитектурой или предмет какой-нибудь, а то 60% что я пробовал насильно человека пихают в фоны и 80% не могут отдельно предмет нарисовать.
Как дифюжн модели так и лоры, среди всей этой кучи сложно найти что-то не связанное с персонажами.
Последний раз когда пробовал FLUX не вытягивало. Если что видюха 3060 12 гб и оперативы 16
>>1360883 `no humans` в позитив. `animal, pokemon, crowd` - в негатив. В идеале - с NegPip каким-нибудь, чтоб негатив сильнее работал.
Будут тебе пейзажи без людей\животных и предметы. Но учти, что люстра тренирована на буру-датасетах, и там с этим обычно все плохо. Так что ни постоянства, ни четкой геометрии ты почти не увидишь. Косяки будут почти всегда. Да и знания из-за этого довольно ограничены.
Нано-банану от гугла используй, или квен. Там с задниками и предметами намного лучше. Можно и как базу для дальнейшей обработки в люстро-моделях.
>>1360913 Промпты то понятно, я уже не первый год периодически к генерации возвращаюсь. Просто я обычно далеко за пределы своего пузыря не вылезаю. Потому и спрашиваю конкретно модели, не в курсе что происходило последние полгода.
Достоверность мне не особо важна, люстру я люблю за артистичность.
Сейчас подумал ещё через ControlNet хуярить можно. Или что сейчас у молодежи модно, что-то новое не появлялось? Но тут как раз в некоторой степени теряется артистичность и креативность, за которые я люстровские модели и обожаю.
>>1360849 Где написано что это тред для помощи? Это тред, где профессионалы 40+ могут обсуждать юзкейсы новейших решений рынка по теме, для расширения своего бизнесс-пакета.
>>1357257 >xl модели почему то не делают инпеинт. Все они делают, просто в воркфлоу должно быть больше чем Load Image > Inpaint Model Conditioning > Differential Diffusion > KSampler > Image Save.
>>1360913 Ещё забавная хуйня. При увеличении твои картинки выглядят вроде как неплохо, но при взгляде на превью ИИ прям сочится. Как на этих картинках, только детектится дженерик нейросетевая хуйня
>>1360995 АХАХАХА в голосину с нулевого долбаеба-невдупленыша последний раз объясняю: no_humans - это конкретный ТЕГ на котором модель ТРЕНИРОВАЛИ, это ОДНО СЛОВО, это сука ОТДЕЛЬНЫЙ ТОКЕН, ебана рот. no humans - это два РАЗНЫХ слова которые еще надо связать и чтобы модель это поняла, потому что на таком отрицательном промпте модели (по крайней мере картиночные до 2025) НЕ ТРЕНИРУЮТ БЛЯТЬ, вместо этого используются либо те же теги типа 1girl, либо промпт типа alone/lonely/etc, либо добавляется humans в НЕГАТИВНЫЙ ПРОМПТ НАХУЙ, так что съебался нахуй учить матчасть в перерывах между чисткой параши вилкой, сельский ты подзалупыш
>>1361010 >При увеличении твои картинки выглядят вроде как неплохо Да чистое ИИ что так, что этак. Разве что цвета хорошие получились, а как посмотришь - так сразу ИИшность и вылазит. И линии кривые, и мелкие детали убитые из-за VAE, и вся эта неэвклидова геометрия.
>>1361021 С моей точки зрения рисующего человека с любовью к импрессионизму кривые линии и низкая детализация в некоторых местах далеко не всегда убавляют визуальной ценности. Часто даже прибавляют экспрессивности если это не скилл ишуе а намеренное решение. Мой тейк был больше в том что всё кроме унитаза беглым взглядом выглядит очень дженерик
>>1361042 Люстра с тегами художников очень разнообразна, no humans, как тебе выше сказали, будет достаточно, чтобы получать только фон. Но люстра это всё ещё сдохля, поэтому понимание мира никакого. Ван/квен/флюкс с рисовальной лорой какой-нибудь будут меньше ошибок допускать
>>1361014 >>1361030 Внатуре. Если нет no_humans достаточно часто в тренировочном датасете то у модели недостаточно сильные веса последовательности токенов сформируются и вместо значения no_humans она вероятно увидит 5 токенов no; _; hu; man; s. Humans легко поймёт, потому что в обучении по-любому навалом, а привязка к no слишком слабая и вероятность что сработает намного ниже
>>1361014 Ебать ты дегенерат, конечно. Разница в размере сисек между small breasts, large breasts, gigantic breasts тебя, шизодауна, не смущает? А ведь есть еще sagging breasts, perky breasts и pointy breasts. Вот ведь засада, везде breasts, и везде оно используется без пробелов. Два разных слова, одно из которых еще и постоянно повторяется. Но надо же! Работает, сука ты тупая! Размер сисек меняет, форму тоже! Вау! no humans, no panties, no headgear, no bra и им подобные - работают по тому же принципу. Так что, имбецил с IQ хлебной корочки, слейся с темы, и не отсвечивай. Иди вон лучше сеструху свою помацай, продолжи семейный имбридинг, батя будет гордиться!
>>1361030 Забей, он уже завелся, ему сейчас признать, что облажался - это как Гитлеру в 44-м признать, что он войну просрал. Будет до последнего закусываться.
Андерскоры действительно можно использовать, но какого-то особого преимущества или лучшего понимания промпта они не дают все равно.
>>1361052 >Humans легко поймёт, потому что в обучении по-любому навалом Не в анимешных моделях, в их системе тэгов это слово почти не встречается. Отдельно так вообще практически никогда. Например, сравни эти тэги с частотой употребления no humans со скрина выше.
Все, что от хумансов осталось - какие-то ошметки базовой SDXL, где-то глубоко-глубоко. Все остальное в этих моделях было лоботомировано под систему тэгов.
>>1361032 Одно дело, когда кривые линии так задуманы и нарисованы специально. Тогда оно хорошо и уместно. Но когда нейронка пытается "сделать красиво", но из-за недостатка тренировки не может, и выдает галлюциногенный бред с пересекающимися параллельными прямыми или с мебелью из 5-го измерения - это совсем не круто. Как человека, тоже рисующего (и вообще топящего за технологии) - меня это просто дичайше раздражает.
>>1361033 А что есть манямекал? Вот мне не анимедауну сложно разницу определить. Вот я сделал пикрел, для меня это посто рандом 2д слоп напохуй. Был в треде манямедаунов, почитав их, пришёл к выводу, что это скорей не стил или жанр, а болезнь мозга, что-то среднее между зоофилией и педофилией и пидорством, где сидят скуфы 60+ и говорят от лица девочек лет 8.
>>1361141 >это скорей не стил или жанр, а болезнь мозга, что-то среднее между зоофилией и педофилией и пидорством, где сидят скуфы 60+ и говорят от лица девочек лет 8. Так и есть.
>>1361137 Из flux хз, он у меня не тянет. Да и я полгода ничего не генерил, сюда зашёл посмотреть что нового. Вот тебе несколько моих любимых. Опять же чистая вкусовщина
>>1359154 В чем шиза то, если там нет нихуя, плюс к тому еще 12+гб весят. Нахуй вы воркфоу кинули а где ваи и текст энкодеры??? Почему другие нормально оформляют, и сразу в шапке пишут вот вайка вот текст энкодер, вот база, все четко и понятно, а тут ищи хуй знает что где! В комфе еще одна нода не грузиться вообще от этих нунчак, несколько раз перезагружал, не грузиться и все тут. На стандартных нодах квен очень долго обрабатывает, но зато хоть работает.
>>1361614 RRREEEEEEEEEEEEE аноны в чате не разжевали и не положили в рот информацию находящуюся в свободном доступе и в том числе в самом блять воркфлоу как теперь жить((((((((((
>>1359154 Не, ну вообще там действительно недостаточно информации и кривовато установка сделана.
У меня пара стандартных нод без установки дополнительных инструментов с репо квена (вроде) не подтягивались почему-то. Пришлось смотреть там, как установку делать, ебаться с ней.
Плюс, уже после установки, сам нунчаку на 16 VRAM и 32 RAM в OOM вылетал, пока я в скрипте один из параметров не перезаписал вручную - это вообще гуглить пришлось.
>>1361614 >В комфе еще одна нода не грузиться вообще от этих нунчак, несколько раз перезагружал В install_wheel попробуй поставить более раннюю версию 0823, раньше помогало, хз пофиксили ли они свою парашу на latest. Игнор сломанной ноды, она мне нахуй сейчас не нужна, а если поставлю на неё зависимости, отлетят полезные ноды из других паков.
Уже больше года никто не фиксит двойной paste на русской раскладке в Comfyui. Теперь добавилась эта проблема с отсутствием copy на английской раскладке. У меня две версии: это сделано намерено или это сделано специально. Как вы теперь пользуетесь Комфи? Какой обряд надо совершать чтобы нормально всё работало?
>>1361662 Почему я думаю, что это специально? Если бы это была общая ошибка мультиязычной винды, то китайцы давно бы взревели. А так как от них тишина, то только русская раскладка виновата. Проект Комфи разделен на бэкенд и фронтэд. Нигде в их трекерах нет жалоб на такие ошибки. Я сам хз как им там описать это.
>>1361683 >>1361685 Ньюфаги штоле? Который год муссируют этот баг тут. У меня чистая 10 была, сейчас уже 11 - так же при русской включенной раскладке двойное копирование.
Как будто дежавю читаю про раскладки. >>1361662 Пытался самыми разными способами отловить порядок появления бага, чтобы можно было репродюсить, не нашёл паттерн из-за чего оно возникает. Но F5 решает проблему копирования на английской раскладке или из Win+V.
>>1361600 Я уже и h и J и D пробовал и ёпрст. Если говно это говно (комфиуи), то нихуя ты не сделаешь. Терпеть надо этот ебучий аутизм.
И главное непонятно вот нахуй это ебучее vae складывать в отдельную папку, от какой-нибудь другой хуйни. Это просто чистейший аутизм, создавать миллион папочек хуй пойми зачем.
>>1361645 Да вот именно эта хуйня в конце видео обведенная красным, вот я с ней ебался несколько часов, ну ни как не ставиться! Да и вообще не понятно почему у нунчак база квена весит 12+гб весят а у других 3+- а говорят что нунчаки быстрее.
>>1361620 Да заебало потому что комфу переустанавливать, сука почему нельзя на стандартных нодах все делать, я заебался по 5 раз на день комфу переустанавливать от того что при установке очередного пакета она просто отказывается запускаться вообще! Как же блять горит от этих 100500 пакетов от которых все крошиться! А еще эти со своим "Разберетесь как нибудь". Нашел вает от одной, клип от другой в итоге генерится какой то градиентный шум где кое как угадываются очертания промпта, почему нельзя по человечески оформить, что плохого если автор нормально оформил раздачу, не то что эти пидорасы!
>>1361699 у меня всё подобным образом работает, даже системные файлы таким образом перемещал, это явно что-то не то с настройкой комфи, один раз тоже не работало, потом вспомнил и понял что сделал не так. в крайнем случаем можно конфиг комфи отредактировать и указать на другом диске папки
>>1361711 >папки Там вроде нельзя указать одну папку общую. А только корневую папку для других папок.
В том то и дело что мне нужно поборот аутизм и вырезать на корню. Тоесть я хочу принципиально сделать одну папку, куда можно всё сгружать. ЧТо бы вообще не было никаких ебучих подпапок.
>>1361287 >>1361291 попробовал, лучше чем прежняя версия, неплохо "обводит" за более артистичными (экспрессивными) моделями, шума меньше точно, лору перса за ноги не держит, можно юзать. 1. как есть 2. с усилителями
>>1361699 А нахуй мне сдались эти ебучие vae в папке с моделями? Если бы подпапок не было, я бы создал их сам. Я думал, ты исправляешь ублюдков, которые под свои ноды создают отдельные папки по типу вот этих, вместо того, чтобы закидывать их в diffusion_models и другие. >>1361702 Какие бля 3 гигабайта. В том же меню install_wheel не помогает? Я вижу, они выпилили dev версии. Сделал uninstall > restart > latest-none-install > ... тоже получил скрытую ошибку. Пришлось вручную ставить (ну и блядь, конечно же, 3 других ноды отлетело ещё на загрузке, а часть остальных крашнется посреди воркфлоу), зато заработала qwen нунчака. Этот еблан делает uv pip install из-за которого, как оказалось, возникает ошибка, потому что он не может переписать другую зависимость во время работающего комфи. Короче решение: в среде комфи (это уже сам узнавай как зайти, вы там накачаете своих портабл-хуёртабл вместо удобного конда энвайромента), у тебя это скорей всего .venv/Scripts/Activate, написать uv или без uv pip install и ссылка, чтобы в install_wheel писалась для твоей версии торча и питона. >LoRA support is not available now but will come soon. Нахуй она такая нужна? Квен это абсолютный мусор без лор. Литературно дмд лучше. А если тянет попробовать сложные промпты, так в онлайне погенерь нахуй. И быстрей, и качественней, и та же цензура, а иногда даже меньшая если промпт способен писать. Фикс: нихуя не заработало, картинка превращается в черный квадрат после 3 шага на их дефолтном воркфлоу. Подозреваю, где-то возникает NaN и происходит это рандомно. В прошлый раз фиксилось именно даунгрейдом до старой нунчаки. Проверил на воркфлоу из ранее сгенеренной пикчи, всё равно делает черноту. В общем, оно мне нахуй не нужно, не хочу даже пробовать переставлять, за месяц так и не добавили поддержку лор, поэтому юзать есть смысл только нунчака-флакс. Привыкай, если хочешь пробовать чуть больше чем одну дээмду. Переустановлю и сделаю два комфи, один для нормальных нод, которые почему-то не конфликтуют между собой, а их десятки от ллм до аудио и видео, и одну для хорошего и крутого нунчакоговна с нужным ему торчем, всё через uv. Будут кукарекать "не знаю чё там у кого, у меня всё работает", не слушай их, это челы с полутора моделями на одной ноде.
>>1361733 >Квен >и та же цензура Хуй знает о чём ты. Квен - самая расцензуренная модель серди корпоратов. Лица только одни и те же скорбные, потому кум генерить неинтересно.
>>1361287 чем обмазывал? голая модель? >epicrealismXL_vxviiCrystalclear хорошо понимает костюм и эпоху 20s of the 20th century), New-york, Jewish quarter, detailed black long-sleeved Jewish strong dress
>>1361743 Ну, ладно, сиськи неплохие, у многих онлайн сеток даже хуже. Но мыло пиздец ебанный, блевота, текстура как на 1.4. Вот смысл такое генерить даже на нунчаке? Если ты не на нунчаке, не понимаю почему не поставишь лору, чтобы исправить это убожество. Вон, смотри какая хорошая текстура у чела ниже и разъебанная перспектива и анатомия. Артистичностью в стиле "беспорядочно набросал рандомной хуйни в кадр" не удивишь, если человек не закопался наглухо в локале и хоть раз видел какую годноту можно делать в онлайн сетках. Однако твои генерации в виде фото могут выглядеть свежо для этого треда, попробуй лоры.
>>1361782 Хотя проблема походу еще и браузерная, причем как в FF, так и в хромогах. Потому что кроме раскладки еще и хоткеи переодически по пизде идут, ноды по ctrl-b не фиолетовятся например, но работают хоткеи самого браузера по ctrl-и. Короч явно какая-то ебака с обработкой кнопок.
>>1356463 (OP) Аноны, кто-нибудь тренировал лоры для Квин? Кохая подойдёт с дефолт ыми настройками? Сколько по времени занимает? Хочу сделать лору для figma фигурок с подвижными суставами, а то выдает какой-то шлак.
А где качать базовый воркфлоу там для генерации картинки SDXL. Ну типа какой-то усредненный. Но нормальный типа. Может есть какая-то общая база этих воркфловов?
>>1361759 А есть какие то лоры общего назначения? Просто мне интереснее исследовать умную модель вширь, чем корпеть на одной и той же реалистичной 1girl картинкой. Очень не хочется чтобы эта лора ломала большую часть модели.
>>1361940 Да. Кидай паспортные данные, попробую тебе инвайт выпросить на квантовую суперпекарню за 600 баксов в минут. Та пикча всего за пару минут генерится.
>>1361795 >Китайцам видимо похуй, потому что они набирают буковы латиницей которая трансформируется в их каракули. Не, так одна проблема как раз на латинской раскладке. Не копируется нода в буфер обмена на энглише. Приходится переключаться на русский, потом копировать, потом переключать на энглишь(чтобы не вставить двойные ноды) и вставлять. То есть проблема именно на латинской раскладке с копированием нод в буфер. То есть у китайцев работает, если не жалуются.
>>1361754 >>1361743 Кстати, народ я в треде не встречал упоминаний, но вы в курсе, что для qwen-image (и edit) существует вот такая штука: https://huggingface.co/prithivMLmods/Qwen2.5-VL-Abliterated-Caption-GGUF Типа расцензуреный clip. Проверил - технически оно работает, только в текущей версии расширения ComfyUI-GGUF поломана загрузка mmproj - т.е. qwen-image-edit работать с ним не будет (только qwen-image-edit, простой qwen-image - будет). Исправить для edit правда довольно легко - если в один файл расширения залезть и добавить в списки типов моделей "clip". Сама поддержка там уже рабочая, только тип забыт. Убирает в edit цензуру, увы, не полностью, но становится явно проще жить. Если велосипед нашёл - особо не пинайте - зато сам нашёл. :)
>>1362109 Велосипед тут не причем, т.к. сама модель без писиков, одним только текст_енкодером не обойтись. 1 - qwen_2.5_vl_7b_fp8_scaled.safetensors 2 - Qwen2.5-VL-7B-Abliterated-Caption-it.Q8_0.gguf redhead young woman touching her crotch while sitting naked on a bed and smiling shyly, she has extremely thin waist exaggerated by her wide hips, diffused side lighting creating shadowplay making her pubis cast shadow on her thigh
>>1362150 При том что текст энкодер там изкоробки достаточно беззубый и легко отзывается на просьбы "теперь она без футболки топлесс, видны соски". Разницы с Abliterated не увидел особо.
>>1362109 гвен-хуен, гуфы-хуюфы, блядь столько телодвижений, стены текста, и всё это чтобы сгенерить нечто уёбищное с адовыми анатомическии проёбами, весьма близкое к сд 1.5
Неплохая вещь! Для SDXL Четкость понравилась. DMD рекомендован, но делает какую-то хуйню с лицами. Какие-то кукольные из мобильных игр про турецкого султана..
>>1361310 Если ты про фото, то не понятно о каких артефактах и цветах речь. 6 шагов. Но сделать кожу на конкретном промпте бывает задачей на флеше, лучше его для этого и не использовать, это всё-таки не крутой lightx2v или dmd2. Флеш это какой-то кал, который подсунули вместо хорошей дистилляции.
>>1362163 В каталоге комфи, идешь custom_nodes/ComfyUI-GGUF открываешь там loader.py текстовым редактором. Почти в самом начале будут три строчки с определениями моделей. Приводишь к такому виду (там только clip отсутствует): IMG_ARCH_LIST = {"flux", "sd1", "sdxl", "sd3", "aura", "hidream", "cosmos", "ltxv", "hyvid", "wan", "lumina2", "qwen_image"} TXT_ARCH_LIST = {"t5", "t5encoder", "llama", "qwen2vl", "clip"} VIS_TYPE_LIST = {"clip-vision", "clip"} Сохраняешь, запускаешь комфи. Осторожно - не добавь пробелов/табов в начале строчек - питон чувствителен к ним.
>>1362150 Не обойтись, но оно помогает тем, что с ним можно не выдумывать синонимы, а прямо писать - какие части тела и зачем - например "remove censoring bars from vagina" - чего оригинальный энкодер делал через раз в лучшем случае (или это только у меня?) Да, там этого самого с чистой моделью не будет (гладкое место будет), но саму цензуру как элемент оно уберет. А с нужной лорой - и нарисует. И просто как определение зоны - работает четче. Плюс - там же не только чисто с женским телом заморочки были. Децензорит оно в первую очередь сами понятия - их становится возможно нормально применять в промпте.
Только вкатился в генерацию картиночек после пары недель генерации минетов в ване и нужна ваша помощь. Сейчас юзаю qwen edit для i2i и он прям заебись, лицо сохраняет без изменений. Но есть существенный минус, сам квен не хочет в нюдсы, а лор для него почти нет. Думаю попробовать Flux 1D, что скажите? Он умеет полностью сохранять лицо как квен?
>>1362361 Смотря что тебе нужно. Если лицо генерить по одной картинке, то надо смотреть в сторону flux contexst, но я лично с ней особо не ковырялся. На tensor. art можно простую лору натренить за пару минут по нескольким картинкам за фришные поинты, я так и сделал, после чего просто подрубал эту лору с другими на флюксе и генерил себе с нужной персоной картиночки. Полёт нормальный, брат жив. Флюкс нравится гораздо больше квена - быстрее и вариативнее за счёт лор и прочего, что к нему комунити навертело
>>1362361 >Думаю попробовать Flux 1D, что скажите? Он умеет полностью сохранять лицо как квен? Он вообще ничего сохранять не умеет. Потому, что это другого типа модель. Тебе Flux Kontext нужен чтобы как qwen-image-edit редактировать. С ним три момента: 1. Энкодер - по сравнению с квеном сосет. Хотя в принципе тоже много чего может. Но у квена - полноценная LLM, а у того - эрзац. 2. Он тоже не может в нюдсы. Даже хуже чем квен. Однако есть потертый почти отвсюду файнтюн - redcraftCADSUpdatedJUN29_redKKingOfHearts.safetensors - вот он может. Найдешь - будет тебе счастье. Именно он - есть даже на цветке более ранние версии от этих тюнеров - не то. Но надо понимать - он рисовать (перерисовывать) может. А вот clip - этого самого все равно не знает. То самое, что дает qwen-у энкодер про который я ссылку притащил выше. Обратная ситуация получается. Расцензуренного клипа для Kontext я не встречал. 3. Если Kontext-ту на вход давать им же сгенеренную картинку (для последовательно редактирования) - падает качество каждого следующего редактирования. К шестой итерации - на выходе шлак.
>>1362361 Не слазь с ван, козленочком станешь. Ван делает охуенные фотографии быстрей остальных, обучается тоже очень хорошо, а захочешь арт, скачай noobai. Все остальное это рак. К тому же, ты можешь полностью сохранять лицо, генерируя изображения на wan.
>>1362486 Не совсем понимаю, как в ване фотки делать. Ты имеешь ввиду выдергивать нужный кадр из конечного видоса или есть какой-то рабочий воркфлоу под это?
>>1362061 Вобщем хуй знает, но с копипастом в comfy какая-то хуйня точно есть, лень искать причины, пойду лучше в хроме подегенерирую. SDXL оставил только для инпейнта короче.
>>1362516 WAN mодель не генерит видео непосредственно. Она генерит серию картинок, которые потом в видео отдельной нодой собираются. Если выставить разрешение побольше, а количество кадров - 1, будет тебе просто одна картинка. Смотреть/сохранять ее соответствующей картинкам нодой после Vae Decode, а не той, что видео собирает.
Такой вопрос. Есть sdxl лора на определенного человека. При крупных планах лицо вполне нормальное, но при отдалении в полный рост лицо искажается, что для sdxl вполне обычная вещь, насколько я помню. При использовании же face detailer, лицо теряет сходство даже на малом денойзе. Я уже все забыл, сто лет картинки не генерил, помогите. Что я должен использовать в этом случае, чтоб сохранить сходство и получить нормальное лицо? Контролнет, инпэйнт, кропэндститч?
Анончики, пара вопросов. Допустим мне нужно сгенерировать как тянка держит бутылку кваса. Как узнать какая модель лучше для этого подходит? Как среди тонны сд, флюкса, квена и вана найти то что лучше всего отвечает моим потребностям? Как сделать что бы она держала именно что я захочу, я понимаю что это условный инпейнт, а дальше куда копать?
>>1362980 > все в артефактах Че-то перемудрил с сэмплером/планировщиком. Обычно нужно сильно зумить, чтобы полосы увидеть. > кожа странная Кожу он не умеет. Делай второй проход более подходящей моделью.
>>1362912 Комфи не умеет в facedetailer. Юзай фордж и будет идеальное лицо. Выставляй настройки, чтобы был 1 или 2 шага с сильным блюром для инпейнта на дмд. Комфи выдает какой-то кал, в прочем, комфидауны хавают, им не привыкать, зато сейчас начнут кукарекать, что настройки не те. Вон, лол, прям под твоим постом безрукое чмо из палаты мер и весов пыталось сделать лицо йоханссон, результат на лицо.
>>1362912 Через лоры вообще нельзя получить нормальное лицо. Если тебе кажется что там есть сходство впринципе, то это какое-то самовнушение скорее всего.
Qwen Edit Plus
Аноним23/09/25 Втр 16:34:02№1363253430
>>1363032 судя по всему, новая модель Qwen Edit Plus должна быть лучше для сохранения или переноса лиц. Ну и еще должна работать чуть лучше при скармливании ей нескольких картинок.
Для этой версии Qwen Edit Комфи сделал отдельную ноду TextEncodeQwenImageEditPlus.
Еще, китайцы обещают каждый месяц новое обновление Квена выпускать.
>>1363222 Всегда все прекрасно работало. Лоры создавали именно то лицо, которое должно быть у персонажа. Если это нормальные лоры, конечно, а не хрен пойми как натренированное дерьмо без данных лица.
>>1363253 Сохранением лиц действительно лучше. > отдельную ноду TextEncodeQwenImageEditPlus На первый взгляд удобнее, чем самому ститчить, но подозреваю, что там под капотом такой же стич автоматический. Если больше двух картинок оно совсем теряется. Похоже оно просто скейлит следующие пики после image1 и прилепляет их справа. В большинстве случаев - это хуевый вариант, который или зашакалит главный пик, или увеличит без надобности вспомогательный пик, а заодно и время диффузинга увеличивает в три раза. Тру стори, подсунул первый пик в новую ноду - 8.71s/it, второй - 14.59s/it, третий - 30.00s/it, но на третьем всё посыпалось нахуй и получилась каша, вместо надень хуйню со второго пика на телку с первого, а хуйню с третьего пика положи в левый угол первого пика.
>>1363278 >но подозреваю, что там под капотом такой же стич автоматический. Если больше двух картинок оно совсем теряется. Не факт, совсем не факт. Есть еще один метод передачи на вход модели графической информации, чем просто две склеенные картинки. По крайне мере - для Flux Kontext точно. Это через мерж двух латентов. У меня сильное подозрение, что тут реализовано как раз оно, т.к. раньше упоминаний оного в связи с квеном не было, а техника довольно выигрышна в определенных случаях. Если нужно смержить перса и разный шмот с разных картинок, скажем - работает лучше, чем скормить склеенные картинки. Там не мешается информация о расположении исходных объектов - при мерже латента это как бы два полупрозрачных слоя друг на друге в одной картинке - модель не конфузит другой размер полотна и прочее связанное с тем, что картинок дали две. Но таких слоев много мешать нельзя - забьет весь смысл кашей. В идеале - только основная картинка и вспомогательная с нужным объектом на белом фоне.
>>1363333 > Не факт, совсем не факт. Уже проверил, запихнув стичную пикчу в первый слот. Да, там совсем другая система какая-то. Возможно как раз мержит латенты, т.к. при роллах иногда выскакивают лишние ебала со второго инпута, как раз в тех местах, где они там находятся.
>>1363222 Сиранул с этого. >>1363397 Так криворукие это комфидауны, ни один не может в хороший фейс инпейнт. Фордж это выбор тех, кому нужен результат, кто генерирует, а не компенсирует свой низкий интеллект пердолингом лапши.
>>1363572 Вместо тысячи промо-роликов уже бы сам попробовал. Понимает да, с нескольких роллов понимает, а чтобы не просто понял, но еще и не протек, нужно еще больше роллов.
уважаемые, влился недавно в локальную генерацию, работал в основном в т2и, сейчас изучаю флюкс контекст дев, вопрос такой, заливаю фотку с лицом определенного человека, но все что связано с контентом 18+ он делать не хочет. есть какие то обходы?
>>1363257 >Лоры создавали именно то лицо, которое должно быть у персонажа Значит у тебя проблема с распознаванием лиц. Может ты бурят из деревни, который белых людей только вчера увидел и они для тебя все на одно лицо. Потому что даже на цивите когда эти лоры были, даже в самих примерах люди никогда не были похожи на себя. А уж про рандомные генерации я молчу.
Такой вопрос. Я генерирую картинки с момента появления сд1.5 включая последние Ван, Квин и т.п. То есть в теме постоянно. Но в последнее время только погоняю новые модели по списку своих промптов и всё. Хочется что-то погенерить, но фантазии как-то нет совсем. О какой-либо коммерциализации речи нет, не мое это. Я хочу генерить для себя и возможно для вас. Как получить вдохновение? То есть генерить хочу, а что? В основном нравится фотореал.
>>1363872 да в том то и дело что не рисует, пробовал пихать всякие лоры с триггер словами, даже конкретика типо - full naked, nipples, pussy , visible breats не помогает, девушки либо в в купальниках либо майках) модель flux1-kontext-dev-fp8
На самом деле расписываю в нужный стиль для нлп-сеток другой сеткой, но перед этим был найден и задан стиль к которому приводить текста, + сюжет и описание всё равно делается руками головой, потом просто "форматируется"
>>1363921 Там текст енкодер неприятный. Если видит в тексте что-то отдалённо напоминающее NSFW, то отказывается любые модификации делать (при том не со 100% вероятностью). Так что исключай из промтпа всё сиськи-письки или генерерь по 4-8 картинок на промпт.
>>1363926 >мусор^мусор Можно подумать человеческий поиск промтов не генерит такой же объём мусора
>сюжет и описание всё равно делается руками головой - Проработай характеристику персонажа <девушка> <спортсменка> <Осло> <70-е>. - Выпиши пять <неожиданных и интересных> событий из её жизни за последний месяц. - Я выбираю вариант <4>. Дай подробное графическое описание этого события.
Простейший пайплайн для генерации более-менее связных и разнообразных сюжетов. Дальше полируешь его под свои нужды. Я для себя решил что крутить ручки LLM и разглядывать вариации в сто раз интереснее, чем перегенерировать раз разом одно и то же колено.
>>1362339 почему-то с аблитерейтед клипом изначальная картинка не меняется. Хотя клип q8 + mmproj fp16 положены в одну папку. Как будто клип не видит промпт, хотя ошибок нет. На стандартном клипе такого нет.
Так, заметил краем глаза вы тут про аблитерейтед говорите. Для ллм это база. Читать ваш теоретический шизобред тупорылых даунов нет никакого желания, покидайте молча сравнения картинок.
>>1363938 Это я самый, кто его в тред притащил. Покопался подольше - официально заявляю - хрень я притащил. Оно действительно что-то знает по вопросу лучше, но: 1. В qwen-image-edit почти не работает. 2. В простом qwen-image - часто страдает все остальное. 3. С лорами на NSFW не микшируется (как я ожидал). Обычный энкодер справляется лучше при их добавлении, а значит - смысла в нем и нет особо.
Извиняюсь перед тредом. Оно того не стоит, чтобы регулярно юзать.
>>1363888 >цивите когда эти лоры были, даже в самих примерах люди никогда не были похожи на себя Ну, это правда. Цивитодегенераты регулярно срали ебучим калом. Дебил заливает лору на Уотсон, самое запечённое женское ебало в старых моделях, а в примерах ебальники хуже, чем по промпту emma watson без лоры. Я просто в ахуе был с того что это лайкали. На флакс ситуация стала получше, скажи что на примерах не похожи лица? А на Wan так вообще ебанёшься как обучает. За 3к шагов, запоминает так как на 12к шагах на дмд, но без намёка на пережарку, можно повышать ещё выше степкаунт. Если ты про примеры моделей вроде третьей, тут всё ясно. И 90% была ещё хуже, десятки хуесосов, которые не нашли нормальные параметры и срали сотнями одинаково плохих лор, потому что скот хавал.
>>1363997 мимо шёл, прочитал твой пост кста, охуел с того что ты мои мысли ретранслировал. Давно хуею с долбоёбов высирающих лора со стилями и персонажами, позами и прочей хуите, которые промптятся и выглядят в (в той конкретной для которой лора похуй какая) модельке лучше, чем сама лора. А скорей долбоёбы это тупые школьники неумеющие промптить, ты пральна всё написал.
Я тот, кто спрашивал про фэйсдетайлер и лору. На самом деле я, конечно, дебил, потому что забыл воткнуть саму лору в него и втыкал только основную модель и картинку на вход. Спасибо первому анону, который надоумил. А так сразу все заработало. И сходство отличное, кстати. Выпекал, лору, если что, в ostris ai toolkit. В Kohya никогда таких не получалось.
>>1363997 двачую, я тренил лоры тян для сдхл, флюкса и вана на одном норм запромченном датасете, 3к шагов везде на сдхл лора пиздец как сильно влияла на задний план и общее окружение, а на флюксе с ваном только лицо менялось, я вообще с этого выпал.
>>1364135 Да. Я на civit обучил на 60 фотографиях. Примерно половина была фото по грудь, остальное по плечи и совсем немного по пояс. Были даже вид сбоку и в очках. От 640 до ~1024. Если были бы больше, загрузил бы больше, один хуй цена не повышается от крупных пикч. Я совсем, блядь, забыл, что можно было ещё и видео загрузить, и потом юзать даже на I2V для лучшей передачи эмоций. Но на T2I это вряд ли как-то отражается. В день можно гарантированно фармить 220 баззов. Если сделать второй фейк - то до 420 * 2, сам не пробовал, может банят за фейколайки. Если делать только базовые дейлики, то чуть больше двух недель и хватит на обучение охуенной ван лоры. Она приватная, можно скачать файлы и удалить после обучения. В авто-сгенеренных видеосемплах может быть совсем не похоже, потому что вся магия работает на lightx2v, в том числе на видео, без неё не пробовал. На этом же датасете (более чистом, ресайзнутом под xl форматы), на dmd приходилось ебенить чуть ли не 1.5 вес лоры и инпейнтить лицо, а на ван на весе 1.0 выходит лучше без манипуляций. Из их дефолтных настроек повысил только повторы, разрешение (вроде) и количество эпох. По дефолту оно безумно мало ставит. Перед автокапшенами добавил уебанский t0k3n (другое слово в таком стиле), не уверен стоило это делать или нет. Ниже настройки, что получились. Можно снизить шаги, но я бы не рисковал, лучше переобучить и взять раннюю эпоху, чем недоучить. 6 часов хуярило, аж страшно представить сколько будет локально обучаться. { "unetLR": 0.0002, "keepTokens": 0, "networkDim": 32, "numRepeats": 4, "resolution": 960, "lrScheduler": "constant", "minSnrGamma": 0, "noiseOffset": 0, "targetSteps": 4800, "enableBucket": true, "networkAlpha": 1, "optimizerType": "AdamW8Bit", "textEncoderLR": 0, "maxTrainEpochs": 20, "shuffleCaption": false, "trainBatchSize": 1, "flipAugmentation": false, "lrSchedulerNumCycles": 1 }
>>1364192 >>1364193 Если юзаю референсную пикчу и пишу, что надо забрать угол камеры из имейдж3 и применить к имейдж1, то он просто закидывает в результат после генерации имейдж3. Строка change camera angle to view from below почему-то тоже не помогает. Может из-за кфг 1, хз.
>>1364326 Да, выбираешь Video - Character и загружаешь фото и видео или только фото, оно по ходу обучения выдаёт .safetensors на каждую эпоху. Подключаешь её к wan 2.1 (не пробовал с 2.2) и генеришь хоть 1 кадр в 1920x1080 (для портретной лучше снизить высоту, чтобы не растягивало тело), хоть целое видео в 480p. Даже можешь взять реальное фото этого человека для I2V, подключить лору и получить лучше мимику, если в датасете были видео. Мне неизвестно можно ли как-то снизить стоимость, если сократить количество семпл-видео. Они нахуй не нужны, а обычно генерить видосы на цивите очень дорого, может они входят в цену.
>>1364374 Около 4к на таких настройках. Попробовал перегенерить пикчи на 12/20 эпохе, всё-таки 12 (2880 шагов) ещё недостаточно, если хочется максимальную узнаваемость. Можно пожлобиться до 4000 шагов, хз насколько это дешевле будет. >>1364379 Срочно сообщи в спортлото, что цивит предлагает всем неправильные настройки. >high-noise >все пикчи на 90% одинаковые >wan 2.1 Лол, лишь бы пиздануть. Одинаковые пикчи это итак основа Wan.
>>1364319 >Да я ее и использую, но с лорой на 8 степов и кфг 1. Видимо низкий кфг и убивает весь функционал. Ни одна лора на Qwen Edit не работает нормально с Qwen Edit Plus (2509)
>>1364588 В comfy в новом официальном workflow для qwen-edit-2509 показана загрузка лоры lighting 4-ех шаговой, и остальные параметры под нее выставлены. (предполагается загрузка fp8 scaled модели).
Я пока версию от nunchaku попробовал (у него еще ускорялок на 4/8 шагов нету) - кожа чуть получше, но все равно пластик как у старой версии, однако контроль промптом желаемых изменений - охрененный. Особенно когда пишешь что взять с какой картинки и что с этим сделать. Оно реально понимает все детали. Аж не ожидал. Но минусом тут - нужно реально ставить 40 шагов и CFG 4 если нужна большая точность. На 20 и 2.5 совсем мелкие детали уже заметно отличаются, лицо может быть несколько упрощено, и т.д.
Блядь, я не могу уже с этой хромой. В один день я её ненавижу, думаю какая же хуйня по сравнению с другими файнтюнами флакса в плане стабильности, в другой вижу какая же это мощнейшая модель и как же охуенно генерит даже на флеше. Альтернатив нет, но нужна дистилляция для комфортного пользования. А главное, когда претензии о крупных артефактах пишут на странице Хромы, их сразу минусуют и газлайтят. Ни одна другая вещь в ии-сфере не была такой сложной. Даже обучение deepfacelab моделей проще по сравнению с поиском параметров и генерацией хорошего сложного изображения на хроме. Можно сделать один промпт, можно поймать сид на другом, но постоянной уверенности в генерациях нет. Надо трайнуть генерацию композиции в какой-то креа-нунчаке или пиксельвейве и делать по результату имг2имг через хрому. Промптить придётся для двух моделей по-разному. Залупа.
>>1364853 UPD: Попробовал с fp8 scaled. 1. Лайтинг лоры 4/8 работают на fp8 версии. 2. Если выставить разрешение финального кадра где-то 1.6-1.7 мегапикселя (или тупо 1600х1600) - кожа сохраняет текстуру, ели та была. И вообще - картинка становится куда лучше. Дефолтовый workflow врет безбожно на счет нужных размеров латента на вход. Особо касается рисованных контуров. При 1-ом мегапикселе на вход-выход она их просто шакалит. А на 1.6 - вроде все очень неплохо. 3. Скорость одного шага - в точности как с nunchaku версией. (3060 12gb). Качество - такое же. С учетом лор 4/8 - в nunchaku смысла пока не вижу. 4. Модель разучилась делать из картинки/скетча имитацию фото. На такой запрос просто повторяет выданную картинку.
Итого - модель хороша но не самодостаточна. Старую удалять не стоит.
>>1364856 >делать по результату имг2имг через хрому Получается кальный кал, увы. Я пробовал. Хрома ломает структуру изображения прежде чем навалит деталей.
>>1363997 >Цивитодегенераты регулярно срали ебучим калом Дело в технологии. Если у тебя результат деградирует, от кол-ва слов в промте, то сама технология и концепция лор это говно.
>>1364973 > кожа сохраняет текстуру, ели та была От масштаба объекта зависит (пик1 и пик2 - ебло где-то на 15% меньше, а сходство в 1.5 раза меньше). Ну и чем больше промпта, тем сильнее оно кладет хуй на входной пик. > где-то 1.6-1.7 мегапикселя (или тупо 1600х1600) 1600х1600 - это 2.5 МП
>>1365166 Неплохо, как будто не из локальной. Стиль фото на любителя, но хоть так. А что с соском? Это разве не хрома? Алсо, ебло почти одинаковое, неужели на ван выжал такой фотостиль?
>>1361662 >>1361688 >>1361696 >>1361782 Сейчас поставил ради эксперимента фурифокс и уже пару дней всё нормально работает. В каких браузерах у вас были проблемы? У меня в edge.
>>1365074 Дефолтный workflow из темплейтов comfy для 2509 - он там так и подписан. Просто с размерами латетнта в нем экспериментировал.
>>1365181 >> где-то 1.6-1.7 мегапикселя (или тупо 1600х1600) >1600х1600 - это 2.5 МП Я криво написал. Там есть нода которая апскейлит/даунскейлит входную картинку перед переводом в латент - для нее 1.6 ставил. И есть другая нода - делает новый латент. В ней ставил 1600х1600 для него. Не имел в виду, что это одно и то же - просто можно юзать одно из двух.
>>1365255 Ну хуй его знает. Не то, чтобы я сильно много тестил, но выше 2 МП начинается рандом со всякой хуйней. Даже на 2.5МП уже запросто можно кронненберга поймать.