Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1324284 >полный развал контекста На рекламно-агитационном материале нет ни одного поворота лица. Так что фотореалистичного character consistency можно не ждать. Инпейнт шляпы - вообще шляпа. А стилизации прикольные, видно что местами поумнее контекста.
>>1324373 Это мистер кококомпозиция, он на своей волне. У него композиция означает что-то свое, только ему известное. Он еще с сд2.1 называл хорошей композицей мыльный клосап бабы с шарп фокусом на трех разных расстояниях. Одному богу известно, что он тут под композицией имеет в виду.
>>1324415 > грейн - фу бяка, не реалистично > расплывшийся шакал, артефакт артефактом прогоняет - вооо, риализм По какому принципу ты определяешь реализм? Что у тебя вышло, то и реализм?
>>1324516 > На СДХЛ прогресс остановился напомнило шизика, который год носился с кривой базовой сдхл и рассказывал, как прогресс 1.5 остановился, а когда только начали появляться более-менее вменяемые тюны сдхл и все начали на них переходить, он внезапно решил, что сдхл - деград. что же будет еще через год, когда тюны флюкса/квена наконец допилят до юзабельных?
>>1324640 Это значит, что любое частное лицо и компания может спокойно делать деньги без отчехления или какого-либо упоминания авторов модели. Тебе дали опенсурсный инструмент, делай с ним что хочешь - те, кто тебе его дал ничего не будут спрашивать в замен.
Фактическим этим мувом они убили Black Forest Labs с их Флюхой. Им теперь остается либо сделать новую коммерчески залоченную модель лучше чем qwen, либо уйти в закат.
>>1324529 >в отсутствие правильной светотени или это у тебя руки кривые? Ван не умеет в тени, это не новость
>>1324568 >что же будет еще через год, когда тюны флюкса/квена наконец допилят до юзабельных? Лол, я на 1.5 генерил реалистичные фото, особенно с контролнетами, а теперь мне нужно год ждать тюнов, что бы запилить что-то отдаленно похожее на реальное фото
>>1324855 юзай на 1 шаг какой-нибудь маня-мешной моделью, потом в добивку на остальные 9 свою реалистик, всерху и сниху сразу появится место и нормальная поза, не будет ни обрезанной головы, ни обрезанных ног.
>>1324818 >вижу только пластиковое квеноговно уровня прошлогоднего флукса Ты уверен? Зацени текстуры которые есть в модели Wan2.2. Зацензурил так как всё равно в центре только провал, хотя очень реалистичный. The image is a photograph depicting a close-up of a woman's genital area, focusing on her vulva. She has light skin with a visible tan line and some body hair on her pubic region. Her labia minora and majora are clearly visible. A yellow and blue syringe, which appears to be partially filled, is being held by someone with their hand slightly out of frame, and the needle is inserted into her vagina. The angle of the photo is slightly from above, capturing her pelvis and upper thighs in detail. The lighting highlights the texture of her skin and the contours of her body. There is no other visible content or context outside of this intimate and explicit scene. The overall tone of the photograph is clinical yet personal due to the close-up nature and the insertion of medical equipment.
>>1324867 > столько мыла сверху Побочный эффект от самопальной CA. Каналы расходятся. То, что было одним пикселем на краях растягивается на ~3 по разным каналам, по другому и быть не может.
Ньюфажный вопрос. Есть уникальный персонаж и некоторое количество изображений с ним (~15, можно получить еще но будут похожи на те что уже есть) как сделать лору с ним? От количества настроек onetrainer я охуел. Попробовал shakkerai, получилось не очень, видимо недообучилось (10 repeat, 9 epoch) И почему в гайдах пишут что надо 50 картинок в охуительном качестве иначе будет говно, но всяким ботам в телеге и прочим сайтам которые лепят твое ебло на супермена хватает полторы фотки в шакальном качестве?
И как генерить глаза хотя бы как на 4 пике в оп посте? В большинстве случаев получается как будто наложили кучу всратых фильтров, примерно как тут >>1324733>>1324700
>>1324596 не оч понятно, хорошо это или нет. Если подавал карту глубины, то всё пошло по пизде, а если просто картинку как пример и хотел вариации, то тож немного по пизде из-за перспективы
Qwen-Image-Edit — новый инструмент для умного редактирования картинок от Qwen
Теперь можно не только генерировать изображения, но и редактировать их по команде: менять объекты, стиль, фон или даже текст прямо на картинке.
Что умеет: - ✨ Редактировать смысл и детали — можно, например, повернуть объект, сменить цвет или стиль, не трогая остальное. - 🔤 Менять текст на картинках — добавлять, убирать или редактировать надписи на китайском и английском, при этом сохраняются шрифт и стиль. - 🏆 Лучшие результаты на тестах — модель показывает топ-уровень среди открытых решений.
Как работает: Система сочетает понимание картинки (VL-модель) и точное управление структурой (VAE-кодировщик). Поэтому картинка сохраняет и смысл, и детали после правок.
Как попробовать: Достаточно открыть Qwen Chat и выбрать режим Image Editing.
>>1325313 >Qwen-Image-Edit охуенно. попробовал уже бесплатно на huggingface spaces, промпту следует сразу, не ломается через раз как контекст. всратую фотку с нулевых годов сильно улучшил. правда немного замыливает, настроек мало на HF. осталось дождаться ггуфов и воркфлоу, для полного контроля.
>>1325559 Ебало вот этого представили? Нет, раз такие требования предъявляют в треде, где месяц назад всё было засрано пластиковой анимереалистик 1вуман или просто шизой, то мы растём чересчур быстро. Это хрома. >>1324415 Как так охуенно сгенерить? Сохрани воркфлоу в webp.
>>1325568 > месяц назад всё было засрано пластиковой анимереалистик А теперь будешь засирать реализмом уровня 1.5 с контролёром и апскейлом голой моделью без денойза в экстрас автоматика?
>>1325583 > у тебя бомжа на калькулятора запускается и коупить не нужно Но ведь для 1.5 генерации и апскейла суперскейлом (или че там тогда модно было?) достаточно иметь деревянные счеты. Ты в логику совсем не умеешь или ты решил обсуждение качества перевести в бомжесрач, потому что по существу сказать нечего?
>>1325600 > Как раз не 1.5, а хрома так там качество >>1325578 > уровня 1.5 с контролёром и апскейлом голой моделью без денойза в экстрас автоматика тебе так сильно сраку разрывает от дмд, что ты готов любое говно ложкой жрать, лишь бы для его запуска нужна была карта дороже 15к рублей?
>>1325608 Ну вот об этом и говорю. Настолько копиума бахнул, что уже и хрома у него кал, и ван, и квен. Не легче ли признать, что просто ведро не тянет и оправдываешься? Ору блять, секта ебаная.
>>1325611 > копиума бахнул Не проецируй, лучше присмотрись к анатомии на объекте твоего восторга >>1325487 и осознай, что у тебя нулевые навыки понимания того, что пишет между строк твой собеседник (в большинстве случаев между строк ничего нет, даже если тебе очень сильно кажется, что есть).
>>1325624 Так сгенерируй лучше. Ну или газуй нахуй с треда реальные фотки смотреть, лол. Пока я вижу лишь свинью, которая специально выискивает недостатки. При этом сама свинка ничего не постит и продолжает безпруфно хрюкать, мол, прогресс никуда не двигается и мой 1.5 кал сделает также если не лучше.
>>1325634 кроме того, что чел стоит на своих 15см ногах, у бабы одна ягодицах в 2 раза больше другой, губы - свежезамороженное филе курицы, глаза - масляные пятна, кожа - засохший пва, ухо - прифотошопленный пельмень, волосы - кожаные ремни, ну и не стоит забывать про гигантскую бородавку на пальце под кольцом тоже мимо, не бомж
>>1325639 > Так сгенерируй лучше не могу( я вообще на пальцах считаю, т.к. бомж. а почему бы тебе не сгенерировать что-то лучше того кала на своей буратиновой карточке, вместо бескартиночных нахрюков?
>>1325646 Из объективных косяков - текстуры, да. И то корень этой проблемы в агрессивном апскейле NMKD-Siax. Остальное что ты перечисли - хуита из пальца высосанная. Мужик сидит, жопа в порядке.
>>1325313 Потестил в Комфи, ну такое себе. По инструкциям конечно годно, на голову выше контекста. Но мылище. С лайтнингоим от простого квена плохо работает, очень мылит. Без него надо 50 шагов ебашить. Смысл вообще такого.
>>1325487 Кто бы мог подумать, что такой толстенный вброс вызовет больше бурлений, особенно со стороны защитников, чем we-are-doomed, который хотя бы удачно зашакален был. Куда же мы скатились?
>>1325687 Нихуя не понял в какую сторону ты написал. Я, например, сгенерил, что-то похожее получил. Одна из лучших генераций за многие треды тут. Ну, так и очевидно почему, чел кинул же ссылку на чужую генерацию. Причем тут слово вброс?
>>1325611 никакой объём vram не сможет компенсировать твоё рукожопие, если ты даже натвис+дмд не смог осилить. твой удел - вбивать запросы в гугл и листать готовые результаты
>>1325845 Второе это без лор нароллилось? Как оно вообще работает на видеокартах, что по скоростям? Я со своими нищими 16гб даже пытаться не хочу, нунчаку до сих пор пилят под комфи.
ai-toolkit обновился с поддержкой ван 2.2, каких-то преимуществ в точности обучения, в сравнении с musubi-tuner не заметил. обидное. лоры обученные на ван 2.1 кажутся точнее в передаче черт
>>1325611 > что уже и хрома у него кал, и ван, и квен вообще-то нет. использую и хрому и квен, ван не пробовал, но ничего против не имею. кал - это тот кривой высер, от которого ты обмалафьился и кинулся защищать, попутно хрюкая что-то про секты и паля во все стороны
Еще одна неделя, еще одна модель
Аноним# OP19/08/25 Втр 20:29:44№1326141135
Ебет Flux Kontext во все щели, черный лес лабораторатории могут уже закрываться, после уходя с SD они макс смогли нам дать только одну модель, да и хуй с ними
>>1326141 Я полтора часа пердолился и не смог сделать как у китайцев на пиках. Оно мылит дико, реализма ноль. Ну собственно как у Контекста было. Про кручение предметов тоже не понял, тянку с другого угла чтоб получить надо выебнуться знатно, а не просто как они типа 3 слова пишут.
>>1326232 да не, просто у меня тут разрешение меньше, делался даунскейл nearest exact, хотя оригинал по всей видимости тоже был сделан на базовом qwen image.
Почему-то на Qwen Image могу генерить 1328x1328, но на Qwen Edit не тянет с 1.76 мегапикселя. Придется ждать нунчаку
В принципе у Qwen почти нет лимитов по разрешению, вплоть до 4k, поэтому это не совсем то, что можно считать ограничением модели.
>>1326238 Поздравляю! Тред ещё далек от завершения, но вы уже уверенный претендент на первое место в конкурсе на самую омерзительную генерацию! Так держать!
>>1326141 > QuantStack Опаньки, а у них и дистиллированный гуф есть там. >>1326232 > не осилили так же как чёрнолабые А это вообще возможно перевести в латент и обратно без потерь? Масштабирование тут не причем. Единственный вариант вырезать редактированный кусок и вставлять в оригинал, ящитаю.
>>1326269 > неактуал после релиза лоры Я её попробовал, а с ней NAG у меня не работает. А сейчас проверил, он вообще перестал работать с qwen, может после больших апдейтов в комфи, а может из-за изменений параметров запуска. И вообще, че-то она мне не очень зашла. 1 - дистил, 10 шагов. 2 - обычный с 8step лорой, 8 шагов (хуй знает, кто на пике). 3 - обычный с 4step-bf16 лорой (ну нахуй).