Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1365538 >>1365543 >>1365560 Можно считать, что у старого и нового просто разные специализации. Старый - если надо стиль картинки поменять, из скетча сделать фото, и т.д. Новый - если нужно детали поправить, и чтобы остальное не трогать. Или собрать из разных картинок целое.
>>1365560 В промпте и хуй не просят дорисовать. Запросом изменить прическу подразумевается, что хуй пририсовывать не надо, даже если в промпте нет четкого указания не добавлять хуй.
>>1365601 Я как бы имел ввиду что не арт хороший, а что так и быть, спишем этот кал за арт, мол с натяжкой имеет право итт быть. Ясное дело это понос уровня полторахи.
>>1365588 Вот кстати да. Потому что новый делает это как простостую аппликацию. Хотя на реддите показывают охуенныекартинки, но есть подозрение что это китайские боты нет, не шиза, но ты видел как они ее нахваливают?
Короче, у меня всё. Это лучшее, что я видел из фри моделей. Полная перерисовка света и текстур модели или наоборот сохранение текстуры без ухудшения качества. Контекст сосет.
>>1365764 Попроси чатгпт сочинить промт для qwen edit в стиле фильмового постера, это оттуда.
Take SOURCE_IMAGE subject and transform into a cinematic blockbuster movie poster. Subject should be centered, waist-up, looking powerful and heroic, illuminated with dramatic rim lighting. Background: epic stormy sky with lightning, glowing city skyline, and abstract energy bursts. Add metallic textures, flying sparks, and dynamic light beams around the subject. Subject integrated with cinematic color grading: teal and orange palette, high contrast, glossy finish. Add subtle motion blur streaks for energy. Place a bold movie title "{TITLE}" at the bottom in large metallic 3D letters, tagline above in smaller text. Poster ratio: vertical (2:3). Style: Hollywood blockbuster poster, ultra-detailed, dramatic, intense.
>>1365770 Лично-субъективно - Kontext еще у первого qwen-edit посасывал. Потому, что у него не полноценная LLM в энкодере как у qwen, а суррогат, который по определению на таком уровне промпт разобрать и понять не может. Качества картинки первому edit не очень завезли, но потенциал сразу был виден...
Конечно тяжеловато идут lewd тематики, но в целом понимание промпта впечатляет, жаль лоры очень медленно для этой темы пилят. Да лицо утекло, но все равно прикольно получается.
>>1366046 Так это его собственный чекпоинт. Он же знает, что за теги ему кормили и просто веса дрочит разные и смотрит, что высрется на ружу. Или это самореклама такая?
>>1366164 Если добавишь точно такие же, то практически не на сколько. Если совсем другие - то тоже почти похуй, если не нужно супер хай перформанс в играх. Сидел 2 года с двумя плашками по 8 Гб и двумя по 4 Гб с абсолютно разными таймингами - проблем не было.
>>1366323 Ну тут песпезды уни кальный шедевр, такой хуй без ии сделаешь охуел от того как ты можешь заебись чётко малаца, тупо тока ии, тупо на не зря 5090 брал ахуеть.
>>1366350 так и есть, вот уж чего не отнять, так это оно, сегодня пятёрку поставили >>1366351 ты же долбоёб так и не понял сути окунания твоего ебальника в говно
>>1366206 Я в первую очередь генерю промпты разным способом. Для этого мне надо выяснить в каком домене флеш рисует устойчивые результаты. В прикреплении лапша с промтом на генерацию ковра с птичкой, то что с ollama можешь вырезать.
>>1366323 А оно может открыть человеку глаза, но взять при этом глаза эти взять с другой фотки. Это реально постоянная боль для всяких ремесленных фотографов.
>>1366323 >Жду комменты про да я бы 5 секунд в фотошопе. Вы все забываете одно. Ваши контексты-квен-едиты не способны в мегапикселя. В настоящее разрешение, а не 1024 или чуть больше.
>>1366406 А в большинстве случаев больше и не надо. Всякие иконки, логотипы, интернет реклама. Там разрешение ещё меньше. Для печати или фотографов может быть и маловато конечно.
Посоветуйте файнтюн для изображений коммерческой направленности (ценники, логотипы, вывески, и тп) с лицензией, позволяющей бесплатное использование в коммерческих целях без уведомления.
>>1366402 >не делает Вот это хуёво. Сеть не понимает что это два изображения одного человека. Я пытался закинуть 4 разных фотки одного человека, чтобы сетка могла нарисовать один качественный кадр, но она всегда тупо брала только один вариант за основу.
>>1366406 >В настоящее разрешение, а не 1024 или чуть больше. Ни что не мешает в квене генерить FullHD. 1 мегапикселя это рекомендуемое значение для энкодера, но это не значит что на входе латента нельзя поставить разрешение выше (и даже другое соотношение сторон чем на оригинальной пикче). Просто все по дефолту тупо думают что раз под энкодер даунскейлится пикча, то и разрешение должно быть такое.
>>1366812 >>или чуть больше >FullHD >тупо думают Чел, ну ты как бы. На твоём смартфоне сколько мегапикселя? Если тебе больше больше чем фуллхд не надо, то не отвечай, выше стадо(90%) уже отписались на эту тему.
>>1366824 >И что выходит? Картинка, а что еще может выйти? Вот пример переноса персонажа в широкоформатную картинку, где мем на входе в энкодер но пустой латент в ксамплер.
Еще сделал 2048x2048 (как ставить выше в Комфи?), но на нем видно что уже сыплется.
Это еще на старом Квен Едит кста, новый еще не поставил. Жду лайтнинг под него.