Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1343973 20 гигов врама такто у моей видеошмарты, я хз какие у вас тут сэтапы но в лохкальных языковых моделях вполне себе средненькие модели можно грузить в четвёртом кванте ток даже с приличными т\с
это врятли хоть оно и подходит по размеру эта амдпараша как то по своему работает я вобще не пынемаю вроде все эти чекпоинтсы и прочие клипы размером небольшие а всё равно получается пикрил
>>1344014 бля вот щас прочитал последнюю строчку полез смотреть и оказалось что в том квадрате где этот батч сизе там и разрешение картинки генерируемой задаётся по умолчанию 768х768 а я поменял на 512х515 после чего случился рухнум, вернул взад 768 и вуалябля
>>1344014 Вот я кстати, хуй знает. А как амудэ работает с КУДАх.. Ну я вот взял 3060 обычную, 12 гб, тыщ за тридцать в сплитик от пидорасов, конечно уже очко горит более крутую покупать, но денег нет пока.
>>1343980 >20 гигов Но у тебя амд. Тут челиксы с 4060ти 8врам на флюксе деве 8фп не кванте за минуту 20 шагов генерят и юзают кванты квена и вана лайтнинг с той же скоростью. Амд чисто для игрулек, не для ИИ.
Вот вам лист бумаги, напишите о чём думаете >короче стеклянная чайка-зингер на трёх лапах с крыльями в жопе пытается застрочить между ног малолетнюю балерину
Я вот не могу долго в голове держать образ, только малую долю секунды. А тут ты можешь хоть немного приблизиться к тому, что думаешь. А порнуху, например, со знакомыми тянками во сне ахуенно смотреть. Во сне и усиливается всё. Только просыпаешься. А тут немного приближаешься к своей сокровенной фантазии.
>>1344316 Бля, помню когда вышел флюкс, я в тот же день его фп16 дев версию юзал, которая там под 30врама жрала и меня бомбило ждать 3 минуты из-за свопа, но у тебя вообще ад какой-то пиздец.
Пик1 анрелейтед Лоры на стиль из под флакса довольно хорошо работают на хроме. Алсо, удваиваю находку анона о том, что ускорялки не портят Flash. Известная турбо-альфа очень неплохая, но я попробовал около 12 разных флаксо и хромолор и больше всего понравилась r04 из папки по ссылке, разные ранки не пробовал, просто эта была скачана. Она совсем не чинит поломанность, но зато больше всего похожа на фото. И самое главное - юзать её ровно на 6 шагах, иначе превращается в фотореалистик мусор, я гонял на heun-beta, но может есть и получше комба. Лучше чем фулловая хрома оно не сгенерит, но позволяет генерить быстро и хорошо без использования фотолор, которые хоть и сильно чинят анатомию, но меняют стилистику. Если хотите пиздец как ускориться, чисто посмотреть как промпты генерятся - euler/beta, 4 шага. Хрома даже 256x2048 генерит сносно, можно совсем упороться и уменьшить разрешение. Ещё бы нунчаку, чтобы генерить по скорости дмд... https://huggingface.co/silveroxides/Chroma-LoRA-Experiments/blob/main/hyper-low-step/Hyper-Chroma-low-step-LoRA-r04-fp32.safetensors
Ну и конечно, промпт это самое важное в хроме. Никакие настройки не спасут, если промпт генерит живопись. Автор же подаёт её не как нормальную модель, а как охуенную базу для файнтюнов, поэтому её так шатает от стиля к стилю. Показалось, что короткие промпты чаще генерят ровную анатомию, но может просто повезло несколько раз. Кому впадлу промптить - очень рекомендую скачать JoyCaption Beta One, какой-то де-промпт да сгенерит годное фото. Очень не рекомендую ггуфопарашу, она очень часто сбивается с формата. Хотя хуй знает, может то просто проёб ноды от 1038lab. BF16 работает просто идеально. Для примера, этот простой промпт почти всегда выдавал фото This photograph captures a person sitting in front of a mirror, taking a selfie with their smartphone. They have voluminous, wavy brown hair that partially covers their face, giving them a slightly mysterious look. The individual is wearing an oversized black T-shirt with a colorful graphic design on the chest, which features bold red and yellow letters. Their legs are exposed, showing off knee-high black socks with horizontal white stripes and black shoes.
У меня одного последние дни часто копирование-вставка нод уже совсем ни в какой раскладке не работает? Точней, бывает в русской вставляет что-то старое, а английская только иногда оживает. Не могу закономерность заметить.
Сап двач, я хочу вкатиться, но может кто-нибудь пояснить А есть в SD такая фича, чтобы юзать инструменты уже на загруженной картинке? типа использовать лору на пикче по ее силуэтам и тд? А не генерить с нуля
>>1344098 Господа, подскажите, с какими скоростями работает Квен? Я генерирую FHD изображение, используя Qwen image Q5_k_m на 4060ti-16 и наблюдаю, что при восьми шагах (с lightning-лорой само собой) у меня по 13-17 секунд на шаг. В целом меня результат устраивает, но если можно быстрее - хотелось бы знать, куда копать (помимо очевидных 4 шагов).
>>1345163 >На 8 шагов секунд 10 должно быть при 1024х1024 При каких условиях? Какая модель, какая видеокарта? >Купить видеокарту с VRAM, а не огрызок. Я хз, с чего у тебя так пригорело.
>>1345163 > На 8 шагов секунд 10 должно быть при 1024х1024. Долго, 5 секунд на пикчу должно быть. >>1345182 Он тебе как есть сказал - 16 гигов мало, сиди на XL.
Сейчас потратил полдня своей жизни скачивая сто версий комфикала, чтоб найти ту, где бекэнд выдавал охуенной красоты картинки, которые я делал год назад. И сука нашёл, пиздец...
Эти криворукие долбоёбы из комфикалтим не додумались добавлять в мету номер версии комфи, в которой была сделана картинка. Почему китаёз из фокуса-покуса это смог сделать, а они нет?
>>1345197 >Он тебе как есть сказал - 16 гигов мало, сиди на XL. А у вас тут дружелюбный тред, я смотрю, в котором всё, кроме 3090/4090/5090, считается огрызками.
>>1345212 Но ведь так и есть. Хочешь нейросети - запасайся VRAM. Квен самая жирная модель для генерации пикч, почти в два раза больше Флюкса, требования соответствующие.
>>1345201 >не смог >напишу ноду Причина появления 99% говнонод. Очевидно, что номер комфи совпадает с версией нод комфикора, который проставляется в мете каждой стандартной ноде. Или у тебя там весь пайплайн из одной васянки и самописных нод? Сделал реально удобно, реально ПОД СЕБЯ, да?
>>1345528 Это к чему, он дохуя долго соображает прежде чем начать генерирывать с подвисаниями, сука, системы. Или в моем ссаном корыте дело (14 ведерник на 2066 сокет и 128гб рамы ддр4), или линукс гадит, или 4080с сосет, яхз.
>>1345559 Это рефайн ваном. Сырой результат квена - вот. Лапша стандартная. Qwen Edit. Перенос стиля из картинки. Чистый qwen у меня тоже постоянно мылит.
>>1345563 Ну это смотря что ты называешь подвисаниями. Рязань 5600 + 32Gb DDR4 + 1060@12 в даунвольте. Линукс, comfy в докере, режим --lowvram. Qwen 4Q_K_M + lighhting-8steps.
Текст энкод - секунд 30. Генерация 1024x1024 - 8 сек на степ. Итого в районе 2 минут на картинку. Учитывая, что у меня там ёбаная ollama-лапша для генерации промтпа в 120 сек - меня устраивает.
>>1345565 Причём даже вставка из Win+V не работает. То есть это даже не проблема раскладки, сама функция вставки (допустим, изображения в Load Image) сломана. Перезапуск каким-то хуем чинит. Не понимаю логику. Вот сейчас опять чистый запуск - вставляет только на русской раскладке, дополнительно дублируя старые ноды, на английской ничего, даже через Win+V. Перезапустил вкладку и заработала английская раскладка. Перезапускал несколько раз, работала и дальше. Перезапускал полностью ещё несколько раз, работает как надо. Хуй поймёшь с хуя ли оно ломается. Сломан только первый запуск после ребута что ли?
>>1345788 НСФВ нет, зато есть охуенный сфв на лорах. Не понимаю ебланов, который гоняют мыльное говно базовой модели. Сам жду поддержку лор в нунчаке. Мало того, что лор нет, так ещё и после пары шагов начинает генерить черный квадрат. Как-то получалось это пофиксить, посмотрел на мыло, которого итак в треде полно, дропнул. В пизду такой квен, пусть он и лучше базового флакса. Но никто и не юзает голый флакс.
>>1345909 Квадраты? Не по дефолту. Нет желания тестить дефолт квен, глядя на то, что генерят другие и их скорости. Лучше ван и хрому подрочу лишний раз. Совсем мало генерил картинки на ван, а он прям ебёт, да ещё и быстро... ушёл на два часа тестить ван ПИЗДЕЦ КАК ЕБЁТ почти как дмд
>>1343898 (OP) А модели в гуфах например к комфе можно как то подцепить а то у меня одни safetensors только. И почему у меня кроме сд никакие модели не загружаются, по 99% загрузи выкидывает ошибки даже на самые легкие, а сд нормально хавает. Может это быть из за старого питорча и куды?
>>1346292 заявления типа ПИЗДЕЦ КАК ЕБЁТ нужно подкреплять подтверждающими картинками. пока что видно только, что ебет он глаза, причем ПИЗДЕЦ КАК, или ты именно это и хотел показать?
>>1346689 Пупок часть человека и его существование учитывается, даже если человек стоит спиной, все верно. У нейронок уже есть более глубокое понимание предметов, чем просто "что вижу о том и пою".
>>1343975 >Это ты из головы придумал? Он этим говном срёт уже джва года. Не буду разбирать срань этого унтерка по косточкам, но в базе у него спизженный из треда промпт.
>>1346704 Но если, например, добавить тег navel_piercing, нейронка уже начинает рисовать пирсниг в этой зоне на спине. Так что она таки пытается нарисовать пупок сзади
>>1346728 Даже топ нейронка банановая в мире рисует двухпупочность, например при стойке на руках. Так что не всё у них хорошо с анатомией. Она конкретную картинку не понимает, положение пупка там статистическое. Вот почему два пупка? Да потому что она рисует, потом разворачивает и снова рисует, два пупка получается.
Сегодня переустановил виндовс и теперь мой ванчик не работает! Вот такой минимальный воркфлоу сделал. Комфи чистый, без кастом нод, обновленный(пробовал и предыдущую версию). Падает без ошибок до загрузки файла. Пробовал добавлять параметры --verbose DEBUG и это ничего не показывает. Контрольная сумма SHA256 файла клипа совпадает с оригиналом. Помогите исправить. Я просто не могу нагуглить такую ошибку. Консоль просто встает на паузу без ошибок.
>>1346965 Вангую у тебя зависимости собраны под не те версии питона/торча и питон просто падает. В журнале винды можно поискать, чтоб убедиться что питон сегфолтнулся. На WSL можно было бы просто в dmesg посмотреть.
>>1346979 Питон python_embeded тот же самый был что и до переустановки. Портативная установка из архива. Новая установка с гитхаба тоже самое. >>1346982 Так же падает.
>>1346965 Если у тебя портабл версия, то должна работать вне зависимости от обновления системы, так как в портабл версии все зависимости идут вместе с сборкой, включая и питон.
>>1346985 Спроси у дипсика, описав проблемму. Он щас поумнел чёт, раньше не мог писать ноды для комфи, а щас пищет с 1го раза. Он из-за меня выучил документацию к комфи.
>>1346991 Спросил у копилота: Отсутствие необходимых файлов токенизатора Модель umt5_xxl_fp8_e4m3fn_scaled.safetensors требует файл umt5xxl.model или spiece.model для работы токенизатора.
Если этих файлов нет в директории sd1_tokenizer, ComfyUI может аварийно завершиться без логов.
💡 Решение:
Убедись, что в папке ComfyUI/comfy/sd1_tokenizer присутствует один из этих файлов.
>>1346965 У меня такую хрень выводило, когда safetensors файлы в ноде clip-а не совпадали с самой моделью по мвркировке. Если в одном файле scaled, то и другой должен быть scaled. И наоборот. Хз, возможно ересь, но у меня именно так решилось.
>>1347079 причём тут квен и веса? Это фичи бэкэндов гуев и их bvgktvtynfwbz пайплайнов к моделям. Да, в комфи есть (веса:1.4) - выделяешь слово, ctrl+вверх/вниз
>>1347079 Нет. >>1347112 причём тут бэкэнды и веса? Это фича клипа и токен аттеншена, вместо которого у квена текст энкодер. Нет, у квена нет весов - пишешь еуропеан гирл, биг бубс и сравниваешь с еуропеан гирл (биг бубс:30).
>>1347248 У меня есть. Приинпейнтил себе только что двухметровый хер на фотку с первого звонка. Получилось идеально, вообще не заметно, что инпейнт. Лучшая фотка в треде, естественно.
>>1346965 Вощем и я немного намудрил, поставил винду с нуля и комфи поставил с нуля. Оказалось дело в новых версиях питорч 2.8.0 ну или в питон 3.13. Решил так: установил комфи 0.3.48 со старой версией питорч 2.7.1 и питон 3.12 а потом обновил комфи до последней версии. Питорч и питон остались прежние, а комфи свежий. Всё работает теперь. Кто столкнётся - рецепт. 3050.
>>1347166 Неквантизировано 59 GB, это на самом деле меньше чем неквантизированный Qwen, что не удевительно так как новый Хуйнян Имаге 2.1 это 17b модель, в то время как Квен это 20b модель.
Ждем Q4_K_M кванта.
>>1347208 Не пизди, нубай это все та же архитектура SDXL, которая тупо не имеет таких возможностей. Даже при мега трейне Хромы, флюкскал показал, что не может даже близко неартефачить в разрешених, поддерживаемых тем же Ваном.
>>1347065 > HunyuanImage-2.1 В комфи завезли поддержку. Потестил, можно скипать. Скорость хорошая, но VAE просто калище, мелкая детализация хуже XL. По промтингу хуже Квена. Хуйня всегда сосала, странно было бы ожидать сейчас чего-то хорошего. Непонятно зачем они это делают, только чтоб в манятестах в абсолютно оторванных от реальности задачах циферки показать.
>>1348037 >какой-то тюн флюкса от тенсентов Вкратце это тот же флюкс дев, но со вшитым типа SPO в сдохле. Звучит интересно заявление, что улучшена выдача фотореалистика с ожидаемой эстетикой юзера в 3 раза. Ждёмс квантов, фп8, гуфов.
>>1348038 Пока ещё никто нормально оняме с реал порнухой не объединил, это всегда на диких компромиссах основано с большими жертвами. Так что нет такой универсальной модели.
>>1348037 > tencent/SRPO Ну ничё так, детализация норм, жопные подбородки и блюр на месте, но в стили умеет лучше Флюкса. Я только не понял как запустить по ихнему. Они пишут типа вместо Флюкса использовать можно, но у меня без Blaze-лоры да, 20 шагов с 4-шаговой лорой нихуя не вышло. В fp8 каша, только в fp16 работает, т.е. надо 32 гига.
Теперь, чтобы копировать ноды нужно переключаться на русскую раскладку. А чтобы сохранить воркфлоу комбинацией клавиш на английскую. Доколе так будет? Я посмотрел бегтрекер. Там один чел написал про баг с копированием нод. Его заболтал ихний бот. И тишина. Мучение.
>>1348395 Есть баг и он был во всех сомфи с момента ввода клипспейса и до сих пор. Суть рабочего варианта: переключаешься на русскую раскладку, выделяешь несколько нод, ктрл+ц, переключаешься на английскую , ктрл+V. Проебался с алгоритмом - получил не все ноды в буфер или двойную копипасту в выдаче.
>>1348775 >Глаза корявые только, и у котов по 8 лап. учись промптить негатив, нуи погугли о хайрезфиксе, некоторые картинки к этой модели работают как воркфлоу - переташи в комфи
>>1349253 Ладно еще так, у меня даже такие глаза не получаются, какие то химеры блять. как люди делают я хуй знает, уже всяко в негативе писал, но хуй там плавал.
>>1349609 На примерах у людей даже дефолтный 1,5 рисует нормально, у меня какая то хуета получается. У кота вместо лапы хвост приделан, ебало даже представлять не стоит, там пиздец месиво какое то, но все остальное заебись и травка на фоне и текстура шерсти котейки.
>>1349609 Еще какой то питдорас из видеоурока посоветовал json кинуть в окно, и всё пизда конфе, больше не открывалась, пришлось полностью сносить. Вот блять нельзя минимальный набор джентльмена, нет блять надо 100500 пакетов устанавливать, как же пичёт!
>>1349622 Я вообще comfyul запускаю не на своём железе, а на сервере который даёт мне доступ к графическому процессору Вот бы кто-то дал готовы работы воркфлоу >>1349495
>>1349701 Сервер, для того чтобы это говно работало. Мне выдают графический процессор для работы comfyul. Я 3 часа пытался установить не достоющие узлы, так как я чайник и у меня нет инструкции, у меня только AI помощник. Сама же нейронка и писала для меня скрипты.
>>1349705 На сайтах AI нет создания долгого видео ролика, ограничения - 3 секунды или 5 секунд. Хуита полная, поэтому я искал для себя способы, как запустить comfyul. Искал, у кого же можно пиздить графический процессор для своих задач, как же обходить ограничения различного рода. И в итоге нашёл, если всё настроить и сделать, я смогу пользоваться и делать AI работы при этом не нагружая своё железо, и также смогу запускать comfyul с телефона.