• Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
>>1596818 > эн гёрл Справедливости ради, стоит заметить, что он говорил эн юропиан, на основании ошибочного предположения, что нужно использовать "эн", потому что следующее слово начинается с гласной буквы. >>1596819 Нет. Это пед-фокусник, который без фотошопа инпейнтить не умеет.
>>1596910 >Выяснилось Что он был прав. Я вижу 2 стрижки под машинку buzz cut, и 2 невнятные пикси, у которых хуй пойми с которой стороны пробор, и всё на этом, ни адрерката, ни гарсона (garcon) а-ля Эмма Ватсон, ни муллет zit не знает. Даже если писать faded или shaved sides или tamples ничего не произойдёт. Zit будет рисовать девчонку с хвостом сзади и слегка mussed side strands. Существует множество коротких причёсок о которых не подозревали те, кто забивали в базу их названия и тегали картинки, а собственно откуда им знать этим задротам, они и баб то живых не видели) Самое хуёвое, что никто ничего добавлять не будет, эта модель подохнет недоделанной, тут другое в цене: сиськи-бидоны 5 размера и клоузап жопы, желательно с хуем в анусе, и всё, какие ещё пикси-хуикси?
>>1596946 >у зип есть контрлнет, возьми любую Ещё один теоретики, профессор теоретических наук вылез из своей сферической условной норы. Ты сам то пробовал этот контролнет, не...? То есть тебе достаточно знать, что он существует и по теории, якобы должен как-то работать, и этого достаточно, чтобы ты безопеляционно и с умным видом что-то апостулировал здесь. Но если бы ты хоть раз попробовал это чудо, то наверняка знал бы, что это абсолютно бесполезная хуита, легче запромтить всё заново, нежели добиться хоть какого-то сходства с референсом. Так что сиди и дальше в своём теоретическом болотце и не квакай. Я считаю, это беда треда, что здесь сидят в основной пиздабола-теоретика, как правило нихуя не умеющие, и главное не желающие что-то пробовать. А зачем собственно мараться, ведь можно просто обсирать всё вокруг и сыпать типа умными словами, ведь главное казатьсяю а не быть. Наверняка вы сталкивались с такими по жизни, у такого мудака ни кола, ни двора, но он всюду лезет со своими дебильными советами, и его хуй заткнёшь.
>>1597170 Никак, ты же сам порвался со слова "работа" до которого я сократил воркфлоу.
По конкретики с тобой говорить смысла нет ведь ты порватышь который горит по пустякам, ты не принес ни текущие настройки ни что ты пробовал в контрнете чтоб советовать чет, а просто трясешься.
Кто-нибудь пробовал или хотя бы смотрел тесты, что за Лада такая? На реддите пишут что на уровне нано бананы про и вообще прорыв - но ни примеров, нихуя нет
>>1597154 Почему у твоих фоток лук профессионального фото из плейбоя 90ых или нулевых? Уебищные оверсатурейтед цвета первого Canon 5D с камерным цветом из коробки без постпокраски. Тебе такое нравится и ты специально делаешь так или только такой лук выдает хорошее качество твоя сдхл или на чем ты это делаешь? В принципе, у тебя есть возможность сделать современный лук фотки с таким же качеством?
>>1597202 >без постпокраски да, я предпочитаю без синтетических лубрикантов и с женщинами, такой вот я... >Тебе такое нравится уже ответил. >В принципе это лора: 0.6 адрианы лимы, там другого и быть не могло в принципе
>твоя сдхл моя sdxl выглядила вот так: (см. прикрил), это >>1597154 зетка, и я бы прыгал от счастья, ели бы зетка знала и умела хотя-бы половину от того, во что умела базовая сдохля.
>>1597264 Эти и были генки по фото из гугла. Не вижу смыла отгадывать какого там ирокеза не хватило шизу с двача. Будут конкретные примеры - будем пробовать.
>>1597290 >canon 5D Это hot summer day, подразумевается полдень, sunbathing, glares on skin, это значит солнце припекает шо аж пиздец, в полдень нет места полутонам, тени жесткие без глубины , свет тоже. И никакие нд-фильтры не в состоянии выровнить такой свет полностью, по этой причине все съёмки (профессиональные) происходят утром, или на закате, кода нужно передать атмосферу.
>>1597314 Ты вообще не понимаешь о чем я да. Я говорю о камерном цвете конкретных фотоаппаратов который у тебя подтягивается видимо из доисторических датасетов нулевых, с появлением первых цифровых зеркалок. Цвет кэононов/никонов выкладываемых как есть, - тогда это был трендовый лук фотографий. Щас при том же освещении фотки будут выглядеть иначе, цвета другие, цветокор другой. У тебя ретро-фотографии по сути видимо из за специфичного датасета
Когда из коробки вместо фотореализма лезет слоп - придумаем свой термин со словом фотореализм. Не удивлюсь что маркетолог - LLM, хотя в любом случае мутит как и люди говно на блюде
>>1597330 Он такой, каким и должен быть на аналоговой камере с зажатой в точку диафрагмой, отсюда и искажение цвета (эффект затмения), когда вроде бы есть свет, да какой-то не такой. Помимо всего желтить могут лоры-слайдеры, я юзаю такую, иначе худобы не добиться, иначе у всех девок одна на всех ширококостая колхозная конституция, а мне нужна точёная барышня с балетным тельцем.
>>1597338 > на аналоговой камере Хз я вижу 100% цифровой цвет скинтона и травы. Динамический диапазон тоже цифровой. = это не аналог А сейчас что portra 400 что какой нибудь gold 200 дадут совершенно другие цвета, которые цифра не рисует
>>1597373 При сравнении я наблюдал больший генетик именно у кляйна, хотя надо просто попробовать. Там кроме самого кляйна, квеновского ллм (который у меня уже есть) и вае, нужно что-то ещё качать?
>>1597348 Это может быть из-за высокого кфг: 1.3-1.4 + желтизна слайдера, к тому Лоры персонажей тоже могут нихуёво так желтить, попробуй поднять у себя на зетке денойз и скорее всего сталкнёшся с именно такой слегка токсичной гаммой.
>>1597393 Все делается под задачу и удобства, можно тысячи кастомных модов накачать для составление рандомных промтов по кусочкам, апскейлинг можно прикрутить, инструменты берутся под задачу а не заранее - поиграй пока так с ней
>>1597325 > Правда ли, что в кляйне еблеты чересчур генериковые? Да Но в Flux2-Klein-9B-True-V2 намного лучше
Только я не понял, какие улучшающие лора с ним совместимы. Годится только для туалетных селфи и простой рэндомной хуеты с +- реалистичными ебалами и кожей. Сложные сцены со сложными деталями - рисует однобоко и на детали промта реагирует очень хуево.
Помогите понять как определять совместимость той или иной модели с лорами, как их искать, и можно ли за 1 прогон флоу, выполнять последовательно несколько генераций с разных моделей не загружая всё в одну память разом. Типа генеришь базу, отдельно генеришь детали бэкграунда, далее через edit помещаешь детали на базу. Мне надо в vram уместить разом все 3 модели, или они будут последовательно подгружаться?
Анон, подскажи, пожалуйста, хороший чекпоинт заточенный под пейзажи всякие, возможно архитектура, техногенка, постапок там, хочу обоек сделать себе, ну и чтоб красивое делать, а не красивое не делать. Захотелось погенерить что-то в этом духе, а заточенных под это чекпоинтов у меня и нет. Кое-что сделал на имеющемся инструментарии, но есть ощущение, что на профильном получится лучше(особенно если собственную скилуху поднять, но это уже совсем другая история). Да, конкретнее нужна люстра или сдохля и желательно чтобы оно на civitai имелось.
>>1597218 > без синтетических лубрикантов и с женщинами Цифроцвет это уже синтетика, причем рафинированная. Пленка исторически красила гаромнии, даже щас портра 400 близка к нейтральности но все равно красит.
,Canon eos5 это не что то натуральное, скорей безвкусный вайб нулевых
Последний раз юзал генераторы картинок когда топом считался иллюстриоус. Вышло че получше? Что по редакторам картинок? Вышло что хорошее для редактирования картинок чисто например?
Язык промтинга клейна это ублюдочная ебонина. Хуже не придумаешь. Правила которые они высрали под свои односложные примеры - их невозможно адекватно соблюдать с промтингом на 300 слов и множеством деталей. Которые еще часто игнорируются, подтягивая одинаковую хуету. Даже ЛЛМки хуево следуют этой структуре. В итоге это сводится к методу тыка и гринду отдельных описательных блоков.
>>1597726 Ну хз чел, по мне это менее шизофренично чем писать тегами.
Тут ты можешь нейронкой попросить довольно точно описать, там видел на ютубе протык делал перевод картинки в промт и уже на основе этого промта генерацию, так оно было похоже почти 1 в 1.
Точность выше, можно блоками разделить: фон, освещение, камера, объект, положение объекта и вот это вот все.
>>1597733 > Тут ты можешь нейронкой попросить довольно точно описать Нейронки говно пишут. Они не знают клейн даже с гайдом. Лепят ultra realistic 8k и советуют нег промт, если не запретить
> там видел на ютубе протык делал перевод картинки в промт и уже на основе этого промта генерацию, так оно было похоже почти 1 в 1. Удачи сгенерить картинку от новой GPT пикрил Клейн например физически не способен нарисовать даже такого уровня ФОН. Про общей effort и персонажей вообще молчу. Я даже не представляю на какой модели и что пробовать, что бы получать высокую детализацию, вариативность и при этом +- красивый не слоп. Клейн не может нихуя кроме туалетных селфи по сути
>>1597740 Ты слишком дохуя хочешь от модели которая меньше 10гб и генерит тебе пикчу за 6 секунд бля.
Не слишком ли ты охуел? Если есть деньги на жтп, очевидно лучше пользоваться ей. Любая корпоративная нейронка будет лучше локальной в 100% случаях из 100.
Аноны, поясните мне за токенизацию в SDXL. Есть один промпт, в промпте прописаны 2 персонажа, куски промпта на каждого персонажа разделены брейками, все как положено по туториалам. Элементы одежды из промпта первого персонажа в 90% генераций протекают на второго. Негативный промпт, как я понимаю, однозначно связать с позитивным индивидуально для каждого персонажа нельзя? Попробовал дать в промпт второму персонажу тот же тег с весом 0.0 - похуй, тег все также протекает. Как можно заставить нейросетку обращать на это внимание и не одевать второго персонажа в одежду первого?
>>1597747 Это не фиксится без костылей типа comfy couple, и даже с ними будет уйма проблем. Пора перетекать со сдохли на более продвинутые модели, у которых таких проблем нет.
>>1597747 > в SDXL > протекают на второго Это норма. Там древний text encoder, который всё перемешивает. Решается через древнее костыльное колдуство типа регионал промпт или подобное. Второй варинат - импейнт. Третий - просто переходном на современные модели с нормальными энкодерами.
>>1597757 >Зимага должна работать. У меня даже турбо не влезет, там один только unet весит больше, чем у меня всего RAM+VRAM на ноуте. >Анима тоже. А вот анима вроде маленькая, должна влезть. Гляну. Как у нее там с чекпоинтами, есть чё интересное или только онеме и кум генерить?
>>1597745 > Любая корпоративная нейронка будет лучше локальной в 100% случаях из 100. Я и не говорю что может быть иначе.
У меня вопрос что можно сделать на современных карманных моделях, даже если не за одну генерацию и чем угодно сложным. И это не умение работать с промтом, он упирается в стандартные паттерны которые вообще не фиксятся. На подобии проблем с короткими стрижками в другой модели
>>1597767 Очевидно нужно более сложный пайплайн и подготовительная работа.
Референсы, современные модели работают с имадж банч и можно отправлять прям кучей, обучать свои лоры, начинать генерацию на простой модели - заканчивать на сложной с кучей шагов, инпейтом исправлять кривое.
>>1597740 >Клейн например физически не способен нарисовать даже такого уровня ФОН. Про общей effort и персонажей вообще молчу. Промпт давай, сгенерю с пруфами.
Первая же попытка в ERNIE (прост потому что он в памяти был)
Cinematic hyper-realistic movie still, shot on 35mm film with deep contrast and gritty textures. The scene captures a raw, apocalyptic atmosphere characterized by a desaturated color palette of charcoal greys, ash, and burnt sienna, punctuated by the glowing orange embers of a dying city.
The focus is on a protective adult man and a frightened young girl walking hand-in-hand through a wasteland. Both characters feature striking cybernetic enhancements; their limbs are replaced by complex, weathered metallic prosthetics with visible joints, wires, and scuffs. The man wears a tattered, soot-covered dark t-shirt, his expression one of grim determination and vigilance. The girl, clutching a worn teddy bear, looks anxious, her small frame contrasting with the cold machinery of her legs.
The setting is a devastated urban environment in ruins. Crumbling skyscrapers and skeletal steel beams surround them, with distant fires casting a flicker of warm light against a heavy, smog-filled sky. The ground is a chaotic terrain of rubble, ash, and debris. The composition is a medium full-shot with a shallow depth of field, creating a cinematic bokeh effect that separates the protagonists from the oppressive background.
The lighting is dramatic and atmospheric, utilizing a "chiaroscuro" effect where the primary light sources are the surrounding fires, creating strong rim lighting on the metallic surfaces of their cybernetics. The textures are hyper-detailed, emphasizing the contrast between soft human skin, worn fabric, and the cold, hard industrial sheen of the metal. The aesthetic is a synthesis of the visceral realism of "Children of Men" and the futuristic melancholy of "Blade Runner 2049."
>>1597791 На, но делай какой хочешь промт, мне просто интересно на каком железе и модельке в принципе можно получить достойный вариант, а не залупу уровня пикрил, буквально одинаковый задник в любых промтах.
A cinematic, ultra-realistic scene of a man and a young girl standing together in a post-apocalyptic environment. Both have partially robotic bodies — their arms and legs are biomechanical, resembling advanced android prosthetics with metallic joints, exposed mechanisms, subtle wear, scratches, and faint glowing elements — but their faces are fully human, highly detailed, natural skin texture, realistic imperfections.
They are holding hands tightly. The man stands slightly in front, protective, tense posture. The girl looks frightened and vulnerable, slightly leaning toward him. In her other hand, she clutches a worn, dirty teddy bear.
The background shows a devastated city: collapsed buildings, burning ruins, distant explosions, sparks, embers, and thick volumetric smoke filling the air. Dust and debris float in the atmosphere. Occasional flashes from explosions illuminate parts of the scene.
Lighting is dark, moody, and dramatic — low-key lighting with strong contrast, cold desaturated tones mixed with warm highlights from fire and explosions. Deep shadows, rim lighting outlining silhouettes, cinematic color grading.
Shot as a film still: medium shot, eye-level angle, slightly off-center composition (rule of thirds), subtle handheld feel.
Camera: full-frame cinema camera, 35mm lens, aperture f/1.8, shallow depth of field, sharp focus on faces, background softly blurred (bokeh), ISO 800, shutter speed 1/125.
Visual effects: volumetric lighting, atmospheric haze, motion blur from drifting particles, realistic fire and smoke simulation.
Style: photorealistic, cinematic, high dynamic range, film grain, detailed textures, dramatic storytelling, dystopian mood.
Аноны, посоветуйте чекпоинт Pony с максимальным реализмом. Проблема вот в чем. 1. Pony это обязательное условие. 2. Мне нужно генерить персонажей на белом фоне, но те реалистичные Pony чекпоинты которые я пробовал через раз дают довольно контрастные изображения т.е. с сильными тенями, чтобы не ебаться с постобработкой хотелось бы такую модель которая давала бы реалистичных людей и при этом светокор был бы как в semi-real или toon то есть всё очень светлое. (Пробовал и лоры для осветления и всё что угодно с промптом, но в итоге пришел к выводу что для начала надо найти чекпоинт который дает приемлемый результат по контрасту и уже от него идти дальше)
>>1597998 На белом фоне, хочешь - не хочешь, а всё будет контрастным. Юзай: simple gray background, indoor, и тогда свет будет менее жестоким, и тень будут чуть более глубокими. В негативе можешь поставить volumetric light. Непонятно, что ты хочешь, накидкой примеров, что именно тебе надо.
Как понять с какой конкретно моделью эта лора может нормально работать? С Base или Distilled? А с finetune true v2? Пробовал с Base - на выходе такое же слоп качество base
>>1598185 >>1598255 как насчёт того, чтобы организовать торренты на основные модели, я готов войти в концессию, у меня раздача 24\7, я вроде зацепил сейчас , но думаю это не надолго, обязательно что-то пойдёт блядь не так и закачка прервётся.
>>1598265 ох уж эти теоретики... с хаггина вообще жопа, если с циви ещё как-то с горем пополам скачать иногда удаётся, то эта контора пидарасов вообще ничего скачать не даёт, залогинен ты, зареган - похуй ваще.
>>1598259 Как то можно это понимать мозгом или по метаданным файла? Вот здесь https://huggingface.co/Badnerle/FLUX.2-Klein-iPhoneStyle В описании написано "для дистилята" а в model tree указан Base родитель. Я заебался, пытаюсь что-нибудь найти, и нихера не ясно с чем это вообще должно работать, описывают от пизды всё
>>1598158 Затерян во времени, как слёзы в дожде. Думаю если грок помучить он примерно такую же еще раз выдаст, рыжих мало в датасетах, они быстрее в сеймфейс скатываются.
>>1598374 я прям вот щас долблюсь блядь в этот ёбаный red через хром, и нихуя хайти не могу, в тоже вряемы открываю лису, и ей залетаю на всех парах, что это за хуйня такая, как это понимать?
>>1598394 Тут >>1598391 1.2 другие не пробовал, но щас попробую. На 1.2 проблема с джипег артефактами серьёзная и с волосатыми лобками перебор. Не знал про апдейт, спс, щас попробую
>>1598406 >как-то так киньте мне плиз для кляйна 9Б text>image workflow, как я погляжу у флюксов всё своё в отличии от зимаги, в смысле свои особые ноды, в тамплитах нихуя нет ничего для него.
>>1598448 у меня на кляйна вообще ничего нет, я не вижу ни одного вменяемого text>image WF. в гугле почему-то только эдитовские воркфлоу, а мне нужен обычный.
>>1598387 > кляйн 9б FP8 дистил дает пластик, бедные детали и супер однобокую вариативность. Даже для унитазных тяночек не годится Под 16гб vram ничего лучше true v2 будто бы нет, всё остальное генерит слоп, которого вообще в 2026 уже не должно было быть
Дистилляты выдают очень повторяющиеся лица, промтами конечно можно фиксить но у меня фантазия не бесконечная как и заябывает постоянно к нейронке бегать.
Подумал набрать паков людей и миксить их ебала + позы а все остальное полировать промтом.
>>1598583 > У меня там нет почему-то: clip set last layer
Так можно долго гадать. Много раз писал: Если вылезают какие-то косяки, качаешь default workflow и качаешь к нему default модели, VAE, text encoder, которые идут по ссылкам к нему прямо в workflow (потому что в default workflow для ComfyUI даются ссылки на скачиванием моделей; кроме редких случаев в виде FLUX.2 [klein], где требуется прожать согласие условий на hugging face со своего аккаунта перед скачкой модели.
Если и при этом что-то не получается, начинаешь разбираться.
Смущает nvfp4, у тебя модель какая-то с квантованием FP4 и видеокарта 5000-й серии? (на прошлых сериях заведётся со штрафом на производительность, вместо выигрыша).
Анончики, не поделитесь нормальным воркфлоу на Z-Image, с FaceDetailer, загрузчиком лор и аскейлом? А то на Цивитае срань с невообразимо уёбищным UX. А ЧатХУЕТА пишет какое-то нерабочее гавно.
>>1598646 > с FaceDetailer Из impact pact возьми, если не можешь сам вырезать и вставить. > загрузчиком лор Откуда? > аскейлом Не взлетит. Больше 2048 - артефакты. С разбиванием на тайлы тоже хуево всё - тайловый контролнет хуевый совсем, грейскейл контролнет или слишком сильный и рисует лесенку, или слишком слабый и рисует субъект на каждом тайле.
Потрогал Аниму, сделал вывод, что, если её облюбуют лораделы, то это будет новый стандарт для генераций на бомжекомпах. Нахуй сдохля-то теперь нужна? Анима генерит так, что после нее нужно минимум постобработки и ебли с инпейнтингом, чтобы дропнуть неудобное/добавить недостающее. Пикрелы кроме четвертого, тут нейродебил с небом проебался, я погоду перед бурей просил можно хоть щас гнать через апскейлер и в паблик выкладывать. А на сдохле я бы полдня параметры десятки лор, сэмплеры-хуемплеры и потом еще инпейнтинг, чтоб косяки замазать.
Скорее всего в этом проблема. Какое квантование модели? FP8? Нативно FP8 только с 4000-й серии поддерживается (и только на 4000-й, потому что на 5000-й в аппаратную поддержку FP4 пошли). Я в этом точно не уверен, но FP8 на такой старой видеокарте не заведётся нормально, или будет как-то на ходу перелопачивать в FP16.
Попробуй weight_dtype: fp8_e5m2 принудительно выставить и посмотреть будет ли та же самая ошибка. Ещё другой узел Clip Loader попробовать.
>>1598678 >Вдобавок цвета пережарены. Это специально, там в промпте слово vibrant было. >Дом кривой, окна плывут. Окна плывут только на четвертой, но этот вариант я и так считают самой неудачной из генераций по моему промпту. >Для такого анима не нужна, наи-1 в точно такое же мог. Да может-то в такое же буквально любая сетка последних ~3 лет, вопрос только в количестве дрочева vs генерация из коробки.
>>1598675 Она по качеству очень сильно на сд1.5 похожа. Так что она на пограничном состоянии, понимание ближе к флаксу/зетке, а качество между сд1.5 и сдохлей. Размер модели сказывается.
>>1598679 >Скорее всего Я тоже так подумал, осталось только попробовать заново лапшу развернуть попробовать, благо бакап я сделал. Если гуглить эту проблему, то почти все случаи связаны с 5ххх линейкой, с мейнстримом такой проблемы просто нет, скорее всего жопа даже не в самой железяка, а в том, что дрова на ней не меняются по сути, и по мере взросления питона, часть железок отвалится сама собой, потому как актуальных драйверов на них уже не будет.
>>1598675 >>1598712 Поделитесь воркфлоу и как писать промты на этой модели? В частности композицию как прописывать
Одна из возможностей генерить что то качественное через едит на клейне, помимо фото тянок. На клейне такое невозможно получить для задника например. Композицию, ландшафт нереально скомпоновать, он рисует фотошоп всратый и убогий.
edit через 9b true v2 Turn this into a real world photography with natural lighting.
>>1598718 Positioned prominently on the right side of the composition, a solitary, classic white cottage with a vibrant red-tiled roof and two prominent chimneys sits precariously near the edge of a dramatic, steep, rocky cliffside. The entire right half of the frame is dominated by rolling, vibrant green hills, while the vast, turbulent ocean occupies the left side of the scene. A beautifully textured cobblestone path, composed of varied shades of grey and earthy stones, begins in the bottom right foreground and curves gracefully upward through the emerald landscape, winding its way gently toward the front door of the cottage. The foreground on the right is framed by tall, unkempt wild coastal grasses, displaying a mix of vivid yellow, tan, and rich green hues, swaying slightly in the unseen wind. Small, delicate wildflowers are sparsely scattered among the tall grass blades near the edges of the stone walkway. To the left of this grassy expanse and path, the terrain drops abruptly off a jagged, vertical cliff face composed of dark, striated rock formations that lead down to the churning water. In the left portion of the frame, the vast expanse of the ocean is captured in motion, featuring deep teal and dark blue waters churning violently against the shore. Massive, foamy white waves crash aggressively against the jagged rocks at the base of the cliff on the left side, sending explosive sprays of sea mist high into the air. Several small black birds with outstretched wings glide in the upper right quadrant of the expansive sky above the cottage. The dynamic lighting captures a dramatic weather transition. Bright, warm, golden sunlight bursts through a break in the heavy cloud cover on the far left, casting a radiant glow across the ocean surface and washing the white facade of the house in a brilliant, flattering light. Contrastingly, the upper right side of the scene is dominated by ominous, dark, charcoal-grey storm clouds gathering densely over the hills. In the distant background on the left, a heavy, semi-transparent grey rain shaft descends from the clouds directly onto the ocean horizon, creating a striking visual contrast between the radiant sunshine and the brooding storm. The light source is distinctively side-lit from the upper left, casting long, soft shadows towards the right side of the frame, emphasizing the uneven, rugged texture of the cliff face. The atmosphere evokes majestic isolation, raw natural power, and the beauty of a coastal storm. Style: Photorealistic, cinematic landscape photography, highly detailed, sharp focus.
Какая то привычка у разрабов в моделях не писать блять системные требования. Или по размеру .safetensors можно примерно определить это? Если модель весит 4.18gb - это гарантирует, что не влезит в 4gb vram и надо минимум 5-6gb?
Запустил наконец гоняться базированного Эрни. Впечатление двоякие Из негатива: - анатомия ломается так же как и на турбе - стилей побольше чем на кляйне, но сильно меньше чем на зетке. Только у кляна это компенсируется эдитом, а тут - терпи - бурятские лица подефолту. Если зетка ещё из контекст могла догадаться что я ожидаю белого человека, то эрни тебе и на картине ренессанса всех пиздоглазыми нарисует. Надо всегда наваливать национальность. Из позитива: - он нормально запекает на 20 шагах, когда зетке надо 35-50 - он лучше работает со структурами, с текстом, с расположением, с упорядоченоостью - он прямо любит здоровые промпты с детальными описанием и стартельно их упаковывает - есть определённые декоративные стили которые зетке не даются, а эрни даются. (в основном те, что связанные со структурной упорядоченностью, типа пиксельарата или иллюстрации)
>>1598856 >Или по размеру .safetensors можно примерно определить это? Изучи темку. Размер моделей, лора, контролнетов это буквально размер врам. Ясное дело ты должен пынямать как работает ОС, если врам не хватит, то будет свопаться и тут рам и ссд твоё спасение. Так-то и 20 гиговая модель может влезть на 8 врам и если у тебя 16+ озу, то сможешь жить. Нет смысла ориентироваться, просто берёшь и пробуешь.
>>1598679 >Попробуй weight_dtype: fp8_e5m2 До этого даже не доходит дело, зарубается на квене. >другой узел Clip Loader Как он называется? Вижу только один.
>>1598912 Да не, не в два раза и в целом не критично. Сейчас у меня интерес в генерации из всратых рисунков/аниме в реальные фотки. По ощущениям Realism Engine дает больше реализма, а SNOFS частенько уводит в 3D. По анатомии плюс минус равны и обе проседают в сложных сценах и позах, хотя по спецификациям должны понимать многое. Возможно это фиксится промтом, нужно дополнительно описывать сцену с тригерными словами. У меня пока простой промт типа замени рисунок реальным фото. И обе лоры решительно отказываются рисовать члены, максимум - предмет похожий на палец. ЖПП - понимают как рисовать без промта, МПХ - не понимают. Хотя казалось бы.
>>1598960 > Не, зачем, пусть чел дрочится-мучится. Хз я и просто скринам воркфлоу рад как примерам. Иначе нихуя не понятно что с чем совместимо и в принципе может работать. Фантазии и интуиции здесь не достаточно
>>1598949 > Сейчас у меня интерес в генерации из всратых рисунков/аниме в реальные фотки. Как успехи? Klein 9B true 2 не может нормально перерисовать рыб под водой никакими промтами. Только новых более скучных. Везде пока какие то тупики ебаные без вариантов
>>1598882 > Изучи темку. Размер моделей, лора, контролнетов это буквально размер врам.
Нихуя подобного. Есть ещё размер латента - собственно размер картинки, видео или аудио что генерится. И для некоторых моделей он конченный. И его нельзя свапать в рам
>>1598969 > не только face Да. SAM3 берёт текст и выдает маску. Только у меня нихуя не получилось заставить её нормально сожрать что-то типа "eyes & mouth" - выдает маску только по последнему токену, в отличие от SAM2.
Что с цветокором у Кляйна из 9-го Б?
Аноним27/04/26 Пнд 13:49:29№1599000230
>>1598639 У меня получилось завести кляйн 9Б (дистил) на своей старой кочрге (2600Super), скачал заново развернул, обновил лапшу, всё почти ок, но что за странный оттенок кожи? На втором пике странная реакция на токен: tan. Что за керратиновый ад? Ничего не выкручивал, вае стоковый.
Что с цветокором у Кляйна из 9-го Б?
Аноним27/04/26 Пнд 13:56:19№1599007231
>>1599000 причём на превью всё бьолее-менее адекватно, а вот после декодирования такая хуета, где я проёбываюсь? вокрфлоу из тамплита для 9б-дистилла.
Что с цветокором у Кляйна из 9-го Б?
Аноним27/04/26 Пнд 13:56:59№1599008232
>>1598979 В целом, удачно. Но я пока накидываю с тупым запросом: reskin this into a real photo. Просто смотрю, что получится. Забавно, что всплывают проебы анатомии у рисовак и 3Dшников с этими вообще беда
>>1599000 >tan Потому, что tan - это темная загорелая кожа Конана-Варвара уровня пикрил. А тебе даже осветлили. Проблема в том, что в русском и английском есть ньюансы в определении объектов, а гугл-транслейт это не учитывает.
В 2 edit прохода через F2K b9 true v2 с разными промтами, по 2 строчки достаточно общие без локальных указаний.
Если я найду и налажу работающий иллюстратор, у меня в теории получится на 16 гигах сделать воркфлоу с тремя генерациями: Концепт > Klein Edit > Klein Edit? Или это невозможно т.к. каждая генерация во флоу требует выделенный кусок памяти?
Если бы еще в деталях что-то докрутить можно было, может получиться уровень гпт по детализации и эстетике. Разве что не универсально по стилям. Надо LLM на входе агентно заставлять адаптировать промт под иллюстратор, и автоматически переключать разные лоры под нужный промт. Зато домашний ГПТ бы был.
>>1599196 Щас полез смотреть всё что касается кляйна и прихуел, там за эту желтизну даже никто и не парится, цветокор там ебанутый шо аж пиздец, я то привык к нормальному в зетке, а тут реально 65К оттенков жёлтого. Что-бы в ней выстроить баланс белого, я вообще незнаю как надо выебнуться! Виной тому скорее всего сырой, дебильный вае. 1. С цветокором (в холод: -1.5) 2. без цветокора 3. с цветокором и детализатором кожи: 0.6 (больший вес ломает перса) Семплер: дипипипипи_2м_sde, неплохой результат внезапно на мультистепе.
Чем вы пользуйтесь в борьбе с флюкс-кляйн-манекенами?
>>1599351 Челидзе, тот анон тебе прям с картинкой постил показывая результат. Попроси "Режим ИИ" гугла тебе промт составить скинув ему официальную страничку с рекомендациями, можно просто потоком текста описывая какая фотокамера, какой угол, какая линза, какие цвета.
>>1599289 > 3. с цветокором и детализатором кожи: 0.6 (больший вес ломает перса) > Семплер: дипипипипи_2м_sde, неплохой результат внезапно на мультистепе. подскажи че за лора для дистила и семплер слоп на 100% не убирают но неплохо
Что с цветокором у Кляйна из 9-го Б?
Аноним27/04/26 Пнд 19:18:23№1599385269
каким методом заставить любую модель уточнять и конкретизировать первичную псевдоконцептную мазню? т.е. из слопа очертаний маленьлких очертаний, делать нормальных различимый людей с анатомией, формировать правильные контуры листавы, деревьев, камня - в пределах стиля с низкой детализацией?
Когда я пробовал едит флаксом через промт уточнять силует тянки по центру - в 1mpx - что то менялось, но невнятно. Понятной адекватной позы и анатомии не появлялось. Но что самое хуевое - мелкое лицо при попытках уточнить его детали - рисовалось всегда всрато (не так как делают художники, что схематично видно что это норм лицо, просто мелкое).
Вот как? Я пока не умею делать эту хуйню через увеличение на тайлы, раздельных проход каждого и собирать обратно, если бы это вообще помогло и если это адекватно по времени. Как и увеличение - уточнение - уменьшение, тоже не представляю как именно это в воркфлоу работает. Есть еще какие то подходы?
>>1599289 > там за эту желтизну Ты цепляешь датасеты никоновского цвета, они желтят Лук твоих фото прям типично никоновская портретка. Цветокор еще ебланский Или ты втюрился в свою малявку и боишься менять промт?
>>1599412 я там специально ничего не цепляю. на моей карте вот так, у кого-то другого по другому, результат у всех будет разный.
Кажется я нашёл лекарство от желтизны, я постоянно юзаю в зимаге эту лору с малыми весами: 0.2-0.3 для борьбы с фирменной зимаговской плесенью на коже, и это работает, есть и для 9Б и она прям лечит желтизну на раз. https://civitai.red/models/1657256?modelVersionId=2707196
>>1599451 Я пытаюсь - не работает напрямую, вот как у тебя уточняет - меняет мазню, а чуть более понятную мазню, но не создает стилизованный грубый но понятный объект, который потом можно было "проявить" в реальный.
А сказать убери там и нарисуй что то своё - это слишком частный случай. На этом воркфлоу не сделать со схемой Концепт > проявка. Только если сразу концепт ровный рисовать, но тогда гибкость и универсальность снизится
>>1599456 при обработке большого полотна ничего не может быть хорошо отрисованым в таком малом масштабе, вот тебе чел подсказывает >>1599458 просто берёшь и фотошопе малюешь силуэты людей и потом деталишь с малым денойзом в импЭинте, естественно подкрепляя это промтом.
>>1599461 Это слишком ручная работа. Можно иллюстратором еще стать, рисовать скетч сразу за полчаса и мутить арт. Значит видимо нужно сразу что бы арт нормально рисовал персов с понятной анатомией и движением, иначе нихуя не выйдет. Девка с микрофоном в воздухе из сдхл особо не всралась - её уже ничего не исправит. Либо может умная Edit модель, которая может выдумывать шаблонные занятия каракулям и подтягивать всю анатомию сразу
>>1599503 расслабься, всё норм, может он и желтит, но так слабо, что похуй. >>1599508 >желтый вариант Этот? >>1599507 Бля, по моему для первого дня нормально, дальше буду ещё разбираться.
При всех плюсах, толк от этой сдхл будто бы один - копинг только с такой хуйней Потому что даже перемещая зонт в руку, вся композиция и динамика арта посыпится полюбому. Даже пробовать лень
Надо нормальный иллюстратор без мазни
Что с цветокором у Кляйна из 9-го Б?
Аноним27/04/26 Пнд 22:16:20№1599516290
>>1599512 Смысл страдать? Если у тебя мало врам, можешь ггуф кляйна 4б дистиллят взять, он там весит меньше сдохли, не медленней и точно лучше в сотни раз.
>>1599587 Даже 9б хуже. И намного. Клеин просто пластиковую хуету рисует.
Что не удивительно, т.к. сдхл еще более менее тренировали на реальных картинках. А все эти клейны уже только на нейрослопе. Будущие модели будут тренированы исключительно на нейрослопе, и будут генерировать еще больше нейрослопа, таким образом реальных картинок в интернете просто не останется. И пластмассовый мир победит.
Продолжаю эксперименты с анимой. Вместо few small critters, конечно, получился какой-то лютый слоповый пиздец, потом надо будет заинпейнтить, конечно. Но, откровенно говоря, я не ожидал, что модель, тренированная в основном на аниме и куме, так охуенно подхватит промпт wearing traditional clothes of northern peoples in red and white colors. Прям душевно получилось.
>>1599654 прогнал через ластифай. Картинка стала более фотореалистичная пластик пропал. И даже третья нога пропала. Новые модели это пластиковая деградация бай дизайн. И они будут только деградировать. Поскольку весь реальный контент будет рано или поздно замещен нейрослопом.
>>1599675 > пластиковая деградация Пластик дистила будто бы обусловлен тем же, что и в base, только чуть менее выражен. А если говорить в целом, флакс.2 явно обучен просто на более современных цифровый фотках с современной цветокоррекцией и освещением, сотбоксами и т.п. Поэтому как правило получаются эффектные сцены с красивым освещением, цветами и формами. Вот только на детали и вариативность невероятно бедные и однообразные. С файнтюном или лорамм флакс может в фотореализм как и zit, но если zit дает грязнкю картинку с не очень цветами, флакс её чистит и рисует приятный цвет. В то время как сдхл выдает лук фоток из нулевых почему то
>>1599788 >приятный цвет Ну, хз. Я вчера так наебался с этим "приятным", шо пизда. Я до сих пор не понимаю, то ли это особенность моей карточки, то ли Кляйн 9б у всех так рисует, я просто не в курсе был ужасного цветокора на этой модели, а потом полез смотреть семплы на нём на циви, и прихуел, самое смешное, что народ не видит в этом никакой проблемы, народу блядь нравится...
>>1599843 > народ не видит в этом никакой проблемы 1. Моник смени или откалибруй для начала если работаешь с цветом
2. У тебя фотка с зеленью и солнцем на фоне. Солнечный цвет, отражаясь от зелени вокруг - создает теплый рассеянный свет, который подсвечивает всё вокруг помимо прямых лучей солнца. Вот она и желтила в начале (зеленила) Потом ты это просто заруинил ручной настройкой.
>>1599901 >Моник смени Да, я вижу что красноты дохуя, не переживай ты так, просто меня так подзаебал этот жёлтый, что я уже психанул нахуй) Здесь: >>1599433 она почти безупречна, вопрос закрыт, мне НЕ нужен другой моник. Кстати, посоветуй гайд по колибровки, проверенный... >Вот она и желтила в начале (зеленила) братишь, я бывал в лесу, уверяю тебя...
>>1599901 Эта вся ваша история про оттенки напоминает аудиофилов. Когда техника перешагнула за неразличимые 22050 Гц, объективные метрики отошли на второй план и начался метафизический дроч на прогрев проводов и прочую джиттер-коррекцию.
С генерацией картинок, по всей видимости, мы в этой же стадии находимся.
>>1599955 гораздо проще послать всех нахуй и сказать, что ты так видишь, и 2 глаза на боку головы, как у пикасо это ок. >прочую джиттер-коррекцию некоторые до сих пор уверены, что цифровая запись это "единички и нолики", в то время как главное это интерприттатор этих значений, от которого зависит чуть больше чем всё) >>1599955 >про оттенки ну ты же видишь разницу между перво и второй картинкой здесь: >>1599289 Видишь, ведь правда?
>>1599955 > Эта вся ваша история про оттенки напоминает аудиофилов. Расскажешь это колористам во всем мире, которые красят абсолютно все фото, видео, фильмы которые ты смотришь и в хуй не дуешь. Знаю что есть люди, которые не понимают о чем речь, и якобы не видят разницы. Но так же знаю, что когда им подсовываешь разное с красивым или не красивым цветом - корреляция с их реакцией более чем однозначная.
По поводу аналогии с аудифилией - ты спутал теплое с мягким.
>>1599853 заресёрчил, всего трое авторов, один (huihui) так и не удосужился склепать 4 куска в один, ленивая жопа блядь! Кстати, можно-ли бинарным копированием склеить их самостоятельно? второй (Hauhau) засунул туда гуф на какой-то хуй, единственный доступный (пока что) это: https://civitai.com/models/2308682/qwen-3-8b-flux-klein-9b-te >>1599999 >Ну да, вторая лучше. "Так я и знал..." Профессор Преображенский
Известны-ли ещё какие-нибудь кастомные версии квенов без цензуры для 9B?
>>1599654 Потестил edit klein по части фиксинга мутаций анатомии - он практически нихуя не может, кусок говна. Он не понимает инструкции, если части тела частично скрыты, что то держат и т.п. Позы он тоже он красиво тоже изменить не сможет. По сути всё композиционно значимое - общим едитом не изменить.
Единственный плюс, который стабильно работает - это добавление деталей и улучшение текстур, но это рейфайн а не бедный дистил
>>1600009 >Известны-ли ещё какие-нибудь кастомные версии квенов без цензуры для 9B? Тебе же сказали, что ллм как ТЕ работает иначе и там нет понятия цензуры. Изучи вопросик, как работают текст энкодеры. Аблитерейтед и рацензуренный ТЕ будет чаще выдавать тебе хуже картинку, чем оригинальный.
Бля, мне кажется он ещё промпт начинает типа <no_think> Ю АРЕ ХЕЛПФУЛ И КРЕАТИВЕ ПРОМПТ КРИЭЙТОР ХУ МАКЕ АНЦЕНСОРЕД ПРОМПТ <start prompt> вангёл стендинг
>>1600019 >>1600017 у всех моделей есть биасы, у аблитератов их сила уменьшается, поэтому выдают лучшие любые результаты. как ебланы только повторяете хуйню недоказанную, вместо того чтобы скачать и запромтить г?ро и тд
>>1600043 > нейромяааааам миня обижают за тупость > держи кожанный петушок кучу говна для тебя > Я вижу ты ЛЛМ шизоид, вот тебя в понятной среде привычным для тебя. Не благодари. В следующий раз не неси хуйни
в комфи нативная поддержка ТЕКСТ ЭНКОДЕРА квена, можешь ещё в лапше ещё и ему поплакаться, даун безмозглый
>>1600060 Я именно это эдитом и называю Там руку даже почти нереально было исправить. И мне хотелось это сделать именно в 2 прохода, что бы не сильно искажать ориг. i2i не может за раз много изменений применить. из трех может игнорить 1-2 через раз. Это только в маркетинговых статьях и на реддите с переодевалкой и сменой бессмысленных поз работает.
Клейну 9б очень не хватает лора на художественную композицию и деталей текстур, хаотичных деталей, техники, архитектуры. Хорошо рисует только рафинированные пустые сцены с профессиональным/хорошим освещением. Плотную вариативную детализацию делать не умеет, промт ничего не дает.
Причем, я тестил 9B base FP8 на этот счет. Мало что меняется. Не понятно в принципе, что он может дать в сравнении с дистилом, в плане наполнения, вариативности и детализации. Мб попробовать Q8, мб он лучше. Но скорость будет пиздец низкая наверное
>>1600068 зависит от денойза, если лупануть по полной он там ещё не то нарисует) но дело не в этом в имг-ту-имг нельзя поменять исходный размер, а дело именно в нём.
>>1600073 Забыл добавить: клейн композицию сам не умеет строить. А когда прописать все детали в промте невозможно. Выше был пример с домиком на побережье на скале от Anima. Gemini pro описала промт по этой картинке - и кляйн стабильно рисовал всратое убожество. И не получится красивее уточнить, если моделька сама не понимает композицию. Значит композицию надо строить другой моделью, а клейн только на эдит в нужный стиль, детали, включая фотореализм.
>>1600077 > лора детализатор + лора с худ стилем, или тебе шашечки нужны? А где я высру? Научи меня, я неделю в теме, захожу на hugging face или civitai смотрю связанные адаптеры-файнтюны и там нихуя нет того, о чем я говорю. Есть только 1 файнтюн который улучшает глобальный текстуринг до адекватно реалистичного и всё. Остальное всё спец. лоры для узконаправленного стиля, и их не так много.
Что мне искать если определить что совместимо с клейн моделью а что нет не понятно. Я могу только на связи huggingface полагаться
>>1600075 > в имг-ту-имг нельзя поменять исходный размер Почему нельзя? В этой ноде можно указывать мегапиксели. Я вот только не понял, как сохранять исходный размер фотки, ручной установки. У меня не понятно откуда подгруженный Edit воркфлоу, возможно корявый
>>1600093 чел, я только вчера начал ковырять, и ничего сложнее чем ван гёл, кэжуал дресс не делал, но даже с не й всё ок по моему. знаешь кто не умел в композицию, это пони бля, вот там да...
>>1600080 > сомневаюсь Сам попробуй или скинь промт с учетом klein промтинг rules сюда Всё что делают в клейне - если обратить внимание - это тянет на тестовый слоп разного поклепа. Стоит захотеть получить завершенную эстетичную работу - начинется хуйня. Это даже если закрыть глаза на всратые ногти на руках и слоп на мелких лицах.
>>1600118 >Стариков выжили они сами исчесзли с радаров, деменция коварная сука, не щадит никого) >>1600107 у тебя референс картинка выступает в качестве пустого латента, ты не можешь поменять стороны, вернее можешь, но это не сработает, попробуй сам...
>>1600075 > а дело именно в нём. Что это меняет? В конце концов соотношение сторон можно менять в исходной генерации. Но что это мне даст? Если хочется генерить в 16:9 например (буквально самый распространенный формат моников сейчас), зачем мне его менять?
>>1600125 >зачем мне его менять? у тебя длиннотян в виде мотоцикла, отсюда разъёб. елси бы автор с самого начала обкашлял размеры этого самого мотоцикла и сделал бы композицию центричной, то возможно (но не точно), этого можно было избежать.
>>1600128 А, ты об этом. Ну звучит как частный костыль и подгонка под результат. Проще через промт или генерации получить нормальный байк. С любым кадром, уйдет одна проблема - возникнет другая. Если модель рисует так байки, кривые руки, ноги и лица - то это будет всегда, и аспект рейт кадра ничего не изменит. С композицей тоже: под любой кадр можно выстроить свою хорошую композицию. Если модель это делает плохо сама, то это не исправить даже промтом.
>>1600137 > аспект рейт кадра ничего не изменит. ох не скажи, не скажи... Я ещё эдитом не занимался, но у меня дохуя недоделанных в сдохле референсов, которы я могу лишь частично подправить в фотошопе, если хочешь могу поделиться)
Пикрел кляйн 9б дистилл, первый сид, не ролил. Уже по сигарете видно, что это модель 2026 года. Хз, может ЗИТ и может в держание сигареты, но сомнения насчёт правильного пепла на ней с огоньком и дымом из нужного места
>>1600162 там еще мое будет, не все так плохо. Плюс мб гуфы будут. А так выглядит интересно, у неё еще ризонинг есть, можно будет генерировать комнату без слонов.
>>1600158 Вангую клейн без нормального файнтюна / лор будет угадываться по унылому паттерну хаоса в заднике и хорошему освещению.
Так это и работает. Промты описывающие простые и случайные фотки в шаблонных местах могут хорошо работать. Клейн действительно хорош, в создании бытовых фотографий или бюджетных студийных фотографий. Очень хорошо следует промту (не хуже ГПТ генератора) надевает/переодевает одежду и сразу рисует красивый свет и цвет (в отличие от зита).
Но стоит попробовать не шаблонный креатив - бах, хуйня. Надо проверять идею воркфлоу с 1-2 еdit прогонами на детали/реализм, возможно получится заебись. Вот только как заставить клейн НЕ городить паттерны в хаотичных структурах, фракция я не представляю.
ГПТ (пик) кстати думала до 2-3 минут. Учитывая, что это датацентр, пусть и с ограничением выделенной мощности - навевает на мысли, что воркфлоу за 20сек на клейне надо дорабатывать, что бы получать что то продвинутое.
>>1600223 > А что это такое? Например, 2 не стандартных персонажа на фоне не стандартной ситуации, окружения. То есть не просто люди в какой то одежде в привычной местности.
Для примера разница в готке-азиатке не сильная, в основном в микро-деталях, сложности паттернов, и эмоции/эспрессии - которую вероятно сам агент ГПТ дописывает. - Просто потому что сцена не креативная, простая.
А вот в сцене с разрушенным мегаполисом с челиками с кибер-руками начинается пиздец - а это чистый синтез идей, не какой то ориг. концепт. Кибер руки были, апокалипсис и массивные разрушения были. Но клейн видимо обучался на бытовой, фешн, pro реальной фотографии, либо у него какие то защиты на деструктивную генерацию есть. Я пробовал овер дохуя модификаций для описания задника в деталях, освещения сцены и ракурсов, постановки кадра. Он не смог нарисовать калоритную, разнообразную разруху. Плохо реагировал на постановку кадра. Только недостройки с огоньками и copy-paste кучки с бетоном. Я даже пытался генерить отдельно лендскейп разрушенного мегаполиса с масштабными разрушениями. Возможно я зациклился на каких то ключевых словах, которые цепляли одну и ту же хуйню, но в итоге забил. Промт для сцены выше в треде скидывал тут >>1597835 2 скрина из клейна уже в других промтах - я просто выбрал то что мне больше приглянулись, но я хочу
>>1600257 > Тред локальной генерации И че теперь я не могу сравнивать и оценивать результаты с условным эталоном, не должен обращать внимание на проблемы? Когда смотришь только на 1гил стендинги реалистичные, доступные теперь из коробки - проблем не заметно. Только кого они интересно не заебали. Здесь по сути даже с ними ничего интересного уже не постят. Так что всё нормально я делаю.
Куда делись мастера сдхл, когда нужна помощь что бы раскрыть потенциал того же клейна на максимум, что бы воркфлоу загружал машину на 1-2 минуты и получал хоть что то лучше 1 проходной хуйни
>>1600272 > че теперь я не могу сравнивать и оценивать результаты с условным эталоном Сравнивай у себя в голове. Нам какая польза тут от этого сравнения?
Подскажите кто знает, можно ли замутить импровизированного агента в воркфлоу, как предпроцессор промта:
В load clip вроде как уже загружается llm Можно эту llm в воркфлоу запрячь работать на обработку user-промта, отдельными шагами/нодами перед отправкой в guider, не поднимая сервак с api отдельно?
Если это возможно, мне бы помог хотя бы даже скрин фрагмента воркфлоу, как это выглядит, с какими нодами.
Конкретней что я хочу: User promt > [UserPrompt + системный промт] > LLM > Clip Text Encode > далее как обычно
Системный промт для начала фиксированный в духе "Переведи на ENG, адаптируй под promt rules. В ответе отдай только чистый промт. UserPrompt: {}". - И что бы его можно было редактировать
>>1600285 > Нам какая польза Кому нам? ты там один у себя сидишь. Меня вообще мало волнует какая тебе польза от постов на дваче. Можешь съебаться если не нравится. Ну или проспись
> Тред локальной генерации Всё сказанное в контексте локальной генерации, специально для тебя пересказывать суть не буду
Че вы спорите про реализм, нужно больше разных картинок и стилей. У молодого поколения насчет реализма полный пиздец в башке, сейчас ведь кино нормально снять не могут, хуйня какая-то пластиковая - см. Грешники например, смотришь и хуй его знает, поезд кажется нарисованным, потому что всё какое-то генеренно-отпидоренное на компе. Не сравнить с тем временем, когда сука съемки переносили, потому что свет не тот. Любое кино почти смотришь 80-х 90-х - там улица выглядит как улица настоящая, а не как ебучий фотошоп непойми чего, ни света естественного, ни хуя. Так что дегенератов не надо слушать, нуно свое ебашить и срать на всех, я считаю.
>>1600121 так я постоянно в мегапикселях и ебашу, трансформеру поебать на соотношение сторон, а ноды не позволят ебануть не кратное х количество пикселей и сами округляют
>>1600426 ты не понял, допустим у тебя референс 19х6 (вертикалка) и результаты будут только такие, даже если где-то там ты пставишь 6х19, я просто говорю что исходное соотношение сторон приоритетней. и оно всегда будет как у референса, на то он и референс.
>>1600407 Да я в общем не против чтоб снимали, но не надо ВСЁ снимать одинаково, это ж пиздец. Тут недавно пересматривал Молчание ягнят - просто охуел от картинки. Понятно, что процесс уже необратим и никто на натуре дрочить неделями не будет в ожидании правильного света, но имхо постпродакшен какой-то уебищный в итоге, даже не пытаются сделать как-то разнообразно, пресетами хуячат наверное.
>>1597895 Мне вот эти нравятся, но есть некоторая тупка логическая + на второй сигарета в бокал влезает вроде.
>>1597828 А вот тут уже что я называю хуй проссышь, скрин из игры или кадр из фильма, но если кадр из фильма то понятно что 99% фотошоп. Алсо у телочки как будто наколенники такие налеплены.
>>1597154 Тоже збс. Глянец такой типа, но не переходит грань ультрареалистичности.
snofs для кляйна
Аноним28/04/26 Втр 23:44:23№1600526423
более бесполезной и беспомощной хуиты я в жизни не видывал, от референсов за версту воняет поней, всё становится настолько too cartoonish что хочется проблеваться. да и собственно сам кляйн тоже раочаровал, у меня на него были большие планы, но весь его гипер-реализм очень легко слетает как шелуха, стоить начать промтить что-то чуть сложнее: э гёл, кэжуэл дресс
>>1600526 Что-то я последнее время устал от всего этого. Борьба против пластика и нейрослопа в попытке получить что-то отличное от демо-promptов довольно утомительна, а результаты оставляют желать лучшего.
>>1599948 > Кстати, посоветуй гайд по колибровки, проверенный... Софт DisplayCal. Его нередко использовали в обзор/тестах мониторов, там описано как юзать, проще чем comfy ui Калибратор могу посоветовать только x-rite i1 display pro, эту модель уже 15+ лет выпускают с модификациями
Без калибратора моник на глаз не откалибровать и профиль не создать. Это невозможно или бесполезно
>>1600526 Если фотку с пиздой прогнать edit любым клейном с цензурой - то замажет всё? То есть едитить надо только с nsfw? Вроде выкладывали же гипереализм с пиздой выше годный, значит норм текстурки либо лора какая то нужна или сэмплер другой, про который я слышал дважды res2 или что то подобное.
>>1600526 Ты пробовал файнтюн true v2 + snoffs? Это можно как минимум в edit использовать для второго прохода, он автоматически текстурки подтягивает, даже если добавить стакан на столе. Я только не знаю совместимы ли они Если к этому еще найти хоть что то, улучшающее текстурку / свет в реализм, и проходиться edit то в теории можно получить топчик
>>1600703 >то замажет всё? Ничего не замажет, честно преобразует как любой другой незнакомый предмет. Но с артефактами небольшим, да. Как будто это не пизда, а трусы с принтом пизды.
>>1600706 Есть дитейлер неплохой, я о нём писал в этом треде, отмотай чуть кверху, но он деталит всё, кроме кожи человека) А кожа в кляйна говняная, я ещё до Эдита не добрался, и не знаю как делать второй проход. Подскажи какой шаблон использовать из лапши? Я хотел на нём задеталить, вдохнуть новую жизнь в заброшенные долгострои на сдохле, которые я забросил, ибо нет уже сил бороться с корявостью и хуёвой анатомией, уже ничто не спасает, даже Фотошоп с марионеточной деформацией.
>>1600703 >То есть едитить надо только с nsfw? Да, с весом 0.6-0.8, тогда хотя бы пизду относительно нормально рисует, но не хуй, с этим традиционно беда-беда) То есть уже имея одну nsfw-лору тебе ещё нужно лоры хуя подтягивать, какая из них лучше подходит на конкретный случай, сука это вымораживает! Нахуя тогда этот сновс ебаныйж если он хуй нормально нарисовать не может? Для хуя в жопе по прежнему нужно расчехлять фокус с какой-нибудь топ-реалистик поней. Концептов с еблей на пальцах одной руки хватит, очень убого всё, для зетки и то больше.
>>1600831 Да. Выход, вангёрлов без снофсов генерить а деталит с маской иначе это уёбищё всё засрёт кругом своим словом. Блядь почему этот сновс так расхайпован, что в нём уникального? Берёшь лубую Лору с еблей и у тебя с весом: 0.2 уже будет нормальная пизда.
>>1600838 >текстурой? С сидячей наездницей вроде нихуя так, она там лицом к зрителю, так что пизда будет нормально отрисовываться с относительно небольшим весом.
>>1600580 Если ты борешься с промтом - то это борьба с ветряными мельницами. Я обратил внимание, что хорошие фантазии ограничены семи-риалом или CGI-style даже в корп генерациях, но они рисуют их красиво. То есть это проблема не только локальных кляйнов. Так что на выбор сейчас два направления: - Жертвуя фантазией, выжимать хоть какую то идею в шаблонных простых декорациях ради фотореализма - Реализовывать фантазию и работать над деталями и сочностью, но с неминуемым сваливанием в semi real. Художественность может затащить и без реализма.
Ну и третья база это генерить порно фотореализм и дрочить
А реквесты где-нибудь принимаются? Я просто вообще в картинки не умею, хотел попросить кого-нибудь одну тянучку погенерить по-всякому, у нее всего 2 фотосета нарыл в сети, хотелось бы больше, няшная трапо-азиаточка.
>>1600396 >сейчас ведь кино нормально снять не могут, хуйня какая-то пластиковая Потому что цепочка от сцены до глаза оператора разрушилась, исчезла обратная связь от оператора. Раньше техника была капризнее и ты двигал свет и актёров пока в видосикателе не получалась картинка. Сегодня все мыслят "похуй, снимаем как есть, на продакшене доделаем", а на деле на продакшене мало на что повлиять можно. Кури короче тему перцептивного реализма.
>>1600917 > Потому что цепочка от сцены до глаза оператора разрушилась, исчезла обратная связь от оператора. Какой глаз? Какой оператор? О чем ты? Раньше нужно было ждать две недели, пока проявят пленку, поэтому делали из расчета "попробуем сделать идеально, чтобы не пришлось потом переделывать, потому что в бюджете нет бабла на новую пленку", а сейчас - "че-то хуйня какая-то в риалтайме на моем гигантском экране на съемочной площадке, да и хуй с ним, CGI-департмент в пост исправит".
>>1600917 Да там куча причин, но главное - на съемки тратят нихуя по сути, все бабло на рекламу, зарплаты и т.д.
>>1600967 Ну так оператор был ценнее в тыщу раз, целая наука была, а сейчас любой блокбастер снимет прохожий, камеру ему дай и скажи куда наводить. Постановка сцен вообще уходит в пизду по визуалу.
И заметьте, эти киношные пидарасы еще имеют наглость про нейронки че-то пердеть, сами давно уже на компе свои фильмы делают.
>>1600819 > аппликация > побольше шагов > хотя бы 6 вместо 4-х Человек-чатбот, ты опять нейронку косплеишь? Не заебался еще некстворд в предложении галлюцинировать?
>>1601192 ты когда-нибудь в rts играл? после того, как раскрыл все апгрейды и в целом понял алгоритм (как павильно очень тупой) в котором играем машина, к игрушке пропадает всякий интерес на какое-то время.
Sampler: Dpmpp_2m_sde 1. Контрольная (без лоры) 2. Вес: 0.5 3. Вес: 0.8 ------------- Однозначно играет в + лучше вживляет персонажа в окружение, между 1 и 3 есть ощутимая разница.
>>1601234 >Тебя текстура кожи слопная не смущает? А что ты хотел от кляйна? Это однопроходка. >Sampler er_sde 6 шагов. 1. В сочетании с beta (у меня просто beta) 2. simple ------------ На бете потерян eye contact, и явный перешарп, на каждом семплере перс свой, но на Dpmpp_2m_sde мне нравится больше, я понимаю что это древняя хуита, но тем не менее...
>>1601247 У тебя не лучшая сцена для тестинга. То что перечислила гемини: всё пиздеж: - На кожу не влияет - Послушность в таком промте не проверить, слишком мало деталей - Композицию не проверить
Что заметно: если это не погрешность сида, узор и бусы - по детализации и сочности растут заметно. Даже пятый палец вырос
Потесчу потом на сложных креативах. Но в целом пока больше копинг. Хотя для кляйна любой буст деталей не лишний
Кляйн и его ебанутый цветокор
Аноним29/04/26 Срд 20:24:55№1601276476
>>1601234 >cfg 0.8-3.5 ты хотел сказать денойз? Будет хуже, хотя поза будет наверняка импозатнеее, гарантированный разъёб по анатомии уже на 0.9 >>1601270 >любой буст деталей не лишний >Даже пятый палец вырос согласен) >>1601234 >seeds2 1. seeds2 2. seeds3 ------------ Изменения уровная: просто другой сид, детализация кожи хуильная, в целом ощущение падения детальности за счёт большего размытия задника, такое обычно бывает когда кфг хватает только на фигуру девушки.
>>1601270 >- На кожу не влияет >- Послушность в таком промте не проверить, слишком мало деталей Я перепробовал дохуя бустеров, ни один из них не влиял на понимание промта, только на сочность картинки (поднятие гайденса) На что именно он влияет я уже сказал: >>1601247 >Однозначно играет в + лучше вживляет персонажа в окружение
>>1601265 > 1. В сочетании с beta (у меня просто beta) > потерян eye contact > явный перешарп - Dpmpp_2m_sde cамый худший слоп - Sampler er_sde - лучше. Seeds2 почти так же, но медленнее - beta57 лучше У тебя на первой текстурка стала заметно лучше. А еще у тебя подосрано clarity, это лоры либо cfg
>>1601270 >У тебя не лучшая сцена для тестинга Это уже эдит, сегодня первый раз попробовал, очень долго когда-то мучил sdxl оригинал в фотошопе, подолгу ролил каждую залупу в фокусе, и в итоге туловище у девчёнки получалось один хер изломанным, то что находилось в спальнике не билось с тем что снаружи, они как-бы находились в разных плоскостях. Указал на это в промте как мог) И ещё кое-что поменял по мелочам, результатом я доволен. С волком всё сложно по прежнему. Может есть какая-то лора для фури, чтобы мех был получше?
1. Оригинал 2. Один из сидов на res_multistep 3. Тот же сид на Dpmpp_2m_sde 4. Тот же сид на er_sde
>>1601435 >текстурка стала заметно лучше перешарп однозначно нужна лора типа этой: >>1600236 пока её не будет пластик будет лезть отовсюду, перешарп проблемы не решает, появление прыщей и ещё хз чего где надо и не надо это не текстурирование.
>>1601435 >А еще у тебя подосрано clarity не ебу ваще, что это такое? >это лоры кудаж без них... >либо cfg ты хочешь сказать, что я его спецом опускаю что-ли? Неее...
>>1601501 > не ебу ваще, что это такое? Специальный эффект, который есть в некоторых редакторах. Он увеличивает контраст средних тонов. Проще на картинках увидеть, если в минус - то мыло, если в плюс, то пережженый эффект с более выраженными светами. Для норм картинки ни тот ни другой эффект не должен быть заметен иначе васянско. И по моим наблюдениям, CFG и семплеры влияют на этот эффект.
У кого-нибудь бывает, что при юзании комфи, когда vram прогружен после генерации, картинка в винде подвисает, моники гаснут потом включаются и vram пустой, хотя сессия комфи остается активной? У меня чип отваливается у новой видяхи или просто сбой Nvidia crash уведомление позже появляется
>>1601540 Почему ты ничего не запромтить о свете, времени суток, времени года? Она неплохо для zot-а внедрена в полотно, но почему она у тебя не отбрасывает теней? Словно её освещают безтеневые софиты как в фотостудии.
>>1601734 У меня порой просто перестаёт генерить, говорит: джоб комплит, а нихуя не делает, перегрузка сервака обычно лечит это, но я предпочитаю полностью перегружать комп.
>>1601755 > почему она у тебя не отбрасывает теней? Потому что: the scene is evenly lit by the morning twilight. > Почему ты ничего не запромтить о свете, времени суток, времени года? Потому что: Как же ты заебал со своими охуенными советами, которые едва ли пригодны в твоем частном случае, но ты пытаешься их всем впарить. Промпти как тебе нравится, и не мешай другим проптить, как им нравится. Особенно, когда тебя никто не спрашивал.
>>1601771 >своими охуенными советами, Именно для этого аноны и выкладывают здесь свои работы, чтобы получить критику и совет, если тебе оно тебе нахуй не упёрлось, то нахуя выкладывать? Ты - непризнанный гений, ок - никто не спорит, продолжай хуярить в стол, и терибонькать на свои идеальные нетленки.
>>1601800 Ещё раз для закрепления: ТЕНЬ ЕСТЬ ВСЕГДА. Утро, вечер, день, сумерки, хуюмерки, пока есть хоть капелька солнца, даже если оно ушло за горизонт, оно даёт тень, в дождь, туман в метель всегда есть тень, ты понял меня, идиот? Даже если солнца нет, есть искусственные источники освещения, которые дают ещё больше тени.
>>1601788 >Именно для этого аноны и выкладывают здесь свои работы, чтобы получить критику и совет даже если это и так, почему ты решил что анонам интересна критика от клоуна с мировоззрением ребёнка?
> the morning twilight Это буквально временная инструкция, а не прямая инструкция освещения. Но ИИ её понимает +- корректно, twilight - это время, когда солнце находится НИЖЕ горизонта. Это еще не восход, и тем более не golden hour. Прямых солнечных лучей еще нет - а это значит, что площадь источника освещения - освещенного над горизонтом неба большая, и как следствие - создается эффект рассеянного освещения, при котором граница теней настолько сильно размыта - что визуально отчетливых теней не видно, есть только еле заметные затенения под массивными объектами либо на стыках объектов.
> При морниг твайлайте длинные тени, даже если утро пасмурное. Только при восходе и без облаков у горизонта, это уже golden hour, а не twilight.
> почему она у тебя не отбрасывает теней? Потому что ии сгенерила полностью рассеянное освещение. Тени есть - шея, сиси, на камнях под ногами. Но угол освещения установила не верный. Сфера источника света утром - идет большой полусферой сбоку, а тян явно освещена солнцем близкому к зениту (в пасмурную погоду). А еще цвета в утренние сумерки другие. Фактически ИИ нарисовала обычное освещение в сильно затянутый полдень, немного перебрав с рельефными тенями на тян. Можно пробовать этому уделять внимание через промт, но не факт что ИИ это знает. В подобных генерациях это мелочь, к тому же свет это очень сложная для воспроизведения хуйня.
Всем привет, я совсем новичок в нейросетях. Подскажите, есть ли инструменты для восстановления фото? Я занимаюсь споттингом (фотографирую самолёты летящие на большой высоте), но мои фото получаются не очень хорошими, иногда не читается регистрационный номер самолета, иногда не понятно какая ливрея у самолёта. Подскажите, есть ли какие-нибудь варианты прогнать фото через нейросеть, и чтобы фото было лучше?
>>1601895 > есть ли инструменты для восстановления фото Есть только инсменты для ретуширования фото. По сути - для дорисовки деталей, которых на исходном изображении не было.
Если ты знаешь, что это за детали и можешь сказать "самолёт-пердоёт, красно-алая ливрея, номер 345-х", то нейросеть тебе дорисует детали по этому описанию. Не восстановит исходник, а дорисует достаточно правдоподобно.
А если ты сам не можешь на фото разглядеть номер - то нейросеть тебе точно в этом уже ничем не поможет.
>>1601895 Нейросеть ничего тебе не "восстанавливает", она рисует заново на основе исходной информации, так как сама понимает. Чем меньше исходных деталей - тем сильнее фантазия.
Как при редактировании сохранять разрешение исходной image, не прописывая megapixels? Нахуй мне эти megapixels, если даже калькулятор мегапикселей по разрешению - выдает неверное значение. Если его ввести в ноду, на выходе разрешение меняется.
>>1601927 Вот это хуйня. Я пока не дошел до досконального изучения нод и архитектуры, я не знаю, что обязательно, что опционально, а что можно заменить на более удобное.
Мне бы хотелось опцию keep original либо указывать выходное разрешение с сохранением aspect rate. Указывать в megapixels мне не удобно в любых сценариях - врот ебал это.
>>1601927 >>1601945 >удали не надо ничего удалять, оставляешь 1 и ничего не происходит. Но если не апскейлить то качество будет хуильным, кляйн традиционно хуёво рисует на спичечных коробках, знаешь ли...
Можно ли с KSampler как то использовать flux2scheduler и будет ли разница с simple? Не смог нигде в менеджере найти flux2scheduler, для выбора в KSampler и соединить отдельную ноду с ksampler тоже нельзя.
В стандартных темплейтах для кляйна почему то идет flux 2 scheduler
>>1602054 er-sde (пик-1) лучше встраивает персов чем euler (пик-2), но добавляет лишние предметы, кои промтом не лечатся. Но ни тот не другой не в состоянии довести свою рисовку до уебанского уровня оригинала)
только расскажи о результатах, там надо разбираться, тестить
>>1602155 > всё остальное уже есть. Попробуй убрать пятый палец и третью коленку клейном, не руиня всё остальное и посчитай с какой попытки это получилось.
Едит клейна в чем то очень хорош и стабилен, но в чем то почти беспомощен.
>>1602158 У тебя тут похожий проёб анатомии мотоцикла, какой у меня был на оригинале сдохли: >>1601492 Типичный косяк с предметами (телами) по горизонтали, унаследованный у той же сдохли (родовая болячка). Но пальцы это ничто в сравнении с проёбом по масштабу тёлочки, она маленькая, а должна быть в полтора раза больше, как минимум. вырезать тёлочку на отдельный слой, выключить. из середины моцика вырезать вертикальную полосу, состыковать 2 половинки, тем самым укоротив тело мотоцикла, а затем вернуть назад тёлочку, слегка её промасштабировав, а затем закинуть в эжит в кратце расписав происходящее в кадре.
>>1602167 это ноды, позволяющие через параметры дополнительно влиять на интерпретацию промта
гемини про выдала это: С использованием ComfyUI-Flux2Klein-Enhancer: Вы получаете независимый контроль. Вы можете отдельно "выкрутить на максимум" влияние текста для фона, и при этом использовать специальную ноду для сохранения структуры оригинала. В расширении есть режим dampen (смягчение): установив его значение на 1.20–1.30, вы "железобетонно" сохраните черты лица и пропорции объектов с оригинального фото, при этом позволив текстовому запросу свободно изменять всё остальное.
>>1602169 это похоже на то, как работает встроенная импЭйнт модель в фокусе, она быстро прицеливается, удерживает до самого конца концепт даже на максимальном денойзе. Чем больше я узнаю про лапшу, тем больше я скучаю по фокусу.
чот то я ебанулся уже от этого разнообразия. Тестил всякое. как то всё погано в NSFW. комьюнити походу буксует роясь как свинья в апельсинах в разных моделях. Что сейчас работает так же чётко быстро и безбашенно в реализме как anima? chroma уже подзаебала.
Продолжаю ломать аниму. Йо-хо-хо и бутылка слопа. Анима из коробки не умеет в нормальное изображение сильного дождя и бурю. Просил её нарисовать шторм на море, шоб пиздец, как в конце третьих ПКМ, а у нее на выходе в лучшем случае легко накрапывающий дождик и волны как при ветре в 3-4 балла.
Но, среди сделанных генераций вылез внезапный КОНЦЕПТУАЛИЗМ на первом пике. Сначала покекал, а потом задумался. Если бы что-то подобное нашлепал не нейродебил в пиксели, а мясной мешок на холст, то это бы повесили в какой-нибудь галерее и снобы ходили бы вокруг, многозначительно кивая головами и ища глубинный смысл.
>>1601973 Лучше вообще научиться пользоваться SamplerCustomAdvanced. Он более гибкий, чем KSampler (выбор noise, выбор sampler, управление sigmas).
>В стандартных темплейтах для кляйна почему то идет flux 2 scheduler
Особенность Flux2Scheduler в том, что он подстраивает значения sigmas в зависимости от указанного размера latent. Пример на пикрил. Изменения эти с виду не такие уж глобальные, но я считаю, что они целесообразны и поэтому Flux2Scheduler оставляю.
>>1602305 Это просто сраный симпл, ничё он там не подстраивает, зачем ты тень на плетень наводишь? Там где можно обойтись загрузкой одной ноды вместо как минимум 5, это уже заебись, это многое упрощает, и экономит время, которое я могу посвятить этой бесполезной хуйне.
>>1602229 Вообще не понимал никогда причин тряски по поводу всяких художников, рисующих хоть немного нестандартно. Видать, у меня есть здоровый эгопохуизм, а у иных нету. То есть, ну а че, пиздатые кораблики же, я бы заценил на выставке и не парился по поводу того, что ВДРУГ это оказалось бы нейроконтентом. И че? Но у некоторых тряска пиздец. Это объяснимо, потому что большинство людей - тупое быдло, но с чсв, они трясутся, потому что хз как строить свое ебаное мнение, на чем его строить - непонятно. Именно поэтому они так яростно какого-нибудь Поллока или Кандинского засирают - потому что совершенно невозможно запомнить их картины, и вдруг получится, что похвалишь, а окажется что это ребенок рисовал.
Насчет снобов - хз, а чегоплохого если сам человек че-то увидел в картине, что ему понравилось?
Вот я бы че, я бы сказал: пиздатая картина, там еще синяя полоска красиво тянется, и всё - поебать что другие думают. Нейронка или не нейронка - похуй, мне нравится, остальное хуйня.
>>1602399 Это ещё работает как-то направлено в определенную сторону. Если сюда выложить две картинки, чем-то отличающиеся (настройки, модель - не важно) и сказать что вот мол, посмотрите, как картинка А, на мой взгляд, лучше картинки Б. И тут же здесь найдутся челики, кто скажет что совсем наоборот лучше и прям доводы приведут почему так(ну доводы типа "вот там глаза у паучка в тени лучше"). Я думаю это просто вредность людская. Такая есть натура людей. Противопоставление себя(дартаньяна) всем. Вот даже ты пишешь про себя, что ты один такой особенный, а все остальные коричневые. Ведь от человека в жизни мало что зависит и мало что он может запретить. А в интернет он может "запретить" считать кому-то что-то красивым. После этого такой человек чувствует свою некую "победу"(естественно мнимую). То есть улучшается настроение и прочее. Банально работает: сделал гадость и на душе радость.
>>1602401 Это безусловно присутствует (вредность). Но я бы еще о другом сказал: можно охуеть от того, насколько люди по-разному всё воспринимают. Лично у меня полностью перестроился шаблон н-цать лет назад, когда я поучаствовал в одном обсуждении, где юзеры делились тем, как они себе визуально в башке представляют год, времена года и месяцы. Реально охуел. Потому что по каким-то причинам, я думал, что у всех плюс-минус одинаково: круг типа циферблата и где-то сверху зима, декабрь, нг. Но по результатам чего только не писали, а потом я у родителей спросил и вообще охуел в квадрате.
>>1602225 >не умеет в 2b модель + 0.6б НАТУР ТЕКСТ энкодер.
На что вы рассчитываете, товарищ? Я не понимаю нахуя они это тренируют на таких размерах. Даже сдохля была в 4? раза больше. Да, есть архитектурные развития с тех пор, но ИСКЛЮЧИТЕЛЬНО из-за того, что это настолько микроскопическая модель, Анима это не прямой и однозначный шаг вперед, а скорее шаг вбок от люстры, которой уже два года, которая основана на модели, которой уже почти 4 года. Еще и медленней несмотря на меньший размер.
>>1602399 Мб не совсем в тему, но возвращаясь к генерациям: мне вот в целом поебать было бы, на выразительное средства и особенности, если бы я чувствовал достаточное удовлетворение - оно не почти не поддается описанию, мог лишь интерпретировать, иллюзионировать и выдумывать, чего мне нехватает. Я говорю про большую часть генераций, что вижу и получаю сам. Везде не хватает чего то важного, тонкого. Это касается и стилизаций и реализма. И это не цвет и даже не стиль. Возможно смыслой и выразительной целостности, завершенности. В генерациях всегда есть какая то залупа, обрубающее мне удовольствие. Нет осмысленной детализации, нет точности в деталях. Возможно тех. ограничения моделей мешают выразить идею, и генерируют не с позиции смысла, самовыражения и с целью передать эмоцию и/посыл, но с целью лишь бы хоть как то получилось красиво. Борьба с моделью, против слопа с промтом, а не творческий процесс. У самого создателя смещается фокус, а ограничения и специфика генерации забивают гвоздь в гроб. Даже корпоратская генерация, которая преуспевает в выразительности и художественности будто бы все равно не решает проблему. Клейн как пример, со своим прямолинейным промтом и хорошим следованием - будто бы полностью лишен какой либо фантазии и креатива. Можно написать промт на 600 слов, с детальным описанием всего, но на выходе получается компановка бедных шаблонных образов. Да и о каком креативе можно говорить, когда модели банально не могут в нормальные руки и изображения нестандартных взаимодействий? Хочется модель, которая может и позволяет креативить с оформленным результатом, но не сдхл с нейромазней третьего поколения. Если ты сказал бы любимому художнику промт о том что ты хочешь, с большой вероятностью получил бы то, что впечатляет и радует глаз, при услаии что он учтет все пожелания. Он создаст композцию сам, не засрет детальки, которые важны, не сделает лишнего бессмысленного мазка. В общем пока что кроме голых тян с пиздой в реализме, не знаю как создать хоть, что-то, что вызвало бы позитивный отклик, эстетическое удовлетворение, чувство завершенности и "глубины", пусть даже на 10 секунд.
>>1602419 Если ты генеришь постоянно картинки - у тебя деформация 100%. Я вот музончик пишу с полгода - начал слышать голоса доёбываться до всего подряд, причем уже не только в нейропесенках, но и в обычных нахожу косяки или недостаточную насыщенность, лол. Я думаю если ты куда-нибудь пойдешь на сайт с проф. фотками - тоже начнешь выискивать косяки. Фоток без глубины - полно. Если нет - значит это тупо психологическая защита.