Будем честны. Все что нам нужно: лучше следование промпту, отсутствие цензуры, появление lightx2v и размер не больше, а лучше меньше. Это будет хорошим лайтовым обновлением модели.
>>1288541 >лучше следование промпту Какой смысл? Сейчас и так отлично всё с этим, но ограничение в 5 сек а действий на секунды двене даёт ничего сделать и модель дальше под слоумо затачивают
Почему всем не зашла пуси лора? Типа нищуки дохуя 5 гигов врама на лору нет? Добавляю к каждой генерации и на i2v и на t2v результат всегда больше деталей и движения
>>1288469 >Я не понимаю 121 фрейм при 16 фпс расширяет длинну или лишь делает вид замедляя ролик? Меняет длинну. 81 фрейм - это 5 секунд. 121 - 7.5 сек.
>>1288497 >Сука, как интерполировать из 16 кадров в 24 без замедла? Интерполяция никак не влияет на ускорение или замедление сама по себе. Результат на видео зависит от количества FPS выставленного в ноде для сборки видео. Тут работает математика. Чтоб не менялась скорость, должно быть по уравнению: <Желаемые финальные FPS> = Х <16 базовых FPS> Где Х - параметр Multiply в ноде интерполяции. Т.е. для 30 FPS: 30 = 2 16 (100% точность не нужна, можно допускать небольшие отклонения, но лучше выставить точный результат умножения - 32) Для 60 FPS: 60 = 4 * 16 (т.е. идеально - ставить 64 FPS в ноде видео).
Если поставить в ноде видео меньше FPS чем нужно - будет Slow Mo. Если больше - "ускоренная перемотка".
>>1288549 Не так уж и отлично, может у тебя промпты в одно слово?
А всякие «ограничение в 5 секунд» (вообще-то, WAN 2.1 9 секунд, 145 кадров норм генерит, если что) и прочие хотелки — дюже жирно. На такое даже надеяться не приходится, будем честны. Я и звук хочу, как в вео 3, и скорость выше (размер меньше), и чтобы генерило 2 минуты как фреймпак, но не идл-анимацию, а сложнейшие промпты, и персоны, чтобы можно было галочками отмечать персонажей, которые будут в кадре, и, и… и хер там.
Так что начнем давайте с промпта, отсутствия цензуры и скорости не хуже. А уж потом будем мечтать об остальном. =)
Чтобы не было проблемы несбывшихся ожиданий.
>>1288731 У меня шумно генерит, хуйня какая-то. Может плохо варю, кинь видос.
Походу тестеры обосрались и реально будет 30 фпс. Если так то это х2 врам для генерации ну и генерить будет, соответственно, дольше. Может еще и лоры заново пилить придется
https://runwayml.com/research/introducing-runway-aleph >Runway Aleph is a state-of-the-art in-context video model, setting a new frontier for multi-task visual generation, with the ability to perform a wide range of edits on an input video such as adding, removing, and transforming objects, generating any angle of a scene, and modifying style and lighting, among many other tasks.
Новая модель от Runway для изменения видосов. Охуенно выглядит. Скоро всем юзерам выкатят.
>>1289278 Тебе уже всё сказали. Качай оптимизаторы, читай тред, блять. У всех тут, даже самых задрипанных лошков, генерации по 5 минут максимум, на моей 3090 - 85 секунд на видос
>>1289107 То есть это будет в локалке open source? Или только платное? Я пытаюсь решить, брать ли видеокарту или потратить эти деньги на платный онлайн.
>>1290538 во-первых, я не думаю что уже за 30к. во-вторых зайди на иммерс и протестируй сам, там есть. в-третьих, тут всем на это старьё в принципе пофигу.
>>1290538 Ради скорости маленьких моделек и все. Единственное применение. mi50 даст тебе 32 гига за 14к рублей, а не 16 гигов за 30к, а скорость будет не критично ниже. Типа, брать 2 карты, чтобы быстро гонять gemma 3 27b? За 60к рублей? Ну я хз. Или брать одну и гонять 12b? Ну, типа, агенты, я хз?
Ну тут я ваще хз, нахера это дерьмо, если видео-модели упираются в чип сильнее, чем в память. Ноу оффенс, бери любую современную RTX и обмазывай ускорялками. Будет гораздо профитнее. Докинь до 5060 ti 16 гиговой, чо ты.
>Прежде всего, огромное спасибо за поддержку Wan2.1. Вместе мы достигли более 5,8 миллионов загрузок (Hugging Face, Civitai, ModelScope) и 13,3 тысяч звёзд на GitHub.
>Сегодня вечером выходит Wan2.2.
>Видео выше — это краткая демонстрация новой модели Wan2.2 I2V, демонстрирующая её способность генерировать 9 разных видео из одного исходного изображения.
>Несколько моделей Wan2.2 будут доступны сегодня вечером (с 20:00 до 22:00 по пекинскому времени).
>>1290812 Эти кадры выглядят как кукольная/3D анимация. Модель же не разбирает чего впитывать а чего нет - она особенности разных стилей анимации/видео тоже впитывает при тренировке. Глупо от нее ждать особенностей видео снятых IRL если на вход скормлена картинка с 3D куклой.
Я вот надеюсь, что 2.2 таки тренировали на 16-ти кадрах. И не будет нужно ждать в два раза дольше для рендера той же длинны видео - как это будет, если там 30 FPS в датасете было.
Для плебеса радостная новость. Из документации на 2.2 которую Comfy выложила: The Wan2.2 5B version should fit well on 8GB vram with the ComfyUI native offloading.
кароче как я понял, вся фишка хайноиз модели, которая дает движение и всю прочую хуйню, а лоуноиз чисто для детализации, ибо если делать картинки, то лоуноиз очень смахивает на обычную ван 2.1. ваш кэп.
>>1291143 Хм. Если на долгую, и надеяться на появление nvfp4-моделей, то 5060ti. Но прямо сейчас 3090, по идее, должна выдать сопоставимую скорость, а может чуть выше + годна для текстовых нейронок. Но сложно-сложно.
>>1291208 > nvfp4-моделей Никогда не будет. fp8 уже шакальный, а с fp4 вообще пиздец. Всё это говно сильно хуже квантов. Ждём когда нунчаку для видео запилят, там в Q4 скорость х5 по сравнению с fp16. > 5060ti Этот джокер даже хуже 3090 будет.
>>1291153 шифт 1 ещё хуже сделал >>1291191 Возможно. С более высоким разрешением меньше галюны выводит. Но всё равно попахивает не оче. Наверно надо крутить настройки, подбирать семплеры.
1. 5б шифт 1 2. 5б более высокое разрешение 3. 5б 4. 1.3б
>>1291276 Для текстовых есть тред: >>1288430 (OP) Там проще в том смысле, что чем больше видеопамяти, тем более умную нейронку можно запхнуть, при этом, у тебя лимита верхнего почти нет (ну, терабайт с лишним сойдет как лимит?). 3090 24 > 5060ti 16 в полтора раза по объему как минимум, тут вообще нечего обсуждать.
Почему оно мне консоль остановило, обычно когда ООМ происходит так и пишет в терминале, а щас молча нахуй меня послал... Как меня заебали эти проблемы, просто хочется погенерить сисик и писик без мозгоебли...
Где-нибудь гайды есть по локальным нейронкам? И видео, и текст. На hunningface мб. Либо видосы-гайды. Везде по крупицам собирать очень сложно.
И насколько локальные нейронки отстают от платных? Чот меня ограничения тамошние напрягают. Если что порно делать не заинтересован. Интересна экспериментирование без ограничений + локальный запуск сам по себе.
>>1291404 Каким крупицам? Все очень подробно разжевано в шапках тредов. Пожалуйста, читайте их, люди стараются, пишут. Аж больно, сколько труда игнорируется и просто «а дайте тоже самое, что я заигнорил нахуй, я снова вас забью хуй и буду дальше ныть».
>>1291401 Ты давай, не сдерживайся, может полегчает. А потом подумай - эта сетка в два с хвостом раза меньше чем 2.1 И при этом еще что-то может. Это ж чисто для тех, у кого полноценный 2.2 не пойдет. Ну, и начерно попробовать чего-нить.
Короче, 5б лучше, чем 1.3б, но хуже 14б. Никакой магии, тащемта. Без лайтх2в, конечно, смысла немного, к сожалению. Ну и декодинг люто долгий. Но если выпустят лору, то будет и хорошо (720p), и быстро, и по памяти мало. Но без ускорялки, конечно, смысла немного.
Сейчас буду пробовать А14Б.
Мне кажется, лоу нойз и хай нойз — это и есть разные эксперты, МоЕ же. =) Но тут пока не разобрался, надо экспериментировать, конечно.
раз такая тема с разделением шума (моделей), можно первой моделью скормить self_force_dmd, та которая на ускоренная 1.3b, ну а дальше лоуноизу скормить для деталей. Сомнительно, но почему бы нет?) Для нищуков типа меня поиграться можно) А так, интересно бы внятную инфу по хайноиз модели почитать. Как и говорил выше, скорее всего в ней весь сок в плане моушина и освещения и прочего (кто смотрел трансляцию китайцев, поймет). Один хуй тесты буду ещё несколько дней, пока все вдуплят как это есть.
Ну, я рискнул запустить базовый workflow для i2v A14B на 3060. Из положительного - оно даже завелось, без OOM.(640х480, 85 кадров). Из отрицательного - 120 секунд на один шаг. Ы...
Пока можно выдохнуть - ждем героев-оптимизаторов. :)
>>1291490 Нужен lightx2v новый, чтобы не 20 шагов, а 4 шага генерило. Ван без нее и был неюзабельным, кстати. Там придумывали хитрые воркфлоу для ускорения хотя бы вдвое, но все еще ждать 6-7 минут ради 3-5 секунд было ну такое. А вот дистиллят охуенно сработал, конечно.
>>1291513 Больше для тех, кто на 8GB - им и 2.1 не светил толком. (Тот t2v 1.3B - что есть, что нету.) А на 12GB таки заводится. Скорость - вопрос отдельный, конечно.
>>1291526 Я про оригиналы. Ясен пень, что сейчас уже разве что на кофварках не запускают, после стольких доработок... :) С 2.2 сейчас та же ситуация - еще только оригиналы и есть.
Где я сейчас могу без предоплаты, хотя 2-3 генерации в день сделать ? везде стало подписку? только у ван 1 видео в день.
В гугл только асша можно получить подписку, а как там бесплатно хотя бы veo 2 юзать, я хз, у меня ничего не доступно, только подписку оформить гугл предлагает
>>1291546 Нет, потому что мне еще не попадались. :) Буду в курсе, что уже есть, значит.
Кстати, 5b таки одно достоинство имеет - шустрая. На тех же 640х480: 81 кадр - 7.5 секунд на шаг, 2.35м на все видео. 121 кадр - 10с на шаг, 3.40м на видео. Качество конечно... Но тут, все же, одно применение есть - энкодер то тот же, и датасет близок, так что можно посмотреть - что в принципе из картинки можно сделать, перед тем как в большую модель ее засовывать.
тут, в день 100 кредитов, 10 генераций, или картинки за 2 кредита. только я ещё до выхода вана в опенсорс регал на китайский телефон, до сих пор не слетел лог-ин
Да, пердолить нормальные настройки еще долго придется. Либо ждать, пока напердолят другие.1 видос это дефолт 2 модели еулер/бета, второй - только лоу нойз модель
>>1291635 A chibi cat has just stolen a fish in a fishmonger's shop and runs away on its hind legs holding the fish in its front paws. He has a comical panicked look on his face because he is being chased by the fishmonger man. The fish appears to be silver and of medium size. In the background, the fishmonger yells at the cat. The scene is the street of an open-air market, with stalls and people strolling. photo, soaked film, 4k, 8k ,uhd.
>>1291654 >>1291641 не исключено что на сайте они юзают 5b модель, ибо заголовок страницы image-to-video?model=wan2.1-turbo А если обычный, то text-to-video?model=wan2.2-plus
Почитал, подумал и что-то пока ничего не понятно, будто бы 5б не особо интересно на фоне того же работающего 2.1 14б, а новый 14б(27б) требует уже значительно более жирных вложений в goonpc
>>1291674 Парадоксально, но ускорялка от 2.1 действительно работает. Сыпет в консоль кучей сообщений о не загруженных слоях, но видео получается, как минимум - за 6 шагов (по три на каждую модель). Сейчас экспериментирую с двумя шагами на модель. 640x480, 121 кадр, занимает ~12 минут в сумме.
подскажите как поменять "денойз" чтобы i2v не менял внешность вообще пробовал изменить для high noise - end at step с 10 до 4 и для low noise start at step с 10 до 4 но результата не дало, совершенно другая внешность, только для аниме картинок не меняло
>>1291960 Хз у меня тоже там всё хуево, зато в t2v явно видны улучшения, текстурки больше не пластик и камера круто трясется будто реальное видео смотришь
>>1292029 Разбежался. На лоре посидим еще полгодика.
Следи за номерами. Veo 3 завезла звуки. WAN3 должен завезти звуки.
Китайцы любят копировать, и в данном случае это капец как очевидно.
Может какой-нибудь WAN2.5 выпустят еще, конечно, но тройки через полгода я бы не ждал.
У них еще Qwen3-Audio или Qwen3-Omnimodal не вышли и близко, явно пока ничего конкретного нет.
Так что я бы в ближайшее время WAN3 не ждал бы точно.
Конечно, они могут пукнуть в итоге очередной видео-генерилкой, но там на носу Сора, и прочие модели обновляются (ранвей и т.д.), Алибабе надо показывать что-то сопоставимое, а не болтаться в болоте «ну, мы опять улучшили следование промпту чуть-чуть и ускорили на 10%…»
Так шо, ждем, ИМХО. Лору на ван2.2. Кстати, она может появиться пораньше, чем через 4 месяца. В этот раз у них хотя бы датасет есть, разберутся с экспертами и могут сделать простенькую быстрее, а уж там улучшать ее. Как было с каусвид=>лайтх2в.
>>1292164 Есть мнение, что без упоминания еще и "wide hips" (широкие бедра) нормально задать размер задницы не получится. Опционально можно использовать вместо ass "buttocks" - ягодицы, но там лучше использовать не просто big, а plump, bubble, huge. Еще можно "posterior" попробовать, но это скорее жаргонизм, и хрен его знает поймет ли.
Ginger girl doubts and think. She crosses her arms over her chest, then scratches her head. Classic animation.
Видно, что у 2.1 не получается скрестить руки (там было 4 трая), а у ван2.2 без проблем (с первого трая), но после почесывания головы он вновь скрещивает руки (впрочем, пофиг, 9 сек же).
Да может ли кто нормально обьяснить, что сейчас вообще на рынке? есть ли хоть что-то где я могу попробовать? мне нужно i2v. а нигде нет пробников даже, без гемороя с созданием карты иностранного государства есть что? хотя бы понять что покупать то. Ван мне нравится, но мне ещё бы и генерацию пикч, гугла есть, бесплатно в imagefx недостаточное разрешение, но подписка там очень дорогая, что бы наобум брать
конечно если зарабатывать на этом, тут вопроса нет о подписке, но мне то сперва нужно что то сделать.
>>1292312 с каких пор гигачат может в i2v? да и локально что запускать? есть только 2 модели, одна из которых требует почти 70 гб врама и ван который тоже, можно запустить на каком железе? там 24 гб врама надо, пердолинг с запуском на 8гб особо смысла не имеет, для более серьезных задач из за 480p
>>1292464 Ойбляойидинахуй, как меня заебывают новички, которые нихуя не знают и несут ядерный бред, цепиздец! Пытаешься помочь человеку, а он тебе «нихуя такого нет!..»
Окей, уговорил, у меня лично это есть, у всего остального мира нет. Щас бы не мочь 720p на 12-гиговой видяхе сгенерить на WAN, без всякого пердолинга, я хз, криворукие уебаны не могут запустить киджая с 40 блоксвапа (ЕБАТЬ ТЯЖЕЛО НАХУЙ, ПОМЕНЯТЬ ОДНУ ЦИФРУ), гигачат год назад точно i2v делал, щас мне похуй, у меня WAN и Veo3. Локально запустить можно до ебеней моделей, правда большая часть хуйня.
Все, похуй, ебитес как хотитес. =) Добра и успехов, платите кому хотите.
>>1292673 Окей, признаю, даже с учетом 1,5 гигов сверху, 8,5 минимум для 720p81, 5 сек контекста не влазит. Я обосрался.
Тем не менее, с лайтх2в лорой ван стало достаточно доступным, и каких-то великих проблем с ним нет.
Все упирается в то, может ли тебе модель нарисовать то, что ты хочешь, и готов ли ты генерить по 4 секунды, а не по 5. Ну или по 960x544, а не по 1280x720.
Как же ору с нищетысерьезно кто не может позволить себе б/у с 24врам?, как вообще может придти в голову такая ебанутая мысль как захуярить 80% новой модели... и ради чего? У вас реально просто толстый вановский хуй не влезает в ваши 16 врам? Так есть же рам, щас нихуя не стоит, гуфы есть, скачай ты квант поменьше нахуй кастрировать модель?
>>1293043 Потому что нахуй ненужон этот хайноз ваш. Какой вообще плюс этого хайноза блядб? Вон чел выше обдрочил бабе ебало обоими вариантами. Оба выглядят порядочно.
>>1293063 >на улицу давно выходил? гречка у него по 10 рублей. Не пизди про пакетик. 29 рублей за 800 грам в пятерке. Иди и проверь.
>>1293060 Покупаю пюре в магните по 75 р 240 грамм, на ывыходе это дает 1кг продукта, а кг картофеля там стоит 75 рублей (но его надо мыть, то есть + вода + время + обчистки). Обчистки конечно можно промыть и съесть, но 1кг чистого крахмала - выгодней. И не пиши что там есть по 71 картофель, он фасован по 5кг, это байт на оверпотребление.
>>1293067 Может таки и нужен Бтв, прописал в батнике -reserve-vram 2 и вроде заработал этот ваш нативный блок свап, вот спокойно с fp16 моделями работает, до этого не хотело
>>1293078 Визуально разница имеется, по сути этот рефайн поверх будто бы 40 процентов сути всей новой модели, четкость мелких деталей и меньше своеобразной пиксельной каши, ещё пока сам не тестил, но примерно картинка вырисовывается
>>1293067 Что значит ненужон? У меня на 24врам что он есть что его нет скорость не меняется, нахуя мне кричать "ненужон" и отключать от воркфлоу? Хватит этот жирнейший коуп лить в тред, хайнойз это буквально вся новая модель
>>1293067 Буквально качество в деталях, если ты через прищур на все смотришь то да, не нужен, а так это и есть суть модели, детализация, ибо длины клипам не прибавили, а фэпэсы и так были через интерполяцию
>>1292961 Где-то на 2,5 гига больше жрет, надо офлодить +8 блоков сверху.
>>1293193 Ну, ваще я ллмки гоняю, у меня бомжатские 128. НО, ваще 64 хватает с головой, может даже 48, я не обращал внимания на детали, сам понимаешь. 480p могет, все там норм, все ожидаемо хорошо. У 4070ти норм чип, если оперативы докинуть до 64 (не так дорого), то вполне можно генерить шо хошь. Замедление не линейное, чем больше разрешение/количество кадров, тем медленнее. Но с учетом того, что старая лайтх2в кое-как работает, то вполне норм. Потерпеть 1,5 минутки вполне можно.
Честно скажу, в ван2.2 меня подкупило следование промпту. Оно не всегда прям такое охуенное, но качественный скачочек чувствуется, все же. И это хорошо.
Никогда не прощу узкоглазым пидорасам 16 фпс Зачем так нагло прогревать Я ночами не спал ждал выхода Интерполяция хуйня ебаная, говно из жопы. Сходу её заметил в их тизерных видосах но копиум был сильнее. Эти смазанные переходы вместо реальных фпсов, брр!