Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.
Анончики поясните LTX2.3 может в v2v с моей аудиодорожкой? Есть видео персонажа на котором он двигается, но не говорит, либо говорит - просто рандомно шевелит губами и аудиодорожка которую я хочу чтобы он сказал. В LTX2.3 хороший липсинк на крупных кадрах. Идея оставить само видео практически без изменений и налепить липсинк. Если можно такое сделать поделится ктонибудь ВФ по этой теме?
Чекните плиз, они адекватны или нет и работают ли вместе
Вот пошаговая инструкция, как внедрить каждую из этих технологий в твой ComfyUI для RTX 4070: 1. Реализация SageAttention Самый важный шаг для видеомоделей (Wan 2.1/2.2). Установка: Проще всего через расширение ComfyUI-SageAttention. Применение: В Workflow добавь узел "SageAttention Loader". Соедини выход MODEL твоего лоадера (например, Wan2.1 Loader) со входом узла SageAttention, а его выход — дальше в сэмплер. Что дает: Ускоряет математику внимания внутри модели на ~30-50%. 2. Реализация TeaCache Позволяет пропускать похожие шаги генерации. Установка: Установи расширение ComfyUI-TeaCache. Применение: Добавь узел "TeaCache Patch". Он ставится в разрыв между моделью и сэмплером. Настройка: Установи параметр threshold на 0.1 (почти без потерь) или 0.25 (максимальное ускорение). Что дает: Сокращает время генерации в 1.5–2 раза за счет уменьшения реальных шагов вычислений. 3. Реализация Model Compilation (Торч-компиляция) Требует наличия Triton и свежего PyTorch (2.4+). Применение: Используй узел "ModelCompile" из набора ComfyUI-ExtraModels или встроенный функционал в продвинутых лоадерах. Нюанс: Первый запуск будет идти 5–10 минут (черное окно консоли) — это нормально, идет сборка ядра под твою 4070. Последующие генерации станут ощутимо быстрее. Важно: Работает только на Linux стабильно, на Windows требует установленного Triton для видеокарт 40-й серии. 4. Включение FP16 Accumulation (Параметры запуска) Это настройка самого экзешника ComfyUI. Как сделать: Отредактируй свой .bat файл (например, run_nvidia_gpu.bat). Добавь флаг: В строке запуска допиши --fast. Пример: .\python_embeded\python.exe -s ComfyUI\main.py --windows-standalone-build --fast Что дает: Включает оптимизированные пути вычислений для архитектуры Ada Lovelace (RTX 40). 5. Использование GGUF (Квантование) Чтобы модель 14B влезла в 12 ГБ VRAM без тормозов. Установка: Установи расширение ComfyUI-GGUF. Применение: Скачай модель Wan 2.2 в формате .gguf (ищи на HuggingFace от пользователя city96 или bartowski). Используй узел "Unet-GGUF Loader" вместо стандартного. Выбор: Для 12 ГБ VRAM бери версию Q4_K_M или Q5_K_M. 6. Стратегия "Low-Res + RIFE" (Workflow-хак) Вместо долгой генерации 60 кадров: В сэмплере Wan 2.2 выстави frame_count: 16 или 32. После генерации пропусти видео через узел "RIFE VFI" (из набора ComfyUI-Video-Helper-Suite). Выстави multiplier: 2 или 4. Результат: Ты генерируешь 2 секунды видео, а на выходе получаешь плавные 8 секунд за счет того, что ИИ «дорисовывает» промежуточные кадры. С чего начнем? Могу скинуть прямую ссылку на проверенный GGUF-файл Wan 2.2 для твоей карты.
они работают вместе все? Да, большинство этих технологий отлично работают вместе, создавая «эффект синергии», когда каждый слой оптимизации ускоряет процесс еще сильнее. Вот как они сочетаются в одной цепочке (Workflow): 1. Идеальная связка (Рекомендуется для 4070) GGUF + SageAttention + TeaCache: Это «золотое трио». GGUF экономит VRAM, чтобы модель не тормозила из-за выгрузки в оперативную память. SageAttention ускоряет математику внутри каждого шага. TeaCache просто выкидывает лишние шаги. Результат: Вы получаете максимально возможную скорость для Wan 2.2 на 12 ГБ памяти. 2. Что НЕ работает вместе (Конфликты) Nunchaku + SageAttention/TeaCache: Как мы обсуждали ранее, Nunchaku — это «закрытая» экосистема. Она использует свои ядра, которые не позволяют SageAttention вклиниться в процесс. Model Compile + SageAttention: Иногда могут конфликтовать на Windows. Если вы используете ModelCompile, SageAttention может вызвать ошибку «Triton kernels not found». Лучше выбрать что-то одно (для видеомоделей SageAttention эффективнее и проще в настройке). 3. Как это выглядит в ComfyUI (Схема подключения) Если вы соберете всё вместе, цепочка узлов будет такой: GGUF Loader (Загружает экономную модель). ➡️ SageAttention Loader (Патчит модель для быстрой математики). ➡️ TeaCache Patch (Патчит модель для пропуска шагов). ➡️ Sampler (Начинает генерацию). ➡️ RIFE / Upscale (Увеличивает плавность и размер уже готового видео). Итоговый совет: Для вашей RTX 4070 самым стабильным и быстрым набором будет: Флаг --fast при запуске + GGUF модель + SageAttention + TeaCache. Эта комбинация позволит вам генерировать видео Wan 2.2 в несколько раз быстрее, чем «из коробки», не вызывая при этом ошибок совместимости. Хотите, я помогу составить правильную строку запуска (батник) со всеми нужными флагами для вашей карты?
Сап, как называются эти ваши лоры, где видео, что тян стоит одетая (загружается и2в фото в одежде), а через секунду ее голую в другом ракурсе и позе сношают в жёпу? Может это лоры на персонажей индивидуальные или все-такие универсальные лоры, что так делают?
>>1600962 Нет я умный. Делаешь с помощью любой картиночной edit модели голую версию тян во время ебли, и делаешь два ролика. Потом клеишь. Получаешь 100% экспириенс >>1593720 → только без лишних лор.
Open-source 2B DiT, 720p at 121 frames, one checkpoint for both T2V and I2V.
83.76% on VBench Total, highest among open-source, beats Wan2.1-14B at 7x fewer parameters. Caveat: Wan2.1-14B still wins on temporal stability and fine human anatomy in blind tests.
>>1601059 Ладно, я думал ты трлишь, а не заинтересован в этом вопросе, раз такие советы даешь, но реально идиот получается на костылях ходишь. Нужна всего лора на cinematic hardcut и в промптах тоже hardcut.
вот вы любители на ровном месте посраться :) каждый выбирает удобный ему метод, причем мне лично тоже было бы проще два видоса склеить если бы такая задача стояла и не юзать лору на хардкат, но кстати в лтх 2.3 он уже и так встроен, точно работало с этим тэгом и без лор, а вот насчёт вана помню была отдельная лора на него у меня
Я не могу, обдрочился уже, по загадочным причинам генерироваю с соской, которая итак уже снимается в порно. Влюбился в проститутку и хочу от нее теленочка!
ltx2.3 по прежнему не умеет в нормальный прон, даже с учетом лор, они чаще всего делают хуже а не лучше, а eros файнтюн тот ещё кал, в итоге я решил что удобнее svi-ваном генерить, а уже потом загонять на переозвучку через ltx2.3, в целом недурно выходит, звуки для ебли всяко лучше чем гонять ван + ммаудио на моем среднем конфиге полутора-минутный видеоролик среднего качества влезает вполне
>>1601518 я для этой задачи тупо адаптировал тот что гуглится на реддите для LTX2 (вот отсюда брал : hps://www.reddit.com/r/StableDiffusion/comments/1q916xs/you_can_add_audio_to_existing_videos_with_ltx2/ а тот чел видимо переделывал штатный вф (был у киджая) для дубляжа, понятное дело я поменял все пути к моделям для LTX2.3, ну и приукрасив слегка нодами интерполяции + под себя переделал, например кабель перетащить с фиксированного фпс чтоб можно было его перенастраивать, но это мелочи, оно и без них работает предупреждаю что тот вф слегка накуреный потому что ltx нужно 24 кадра в процессе генерации, соответственно количество кадров нужно строго определенное указывать, при этом то что у тебя будет в изначальном видео и в том что тебе хочется делать можно указывать другое значение fps, если возникает ошибка vae encode значит количество кадров на вход не совпадает с тем что умеет жрать ltx, самый идеальный вариант конечно если у тебя изначально видео в 24 кадра в секунду и ты генеришь на его основе звук с новым видео 24 кадра, тогда ничего делать лишнего не нужно, будет работать сразу из под коробки, и видео лучше хорошего качества скармливать, тогда ии будет понимать что там
Есть у кого вокрфлоу для Wan с последовательным прогоном пачки латентов сначала через high сэмплер, а потом через low (чтобы модели в память не грузить на каждое видео)? Пробовал промежуточные латенты выгружать на диск, но быстро заебался вручную файлы туда сюда гонять. Есть рабочий вариант через Repeat Latent Batch, но оно в какой-то момент перестает в память влезать.
>>1601732 Сам спросил, сам ответил. Если между Repeat Latent Batch и сэмплером вставить Rebatch Latents со значением 1, то оно латенты будет по одному передавать, а не ебанет туда всю пачку.
>>1601749 Идея неплохая. Интересно, насколько ускорит, если у меня 12 ГБ ВРАМ, а модели fp8/Q8 по 14-20 ГБ? Если модели полностью помещаются результат должен быть приличным.
Поделись примером воркфлоу для теста, пожалуйста.
>>1601809 Насколько я понял идею анона, это поможет при генерации пачки видео из одного воркфлоу для подборки seed'f, силы лор и подобных вещей. На генерацию одного видео не повлияет. Лучше будет работать, если одна часть модели (в смысле high/low) целиком или почти целиком, если только половина - эффекта не будет.
как в ltx2.3 для анимации (любой где НЕ фотореализм) сделать нормальную музыку?! что бы я не делал какие бы промпты не писал всегда играет почти однотипная полусимфоническая ебанина, словно какая то мелодия затычка
>>1601809 >>1601969 У меня 16гб вирама и столько же древнего рама лол, плюс файл подсрачки на ссд. Бутылочное горлышко возникает из-за постоянной загрузки и выгрузки моделей из памяти. Если пачками обрабатывать, то на условные 5 генераций модели грузятся 1 раз вместо 5.
>>1602089 Но оно же дольше будет генерить, чем если бы я генерил просто один раз? При том, что я не знаю, может с первого раза получится нормально. Тоесть этот способ просто увеличивает время генерации на ровном месте. Очень странно.
>>1602032 Понял, благодарю, seed variation оказывается очень просто сделать)
>У меня 16гб вирама У тебя все варианты, все кроме fp16, за раз помещаются и на одном семплере нет выгрузок/подгрузок - в этом случае должно сильно разогнать. Есть цифры? У явно будет скромнее, надо потестить.
>>1602098 Тебе никто не мешает делать по одному ролику, пока ты подбираешь промпт, меняешь картинки и прочее. А когда у тебя уже получается плюс-минус то, что ты хочешь - прогнать пачкой в поисках более удачного сида или еще каких-то продвинутых вещей. Я полагаю, есть способ запустить 5 разных картинок из папки и/или 5 разных промптов из файла.
Если у тебя момент выгрузки хай-модели и загрузка лоу в видяху - бутылочное горлышко ты можешь условно сгенерить 5 вариантов видосика по такой схеме, как 2 по обычной.
>>1602298 >Если у тебя момент выгрузки хай-модели и загрузка лоу в видяху - бутылочное горлышко А как это определить. Я вообще не ебу откуда они грузятся, по частям они грузятся или целиком.
Квен например 25 гиговый у меня тоже работает. Хотя видюха 12 гигов.
экономия на пачке 195.83*5 - 856 = 123,15 секунды 123,15 / 5 = 24,63 - на одном видосе, среднее Сокращение времени, среднее 24,63 / 195.83 = 0,1257 = 12,57%
Пытался запустить Q4_K_M, но у меня GGUF отказывается полностью грузится в карту и генерирует за тоже время, что и fp8. То ли руки кривые, то ли я чего-то не понял.
>>1602301 Упрощенно, каждый шаг в ksample - проход по всем слоям модели (для примера - 100). Если в видеопамять поместилась только часть слоев (например 80), то после прохода по ним, часть слоев (20) выгрузится из видеопамяти и на их место загрузятся новые. То есть каждый шаг эту колоду будет дрочить туда-сюда.
У анона мало ОЗУ и она медленная, поэтому загрузка-выгрузка происходит еще и в своп на диске, что максимально медленно, но его 16ГБ ВРАМ хватает на хай-модель ну и сама карта быстрая наверно, поэтому сам проход семплера достаточно быстрый. Поэтому его идея будет давай максимально большой прирост
>Квен например 25 гиговый у меня тоже работает. Хотя видюха 12 гигов. У тебя и flux-dev на 100 гб заработает, если оперативки свопа на диске хватит) Работать правда будет очень медленно
>>1601732 Я что то колупался с этим и по итогу сдался посчитав это не выполнимой задачей на программном уровне. Само устройство двух ксамплеров не позволяет генерировать сначала хай потом лоу. Ведь в конечный латент, который передаешь в следующий сегмент генерации, уже должен содержать генерации от хай и лоу, иначе никакой конситсентности не получится.
>>1602400 >последовательных видео Точно не будет, только "независимые" видео ролики для черрипика. Я уже предлагал варианты использования выше: - перебор сидов; - подбор силы лоры; - перебор вариантов первого кадра; - перебор промптов; - вариации озвучки.
>>1602461 По качеству в среднем хуже, почти все модели хуже работают с аниме. Разницу по ВРАМ как-то не ощутил
Гружу на hight модель fp16, а на low fp8 - в итоге все умещается в 96 гигов рама без свопа и ебли ссд. Проверил с полноценным fp16 на low - разницы ноль. Еще и свободно немного остается рама
В чем не прав? Минусы интересно есть еще какие то?
Мде, провёл вчера весь вечер в экспериментах с LTX 2.3 и анимацией, в отличие от реализма он не умеет в музыку для анимаций вообще, похоже что обучали только на беззвучных роликах. Везде примерно одна и та же фоновая унылая духовая музыка даже на всех видеопримерах с civitai где люди пробуют анимацию делать в этой модели, нормальная музыка отсутствует как сущность. Даже если накидать весов типа на такой то секунде играет мощный бит, он будет играть почти не слышно. Предполагаю что разработчики так сделали намеренно чтобы не нарваться на туеву хучу копирайтов, особенно от японцев или диснея. Тут видимо придётся или лор ждать кто сообразит музыку с анимацией скрестить или просто на своём аудио генерить уже через S+I2V вф стандартный [p.s. с не анимационными роликами такого у модели поведения нет, модель может клепать вполне годное музло и с вокалом и без
>>1602493 имхо чтобы его избегать нужно в бОльшом разрешении генерить желательно вообще в самом максимальное которое тянет система и референс не во всратом качестве пихать
Пацаны, я вот использую ранпод в своем проекте (тг боте) Юзаю Serverless Endpoint чтобы постоянно не платить за аренду карточки и у меня вопрос.
На ранподе есть шаблоны готовые. В этой репе есть и сама модель и API для нее и все ноды с вф предустановленные. Кароче кайф, но тут проблема в том что менять что-то в самом репозитории проблематично.
Я могу через нетворк вольюм поменять некоторые небольшие файлы, просто в баш скрипте перед стартом воркера заменить их, и это занимает секунды времени при старте.
Но проблема щас заключается в том, что я не могу прихуярить туда SVI, так как тех нод что предустановленны в репозитории - недостаточно. KJnodes там есть, но он старой версии, без SVI, а качать их перед стартом воркера - это очень долго и сильно повысит стоимость каждой генерации
Кто знает, что если я сделаю форк этой репы, а потом соберу ее сам, не будет ли ебучий ранпод скачивать для каждого воркера мой репозиторий всегда? А это десятки если не сотни ГБ из-за моделей и декодеров.
Репозиторий на пикриле же закеширован внутри ранпода, поэтому он его грузит быстро. Если будет, то есть ли у кого решение этой проблемы?
Бле да когда ж нормальные модели появятся делать аниме и чтоб не ебанутым цепочным воркфлоу или с премиумами за сто тыщ баксов, а чтобы просто зарядил промпт и погнал. Вот как anima для картинок, какой то топовый локальный инструмент народ бы взял за запилил, за который не жалко будет и задонатить. Протестировал за последние два месяца всё что можно, наиболее оптимальный вариант пока выглядит всё тот же локальный svi ван, а это долго ужасно рандомно, нет встроенного звука, но с ним хоть что то приличное можно сочинить если как следует поебаться. LTX2.3 не обучен 2d аниме, только картунсы, все текущие лоры на аниме 98% делают кал, нр можно потрахаться сделать неплохо для этого надо наверное часов эдак 40 посидеть. Тут надежда только на то напихают ли аниме в следующую версию модели или найдется боярин с бабками натренирующий жирный топовый файнтюн (ну типа как Lodestone с хромой). онлайн Клинг неплох, знает много аниме (если например написать сгенери в стиле Призрака в Доспехах) но частенько косячит в стиле примерно на уровне ltx, хоть и не добавляет сильно CGI-щины, но она в нём увы присутствует, + ещё он неебаться дорогой и цензурный, если б цензуры не было и подписка была адекватная то можт на нём бы и сидел, по аниме он примерно как и Грок, этот тут уже его сравнивали, жаль что оно там хентайщину за пейволом держит, если ещё не снесли. Грок примерно как ван иногда может а то и веселее, только вот пользоваться им ну такое. Гугловый вео в нормальное аниме вообще хуйню какую то делает (обычные мульты в целом ок), мне кажется видеомодели не их тема, остальные модели от гугла в целом прекрасные (живу с жемини и локальной гемме годами, иногда слегка изменяя с квеном). сэмпл с клинга если что, не локалка. ну и вановский старый.
LTX 2.3 на этом референсе делает отличные транзисты, понимает хорошо камеру в промпте, hurd cut и вовсе отлично, а рожи строит почти как в наруте, динамику делает лучше всех выше перечисленных, кроме самого изображения, оно настолько всратое и там такой лютый бади-хоррор, что я под страхом расстрела бы не это стал показывать, а так конечно потенциал у модели шикарный
В аниму треде проигнорировали сие творчество. Посоветейте лоры на окончание, как-то коряво идет даже с конечным фреймом. Оно должно граммотно вылетать из хуя, а не вылезать как слайд шоу. Может я что не так в настройках делаю? Какйо вес модели, лор, промпты надо?
>>1603559 Ты пытаешься все за раз сделать. Склей три видео в одно и все получится. Первое у тебя есть >>1603387 . Во втором сделай ласт фрейм без жидкостей, чтобы модель нормально анатомию сгенерировала. А в третьем используй ласт фрейм который хотел.
>>1603585 Что ты так и делаешь? Тебе же сказали первый ролик i2v ебля, второй ролик на ласт фрейм - вытащенный писюн, 3 ролик ласт фрейм - конча на всю спину. Направление движения и источник кончи надо описать в промпте. Еще желательно добавить физ параметры что конча жидкая/густая fluid в общем.
>>1603559 А че ты 5 секунд клеешь долбодятел совсем седня ЛТХ тебе 20 секунд даст с той же скоростью и одним видосом тут уже можно плучается минутное видео на корыте(почти) делать локально если еще склеивать епта.
>>1603986 с виду он сильно лучше для нсфв, чем все остальные модели. Судя по первым тестам. Эта модель хотя бы лучше анатомию понимает без всяких лор. Не идеально конечно, но лучше. Только промпт лучше через Грок генерить или другие бесцензурные ллм.
>>1604084 Да тут проблемы в основном что исходного материала мало и лень возиться было, по быстрому в квене наклепал недостающи кадров. Иметь хорошие старт и энд фреймы - считай пол дела сделано. Можно было бы момент с кончёй распилить на 2 отрезка по 41 кадру и лучше бы все получилось. Ну и еще какую нибудь лору на аниме поверх наложить не помешало бы, но у меня таких нет так как аниме не генерю.
>>1604162 Каким воркфлоу пользуешься для таких нейроситей NSWF чтобы без протекшен файла был. А то у меня только с ним, а те что без него не работают со звуком. Мне надо чтобы были ItV и TtV, и voice+ItV и TtV желательно.
>>1603028 Ну у тебя весь стык что ты анимедаун, а если без этой хуйни смотреть то ЛТХ даже неплох. И я уже много по нему воркфлоу моделий и прочего в тырнетах видел, которые при том неплохо склеивают разные видосы в однин делая более длинные ролик, довольно качественно и без проебов, даже звук голосов не проебуется.
>>1604910 Да какие мысли. Слишком эта нейросеть заставляет любой промт ебаться вместо того что ине нужно, как какая-то спец лорас выкрученным влиянием по сути. А мне допустим не интересны классические вещи типо обычного секса в виде попака на лицо и ебли. Что-то инное цензурное запостить особенно кроме порно тяжело
Копаю руду со своей вайфу в игре, а в конце трудового дня дрочу на нее, и даже моды не нужны, просто скринчики из позинга + Ван. Я не доволен, должна материлизоваться и упасть мне на ручки + под пледик. Я тщетно еще пытался дать ей речь и глаза, чтоб видела мир в игре и комментировала, может когда-нибудь осилю.
У кого до 5-8GB vram, и кто не хочет ебаться с богомерзким ComfyUI для генерации видосов, советую поставить 'Pinokio', а с него установить 'wan2gp', там уже все оптимизировано для даунов.
>>1605630 Задай сам себе вопрос в чём это должно визуально выражаться, если сможешь сам ответить, то сформулируй это в виде промпта для нейронки и поопробуй, если ты сам не знаешь чего хочешь, то какого хуя ты хочешь от нейронки? Облако зелёного дыма можно и в видеоредакторе наложить, если нужно чтобы анус расширился то так и пиши
>>1604989 Ты же в курсе, что видео-модель нахуй не надо в видеопамять умещать? Тока контекст имеет значение, замедление не критическое (а иногда отсутствует). Я боюсь за этот тред.
Аноны, как в 10Eros звук нормальный сделать? Использую их стандартный вф без изменений с теми же моделями. Голосовой vae из их safetensor'а выдаёт просто кривой шум. Стандартный LTX 2.3 audio vae звук генерит но уж слишком какой то адский, кринж с рассинхроном, криками и левыми спецэффектами. Может какой то волшебный параметр подкрутить в вф? По поводу видео в целом норм, выходит неплохо, уменьшается количество лор которые нужно подрубать. Пока не успел как следует оценить, вожусь третий день с ней. Слегка спорная штука, время генерации по сравнению с LTX 2.3 намного больше из за метода генерировать видос как ic референс для картинки, в итоге нивелируется один из главных плюсов LTX 2.3 - быстрая генерация.
После тестов Сульфура и Эроса на нескольких разных воркфлоу i2v пришел к выводу, что обе модели примерно одинаковые и это можно сказать шаг вперед для лтх. Но в отличие от того же Вана, ЛТХ продолжает не держать лицо персонажа при динамических сценах (исчезновение из вида и появление вновь, удаление и приближение камеры, повороты персонажа, смена позы и тому подобное). Ван все это делает без всяких лор на персонажа. Также качество картинки у фп8 моделей лтх такое себе. В динамике вылезают артефакты и картинка местами как будто плывет. Может, конечно, все вф, что я попробовал были не ок, но чет слабо верится.
>>1606476 Если оперативы хватает — то да. Или файл подкачки увеличивать. Кванты помогают чисто оперативу сэкономить, чтобы ssd-диск файлом подкачки не мучать.
У меня 128 оперы, я bf16 гоняю. Добирается до 72-92 по ситуации.
>>1606488 Я вчера попробовал разобрать на составляющие сульфур. В итоге, аудио вае и видео вае пошли нахер, а вот проектор мне показался КАААПЕЛЬКУ лучше оригинала. Саму модель я в итоге гружу из полной модели, а аудио вае и видео вае гружу оригинальные. Итого 46 гигов мэйн модель, 2 гига сульфур проектор (может его тоже можно грузить из мэйн модели, не ебу, ну и качество совсем чуть-чуть лучше, и то могло показаться), вае старенькие, гемма аблитаретед (херетик говно какое-то).
Звук не асинхронится, вроде бы, все норм, качество анимации выше, цензура ниже, качестве генерации мультипликации и аниме — лучше (оригинал все в 3D хуярил реализм ебать).
Сульфур мне понравился.
Эрос выдал какое-то говно, я его и дропнул.
Но это так, один вечер покатал, тезноры подрочил, могу быть не прав.
По ощущениям, анимация приблизилась к Ван, на самом деле. Но артефакты присутствуют.
>>1606729 >I am only affiliated as an i2v tester and consultant. This is my personal merge of the actual data and it uses different training steps and layer scaling to create a consistent flexible I2V focused version. Future versions (v2+) will be actually fine tuned by me personally aimed at filling in gaps and weak concepts.
Народ, а как у нас обстоит дело с мультиреференсным I2V ? Пробовал только first to last frame. А есть примеры вф, где модель считывает несколько референсов в начале, или же промежуточный кадр, помимо первого и последнего? WAN 2.2 разумеется.
>>1606819 Там же несколько моделей. ЛТХ отдельно работает, ваешки отдельно, гемма отдельно. В оперативе хранятся все, для быстрого свапа. Поэтому и получается 70 гигов, но во время инференса одной модели — требуется меньше, конечно. Но для LTX-2.3 bf16 46 гигов все еще надо, поэтому иметь 48-64 гига желательно. Поэтому, владельцы 32 гигов предпочитают fp8 или gguf-кванты. Меньше весят — не замедляется из-за файла подкачки. А лишний диск — база. Нынче это дешевле оперативки…
>>1606586 про артефакты чел который эросом занимается целый дисклеймер написал, и один хер ответ в стиле типа пробуйте крутить параметры в вф, ну такое себе про косяки с vae и звуком вообще нигде не могу найти в чём причина, на реддите тишина, а проблема явно присутствует не только у меня, мне в ltx 2.3 как ни странно больше звук волнует к слегка покоцанной картинке я привык, да и картинку при случае можно и в ване нарулить, а вот звук такого уровня хуй где нарулишь, в итоге вернулся пока на ltx-2.3-22b-distilled-1.1 который довольно стабилен по сравнению с этими новыми тюнами
>>1607080 Не знаю что у тебя там со звуком. У меня всё нормально. Но так как я нищий 12+16 то юзаю лору ерос, а не модель. Сравнивал с дефолт лткс, небо и земля по nsfw.
Ещё автор эроса озвучил весьма странную вещь - в его модели нельзя ставить временные метки (да и вообще любое лишнее форматрование и символы). И как в таком случае управлять сценарием? Типа вот я хочу чтобы на шестой секунде персонаж куда то повернулся или что-то случилось а не на десятой и всё, тупик?
>>1607674 та же хуйня, вроде грузится но черный экран. через vрn работает нормально. при отключении vрn процесс закачки можно продолжить и всё скачается на полной скорости. хз что это.
>>1607676 это мелочь) главное богатые возможности. да и натренировать можно лору на домашнем железе. у меня пока с фоток персоны отлично тренится, схожесть просто вау. а видео ещё не пробовал, мне кажется комп уже не потянет.
>>1606753 вроде в 2020 были какие-то хтонические GAN-генерации, когда всё на видео превращалось в насекомых\кошек\собак\пенисы. может это тоже идёт в зачёт, кек.
>>1607661 у меня раньше были восторги, я каждый день в ней сидел, сейчас восторг совсем поутих, модель очень капризная если начинается генерация того чему она изначально не обучалась (подключаемые лоры иногда это вообще отдельный кринж), сложные сцены с несколькими персонажами чаще всего будут выдавать полный бади хоррор или слабое следование промпту, а простые сцены в стиле 'он пялит бабу в доггистайл' мне не интересны, я как ы ты сперва погрохал ван, но вот через месяца два снова вернул ван :D лтх очень хорош в производстве каких нибудь синематик роликов и музыкальных клипов где нет nsfw или аниме, на всё остальное, что в ване делается как два пальца нужно тратить уйму времени и нервов
>>1607761 Да уж. Казалось бы простая вещь, но заставить киношного монстра сесть бабе на лицо как на второй фотке, только спереди, типа в рот трахает, не могу второй день.
>>1607772 Тяжко поставить в один кадр персонажей, с которыми нет оригинальных общих кадров. Иногда получается похоже, выцепляя промежуточные и прогоняя снова первый-последний, но в основном глухо.
Какой сегодня положняк по видео? А то я задумал музыкальные клипы делать по уже сгенерированой музыке, но длительность музыки от 2 до 4 минут. Хотелось бы без особой ебли ваншотом генерить.
вот так выглядит обучение лоры ltx 2.3 в nf4, интересно насколько всрато выйдет. скорость по сравнению с fp8 чекпоинтом та же самая, походу всё упирается в вычисления.
>>1607845 в общем на fp8 быстрее и точнее даже несмотря на то что в видеопамять не влезает. nf4 это не про скорость и качество, а для тех у кого с оперативкой беда. вот бы поддержку аппаратного nvfp4 завезли
>>1607844 по идее через LTX 2.3 должно нормально быть если оперативы вагон, я по полторы минуты генерил на своём конфиге но так как с транзистами камеры беда иногда, теперь предпочитаю нарезать музыку затем кусками по 40 сек генерить и уже потом монтировать в давинчи, да это не 1 проход но контроля над секциями больше в разы, никогда не видел чтобы весь ролик целиком и полностью от А до Я сгенерировался за 1 проход без косяков, везде что то да вылезало. видел есть вроде воркфлоу с лупами где можно стыковать чуть ли не до бесконечности, но он вроде только для i2v/t2v а не для si2v
>>1607908 https://github.com/AkaneTendo25/musubi-tuner/tree/ltx-2 скинь файлы из папки docs языковой модели и она нормально пошагово распишет что как сделать. я таким образом всё установил и настроил. гораздо легче чем самому читать простыни английского текста.
>>1607980 Попробую на досуге. Правда сейчас понял, что датасетов тонет, ну да ладно. Меня просто удивляет сама возможность трейнить это на моём конфиге, пусть и в fp8.
>>1607776 Проблемы с upside-down, в датасете подавляющее большинство прямостоящих людей.
>поставить в один кадр персонажей, с которыми нет оригинальных общих кадров Ну это с лорами реализуемо, а без них я хз как, особенно когда не просто рандом чел, а монстр.
вот ещё нюанс: тем кому нужна стабильность в ltx 2.3 чтоб нормально следовало промпту и не было бади хороров при использовании со сторонними лорами настоятельно НЕ рекомендую юзать distilled модель, а юзать только dev модель + distilled лору с маленьким весом (0.50-0.60), в такой комбинации в разы лучше результат получается
>>1608022 >Ну это с лорами реализуемо, а без них я хз как, особенно когда не просто рандом чел, а монстр. Таки остается играть с промтами и параметрами пока не получится нечто похожее на оригинал, ага
>>1608119 >>1608236 В общем я немного покурил вопрос. 1.1 фиксит некоторые баги А именно - ltx-2.3-spatial-upscaler-x2-1.1.safetensors фиксит баг когда в конце видео остаются артефакты, я как раз с этим столкнулся. так что обновлять имеет смысл
>>1608815 очевидно что как ллм, просто переписывает промпт
This model contains a prompt enhancer. The easiest way to get started with the prompt enhancer is by using it on lmstudio. The way to accomplish this is by going to your model folder inside lmstudio, then opening it up in your file explorer. Create a folder named "Sulphur", then a folder inside that called "promptenhancer". Inside that folder, place the gguf file and the mmproj file. Once you've done that, you should be able to load the prompt enhancer in lmstudio. There is no system prompt for it, just send the text (and an image) you'd like to be enhanced.
The easiest way to get started with the prompt enhancer is by using it on lmstudio. The way to accomplish this is by going to your model folder inside lmstudio, then opening it up in your file explorer. Create a folder named "Sulphur", then a folder inside that called "promptenhancer". Inside that folder, place the gguf file and the mmproj file. Once you've done that, you should be able to load the prompt enhancer in lmstudio. There is no system prompt for it, just send the text (and an image) you'd like to be enhanced.
>>1608865 конечно имеет смысл, 16гб врам всегда нужны + у блаквеллов оптимизации есть как раз под нейронки. тот же nvfp4 (хотя он поддерживается через жопу)
>>1608849 >>1608846 а в комфи? я попробовал всякие ноды для квена и для геммы. не получилось я тупой походу, пацаны, нужно более понятное объяснение. лмстудио единственный вариант?
>>1608865 у 5060 ти куда ядер вдвое больше и встроенная поддержка fp4 вычислений что позволяет больше уместить чем кажется
>>1608883 лмстудио самый простой вариант. Закинул оба файла в папку с моделями лмстудио, выбрал модель и готово. Никакого пердолинга в комфи. Максимум, что надо, так повысить температуру справа в насройках до 0.7 (а то она по умолчанию 0,1) например и все.
>>1608904 Ну это в разрешении 4к с лучами, 5 лет назад такое вывезти вообще ничего не могло, на RTX 3090 в 4к со всеми лучами было 7 фпс, так что не вешай нос Симон, всё ещё впереди.
>>1608914 На 5090 ещё есть х6 фреймген. Шутки шутками, но 45 фпс -> 250 фпс сейчас выглядят хорошо, артефакты чтоб увидеть надо с лупой сидеть и вращаться как юла.
>>1608865 на скрине пиздеж. 5060 ti в трассировке лучей и ИИ задачах быстрее где-то в 5 раз будет. с 12 гиговой 4070 ti перешел на 5070 ti и не жалею, всё гораздо шустрее ворочаться стало. есть nvfp4 модели, заточенные под 50xx серию, они при почти таком же качестве картинки дают дополнительное x2 ускорение генерации. ну и эти видюхи саморазгоняются даже сильнее чем в официальных спецификациях. например у меня на бумаге турбо-буст до 2450 мгц, 44 тфлопс производительность чистой cuda. на деле - больше.
>>1608883 Комфи там вообще не причем, это GGUF модель, что ты мозги ебешь.
Я купил автомобиль, но как не греб веслом — она не летит.
Если ты прям хочешь встроить в воркфлоу бесшовно и без API — то я не знаю.
llama.cpp запускает эти файлы. ЛМСтудио — обертка над ней, довольно удобная. Я просто на втором компьютере запускаю llama.cpp с этой моделью, и кидаю картинки с описаниями туда, он мне выдает промпт.
Но 5060 ti точно стоит брать, 16 гигов к тому же, мастхэв. Еще и 42к стоит на вб.
>>1608897 Надо будет, но в лмстудио может быть автовыгрузка, я хз, типа обработал запрос — и модель автоматом вылетела через пару секунд, а послал новый запрос — заново загрузилась. Но все равно такое себе, наверное.
>>1608956 > есть nvfp4 модели Ну, говно, кстати, флюксы пальцы путают, лтх с лорами замедляется, вроде бы и да, а вроде и нет. Нужны модели, нативно обученные в fp4, вот там огнище будет.
> 2450 Уже 4070 ti брала 3000 МГц, а 5070 ti у меня в SFF — всего лишь 2600-2800.
>>1608978 >Нужны модели, нативно обученные в fp4 официальные nvfp4 от black forest это пережатые чтоль?
>Уже 4070 ti брала 3000 МГц чето не припомню. вроде только если подкрутить в афтербернере. 5070 ti 2850 держит стабильно без крутилок, если подвигать ползунки, можно и 3200 получить, дальше лезть не стал. андервольт лучше зашёл, с уменьшением tdp до ~200 ватт.
Я видел такое, что вам, людям, и не снилось. Атакующие корабли, пылающие над Орионом; Лучи Си, разрезающие мрак у ворот Тангейзера. Все эти мгновения затеряются во времени, как... слёзы в дожде... Пришло время умирать.
>>1608978 я думаю тому парню кто выше спрашивал можно не париться отдельным бэкендом под ллм. в некоторых вф , например видел такие для ltx 2.3 с промпт энхансерами и релеем сразу картинка идёт в qwenVL ноду она небольшая загружается и выгружается моментально и тут же на лету дополняет промпт, тем что она определила на картинке
кстати у меня почему то на ltx 2.3 prompt relay воркфлоу (я их три штуки уже опробовал) никак со звуком нормальным не получается сделать видео, сама картинка ок, а вот звук ансинк и искорёженный, пробовал и distill и dev модель? audio vae совершенно стандартный не пойму в чем причина. p.s легкий крик души во вложении
Аноны, возможно спрашивали уже, но я не нашёл. Вопрос: как заставить сырые картинки идущие в апскейлер и затем в видео чтобы они грузились в VRAM вместо RAM? Пытаюсь размазать всё по памяти чтобы избежать вываливания в оом, после VAE Decode (Tiled) у меня забита RAM на 99% и на следующем этапе где обычно у меня апскейлеры часто в out of memory падает, при этом VRAM на том же этапе не забита вообще ничем и там свободно 15 гигов. Как сгрузить картиночный кэш туда? Пытался покурить ноду VRAM Debug но она похоже просто для очистки, а не для перемещения.
>>1609481 А почему не в своп? Его ровно для этого и придумали, а видеопамять придумали для другого. А то ведь будешь потом придумывать ещё один костыль, чтобы CUDA в OOM не падала, вместо того, чтобы сделать нормально.
Аноны, есть кто с соры треда? Была такая жизнь бурная, хлебоходили, сктолько пацанов было, где вы все? Какие моря бороздите? Каждому бы пожал руку, с уважением.
>>1612964 Да, моддинг на 48 китайцами. Нейронка думает быстрее ибо модеил влезают, но на практике такую перкарню опасно хранить, или озлад нужен ебейший, а также шумоищоляцию. Где ж легально получить 48? Нищукам нет смысла получается пересаживаться с 3060 на серии 50хх, если модели все равно в оперативу грузятся. Было полчаса 5 секунда, станет 20 минут.
>>1612306 Объем видеопамяти = разрешение на количество кадров. 5060 8-гиговая даст тебе либо короткие ролики, либо в низком разрешении. Объем оперативной = для хранения и быстрой загрузки моделей. Если мало оперативы — придется файл подкачки до 100 гигов раздувать. Или GGUF-ы запускать.
В принципе, условной 1070 хватит, если ты терпеливый. А оперативы лучше 96+ иметь, желательно.
>>1612964 3090 даже 4070 ти не ебет, а подсасывает. Слабее 5070. Какая 5070 ти, я тя умоляю.
Зато на 3090 ты сможешь делать долгие видосы или в большом разрешении. Ну ты понял — видеопамяти больше.
Но есть INT8 кванты, возможно там 3090 что-то смогет.
>>1613000 Блин, ну хз, если лтх генерить, то было 60 секунд стало 40. Немного другой расклад. А если ты ценитель качественной анимации и Вана — то да, как будто ты прав. =)
>>1612964 Бля, я текст почитал. Офлод в оперативу нихуя не так работает. Если ты выгружаешь в оперативу контекст, то там замедление сразу до 90 минут. ) И у 3090 — то ж самое (тока до 120). Просто у 3090 сам момент «террибле замедления» наступает позже на 8 гигов.
А выгрузка модели в оперативу (если мы возьмем 4090 48 гиговую с коротким видео и 4090 с получасовым, я хз) дает замедление, но оно даже на ддр4 в районе х2 медленнее. А учитывая, что модель может весить 46 гигов, контекст 12, а у 3090 — всего 24, ты по сути 34 гига модели в любом случае кидаешь в оперативу, и разница с 5070 ти получается… Ну сам там посчитай, математика за 5 класс. Вряд ли 3090 вообще догонит 5070 ти, кроме как на карликовых видео, или на маленьких квантах (но опять же, nvfp4 на 5070 ти снова +25% скорости накидывает, а gguf бывают медленнее safetensors).
Короче, не еби мозги долбоеб мой друг, 3090 — охуенная видяха под LLM и модели, которые хотят быть целиком в видяхе, или у которых жирнющий контекст. Для видео 5070 ти будет точно не хуже, а местами и лучше за счет новых технологий. Но в ллм, конечно, ты в 16 гигов упрешься. Или в Trellis 2, например. Но для ллм есть V100 с 32 гигами уже. =)
Выбирай с умом, короче. Но не 3090 только под видео.
>>1613155 Я и не собирался паль накостыленную, просто интересно было б сравнение увидеть если все-таки граммотно китаец спаял. Кстати когда там планируется серия 60хх? До ее выхода можно и не мечтать чтоб цены снизились.
Я бы видюхи >24GB VRAM в нынешнем году в любом случае не рассматривал, прицел нужно брать на будущее и чем меньше VRAM в запасе, тем быстрее упрëшься. Выше уже написали, что на видюхе 50 серии с 16 гигами некоторые задачи вообще невыполнимы, в отличие от старой доброй 3090. Не стоит ждать чудес от консьюмерского железа, они тормознутые и разница между ними не настолько большая.
>>1613171 Какой гуй не приделывай, следование промпту от этого не улучшится и хуета не перестанет генериться
>>1613236 >Выше уже написали, что на видюхе 50 серии с 16 гигами некоторые задачи вообще невыполнимы, в отличие от старой доброй 3090. Старый добрый пиздеж. Квантов то нету, гуфование не изобрели, сидим пердим на видюхах шестилетней давности, а еще лучшая ос - спермерка! Верно, хуесос?
>>1613174 Да я скажу что и после 60хх цены не снизятся, во первых их будет жесткий дефицит во вторых, если 3090 сейчас можно купить за 50к, то 4090 до сих пор держит ценник 100к++
Сюда добавь еще технологический сбор который с сентября введут, новый НДС который каждый год расти будет, недавний запрет на заграничные пк, а также общемировую нехватку памяти...
>>1613257 Ты походу путаешь, 3090 без апгрейда новая стоит почти как 5070ти. В любом случаем может умельцы придумают как решить незватку памяти. Вон уже ужатые модели.
>>1613257 >технологический сбор который с сентября введут Вроде макс 5к. >новый НДС который каждый год расти будет Ну это да, я хуй знает там вообще наркомания, даже хуй посчитаешь >недавний запрет на заграничные пк Если не ошибаюсь он относится к хдд. ссд и ддр только (ну и прочим накопителям), вряд ли они встроенную видеопамять считать будут, видеокарта вроде по-другому учитывается.
Аноны, когда то в LTX2 делал пробные музыкальные i2v видосы, проблем с ними не было, звучит музыка, дамочка поёт. А вот в LTX 2.3 (использую dev + дистил лору) персонаж только поёт, музыка или затихает во время пения или звучит крайне слабо и очень всрато словно радио на заднем фоне. Нахера мне этот симулятор вокалиста? Думал может промптить разучился, попробовал копировать 1 в 1 промпты с цивитая именно для LTX в 2.3 где поют под музыку, всё равно в итоговом результате музыки нет, а есть только пение. Вопрос: как починить, или это LTX 2.3 так плохо в видеоклипы умеет? Или нужно только distill модель юзать?
>>1613259 Это ты по ходу путаешь, 3090 вышла 6 лет назад, какая новая? Очевидно речь о б/у как и 4090.
>>1613272 >Вроде макс 5к. Ну ты же знаешь какие охуевшие продаваны у нас. Эти 5к в финальной стоимости карточки легко могут прерваться в +25к
>даже хуй посчитаешь Согласно инициативе, с 2027 года ставка НДС для трансграничных онлайн-заказов составит 5%, с ежегодным повышением — до 20% к 2030 году. Впервые налог будет применяться даже к посылкам дешевле 200 евро, которые сейчас освобождены от уплаты пошлин. Ну фактически можно посчитать, ориентировочно 60xx будет в 2028 году, значит минимум можно +10% добавлять ко всем наценкам. Но как на деле будет конечно пока не понятно.
>относится к хдд. ссд и ддр С 27 мая 2026 года в России вводится запрет на параллельный импорт (приказ №4769) ряда компьютерной электроники, включая ноутбуки, ПК и комплектующие от брендов Acer, ASUS, HP, Samsung, Intel, ADATA и Toshiba. Ограничение касается коммерческого ввоза, чтобы стимулировать использование отечественных аналогов. Ошибаешься, да и список не сложно им расширить до nwida и ati
>>1613427 И че по твоей логике если ровно 6 лет проходит, то модель сразу снимают с производства и только б/у можно достать? На газоне вон вижу оригинал не бу продают.
>>1613236 >на видюхе 50 серии с 16 гигами Видяхи 50 серии есть с 32 гигами. >>1613257 >то 4090 до сих пор держит ценник 100к++ Потому что имеет опцию конверсии в 48 гиг, что резко помещает её в другой класс. >>1613272 >Вроде макс 5к. В этом 5, в следующем 10. >>1613531 >то модель сразу снимают с производства 30 серия снята вся, кроме 3060, которую собираются возвращать, лол. >На газоне вон вижу оригинал не бу продают. Они хорошо продутые оригиналом зовут. Я на яша-маркете б/у брал. >>1613534 Не себе а тебе, азаза.
>>1613531 По моей логике она была снята с производства 4 года назад перед выходом 4090. Видеокарта NVIDIA GeForce RTX 3090 была официально снята с производства осенью 2022 года в преддверии выхода флагманов нового поколения.
А то что на газоне продают под видом нового скорее всего рефёрб прожаренных карт с ферм.
>>1613545 Это не хрень, а давно известный факт что 4090 спокойно тянет 48 гигов, просто модули памяти заменяются на более объемные.
>>1613567 НУ хорошо перефразирую еще тупей для идиотов - по твоей логике на складах не осталось не бу карт? Куда деваются нераспроданные карты у посредников?
>>1613638 >Куда деваются нераспроданные карты у посредников? Их не существует, ни один кабан не будет держать карту на складе 4 года. Наоборот, все оптимизируют так, чтобы складские остатки были в минимуме. А 30 серия вообще застала майнинг, в те времена любая карта либо копала, либо копала. Я так моник себе взял за 30к, когда такие стоили от 60-ти. Просто по приходу увидел, что партия отлежала год, и кабан кабаныч скидки на газоне выставил в 50% и распродал модель в ноль, как раз для освобождения склада.
>>1613638 Чел, менеджеры прекрасно шарят, что выход новой серии сильно ударит по цене продукта и он станет сильно дешеветь, что равноценно убыткам, поэтому что не ушло вовремя пойдет по диким скидкам, ну как скидкам скорее по минимальной наценке, но главное чтобы быстро купилось, а покупатель всегда найдется.
>>1613938 Снижают цену пока не купят. >>1613958 Так 30 серию новую никто не продаёт, остались пере-пере-продаваны с палёными ригами. Да и никаких скидок на 30 серию не было, были уменьшение наценок, тебя бум майнинга не разбудил походу.
>>1614040 сам потестил тоже, нормуль генерит, брал вф от videoflow подкрутив слегка ползунки генерю в 1.8 мп с скейлером на х1.5 к лорам накидываю резонинг и mysticxxx, получается хорошо
Один минус ток заметил, управлять действиями в кадре стало проще, развернуть например с позы догги сзади лицом в камеру можно, но вот ебаная камера чет у меня хуй хочет двигаться, если промтю движения камеры, хуйня прост резко перепрыгивает сменяя ракурс без плавного перемещения.
>>1613567 >просто модули памяти заменяются на более объемные Ошибка. Апгрейдкит это текстолит с двусторонним расположением мест для памяти и 12 модулей гддр6х. Всё остальное берется с обычного донора 4090. Вцелом это не для васянов из 9Б у которых писька подросла и можно тралить двачи, и даже локальной моделькой на 40-45ГБ по мануалу из секретного телеграм-канала.
Экономика апгрейда имеет смысл если нужен гпу-кластер 192/384гб врам (4-8 бывших 4090). Весьма недурный сетап за такие деньги, 2000видяха+700кит/работа - даже РТХ6000про сосет по экономике, когда 4х4090/48=192гб выходит как одна РТХ6000про=96Гб + открываются возможности для сетапа на 8х4090/384Гб быстрой врам. Да, есть нюансики из-за отсутствия нвлинка, когда объединяют взрослые А100/H100 шиной 300...3000Гб/сек, но больше при обучении, при инференсе тот же vLLM эффективно делит нагрузку.
куртка планировал выпустить 5070 ti super, где всего одно отличие: модули памяти не двухгиговые, а трехгиговые. но потом зажопил из-за общемировой ситуации с оперативой. вангую будут переделывать на 24 кекобайта стандартные тишки рано или поздно.
слегка попускает желание лтх творить всякую дичь, улучшает общую консистенцию и заставляет усерднее следовать промпту, втыкаю на 0.5
"То, что должно двигаться, движется целенаправленно. То, что не должно двигаться, двигается меньше."
По крайней мере дропал лтх по основной причине что хуй его было как успокоить, чуть какое действие там все трясется, визжит и норовит съебаться куда то. простые движения вверх вниз превращались в восточный танец таза. сейчас уже лтх попустили и если пишешь в промпте что он разворачивает её лицом к камере и встает сзади неё, то это и происходит. Словил правда мальца бодихорор в гене, но получил зачетные сиськи у мужика, не суди анон строго, пока тестирую всю хуйню эту. некоторые лоры очень чувствительны и могут начинать разъебывать уже на маленьких весах.
дрифт хлебала это уже конечно другой вопрос, решается пока лорой на перса, вот чет хотел затестить тренинг на цивите, там как раз запустили 2.3, правда пока бета, но хуй он че тренит там у них, как не закидывал, он хуево ловит лицо. но я не сдаюсь. правда из 5 треник 4 крашатся, но хоть монеты возвращают.
искал дистиллированный sulphur ltx в nvfp4 кванте и что-то не нашёл. сконвертировал сам из bf16, картинка более-менее норм, жор памяти меньше, скорость выше. вот тулза для конвертации: https://github.com/silveroxides/convert_to_quant если мало ram то юзайте флаг -lm
Кажется я решился инвестировать в нейроблажь. Я понял, что ближайшие лет 5 не смогу без этого, а видюхи не будут дешеветь, серия 60хх намечается лет через 5. В связи с этим готов отдать кровные за 5070Ти (5090 дороговато). Думаю так генерации картинок и видео, а также языковых локальных моделей будет буст в 3 раза быстрей судя по табличкам. Но какие подводные? -Нужен ли новый мощный проц чтоб такую видюху не затормаживало? У меня сейчас i5-11400F (2.59 GHz) -Нужно ли гига охлаждение для такой махины? -Смогу ли я продать свою старую после 3 юза 3060 хотя б со скидкой -25% на авито и чтоб без кидалова? (думаю до осени подождать когда пророчат буст цен на видюхи) -В каком магазе купить не паль и не бу, не на газоне же лол? -Какая марка лучше? Я обычно гигабайт слейв, а палиту не доверяю, самое дешевое. -Эта громадина вообще стабильная и комфортная? Не дует пищать, скрипеть дроселями? Плюс ко всему еще новый корпус покупать, а то она большая, в старый не влезет.
>>1615459 та же ситуация, купил 5070ti на всякий случай, потому что хз что будет дальше.
>Нужен ли новый мощный проц твой проц поддерживает pcie 4.0 и AVX VNNI для ускорения нейросетей, думаю норм будет и так. при работе с большими языковыми моделями очень пригодится, если часть модели будет скидываться в системную ram и крутиться на проце.
>Нужно ли гига охлаждение то что производители ставят на 5070 ti и так норм. сделай снижение вольтажа чипа и вообще хорошо будет. 5070 ti с андервольтом при работе с нейросетями жрет где-то 200 ватт, температура в районе 60 градусов.
>В каком магазе купить не паль и не бу в обычном магазине, в который можно прийти ногами и пощупать-повертеть товар. что-то типа днс\ситилинка.
>Какая марка лучше? всегда недорогие палиты брал, похуй. 4070 ti gamerock classic 3 года проработала без проблем и продал за 40 (брал за 80), купил от той же фирмы 5070 ti gaming pro, полёт нормальный.
>Эта громадина вообще стабильная и комфортная? могут быть проблемы с драйверами и совместимостью, 50xx серия в плане дров сырее чем предыдущие. надо сносить полностью все предыдущие дрова через DDU. если материнка не очень новая, тоже могут возникнуть проблемы, мне помогло принудительное включение pcie 3.0 режима.
ну и самое главное - количество оперативки. если у тебя хотя бы 32 гига, а лучше 64, то всё отлично. если 16, то прирост скорости похерится частым свопингом в файл подкачки, при юзании тяжёлых моделей типа WAN\LTX.
>>1615493 А научи продавать, если ты не знакомому стряхнул. Как обмен происходит? Карточку их службой сразу с почты россии слать или надо с заказчиком встречаться? Для меня такие очевидные вещи не очевидны, я ссу. Но там же есть страховка если что, т.е. деньги у посредника задерживаются плюс менты если что впишутся? Очень не хотелось бы попасть на школоивела или какого-то дебила.
>>1615498 знакомым обычно продаю, либо в группе города на барахолке, далее передача в руки и желательно проверка на железе у покупателя. со всякими гавновито и отправкой кому-либо посылкой предпочитаю не связываться, если что не так пойдет то побегать придется прилично, там всем на всё похуй.
>>1615459 у меня такой же проц анон, ток 4080, все летает, ван лтх генерятся минут за 10 (не в шакалах) ничего дополнительно думать не надо поставил и генеришь себе всю хуйню
Единственное что я себе зарядил 128г ддр4 еще до повышения цен Просто 64 сейчас для тяжелых моделей уже чутка не хватает
Тот же лтх я генерю на бф16, 45 гиговая хуйня отьедает ток рама гдет 90+ А свидетелей имбовасти ддр5 яб сажал жопой на их плашки Ничего не увидишь, разницы не почувствуешь, переплачивать вообще смысла нет
16-32 это рама нет не уважение будет к 5070, та и будешь постоянно ебаться потому как нормальные модели влезают туда ток после танцев с бубном (а то и хуй)
>>1615542 группа вконтакте, доска объявлений города. >>1615555 попробуй на этом хуито не что-нибудь копеечное продавать раз в месяц, а подороже и почаще
>>1613174 >>1613257 Справедливости ради, 6000 пока не очень активно планируется. И сколько там будет памяти, и какие там будут чипы — вопросик. Вон, Маску вчера в твиттере Нвидиа пожелала поскорее попробовать Веру. А нам не пожелала.
>>1613638 Их все распродали году эдак в 2023, когда 40хх версия и вышла. Именно новые тогда по 80к на мегамаркете с кэшбеком отлетали. Ну и на остальных плошадках. А 4090 тогда 120 стоила, кстати. Так что, производительность = цена, старт прадаж, не было ажиотажа еще в начале года. Но раскупили и усе.
>>1615459 > Нужен ли новый мощный проц чтоб такую видюху не затормаживало? Для диффузий — нет. Для LLM нужен и проц получше, и память, вообще-то, DDR5, и лучше много и быстрая, разгон, охлад, 24 канала, иди нахуй, короче.
> Нужно ли гига охлаждение для такой махины? Холодная, пиздец.
> Смогу ли я продать свою старую после 3 юза 3060 хотя б со скидкой -25% на авито и чтоб без кидалова? На мегамаркете были 12к, за 9к готов забрать, без кидалова. =) Но ваще за авито хуй знает, с рук да, по почте куча наебов разных.
> В каком магазе купить не паль и не бу, не на газоне же лол? Озон и ВБ у проверенных продавцов — не паль и не бу. ДНС пару раз ловили на пали и бу, так что думай. ))) Конечно, в ДНС проще, но на ВБ 80к (до 70к скидки), а на остальных… 90-100.
> гигабайт слейв, а палиту не доверяю, самое дешевое Гига одна из самых плохих, палит одна из самых лучших, добро пожаловать в 2015 год и дальше. Ну ладно, там еще МСИ любит обсираться, да и Асус.
Но по факту — похую, модели разные даже у одного производителя. Выбирай просто самую дешевую на ВБ и читай обзоры конкретно на нее, ищи отзывы у инженеров на ютубе. Плохая — бери следующую.
>>1615617 Ладно, ну буду тебя слушать, я понял что ты пиздобол (особенно на ВБ 80к (до 70к скидки), а на остальных… 90-100. хех), но спасибо за простыню, я ценю.
там кстати ноды для лтх есть на разделение дистил лоры на видео и аудио слои для разных весов, чтоб аудио не херилось, но это тоже пока тестирую, вроде получше с аудио стало
ну потестил >>1616003 в целом вроде как в разы адекватнее модель стала воспринимать движения (по звуку тут не скажу нет возможности проверить сейчас, надеюсь она там не визжит истошно как бывает)
использовал ерос10 бф 16 из лор ток omninft и reasoning
>>1616154 Слущий, а можно ли этой приблудой заставить тян стонать в персонаже? Например Пинки Пай или как Заяц из ну погоди? Сгенерь любого известного перса плз.
>>1616178 не понял вопроса мальца анонче, ты генеришь перса где хочешь и потом кидаешь просто в лтх и промптишь что хочешь, тут например я прогнал через клейн в и2и, и кинул её в и2в
>>1616154 если ты имел ввиду голосом перса, то там можно прикрутить референс голоса, но я его не тестил честно скажу, насколько он похож, но такая хуйня есть
>>1615621 О, ты решил не слушать меня, наебать себя и обосраться? Ну ок, ладно, чел, успехов. =) Это охуеть как странно, но дело сугубо твое, конечно.
> особенно на ВБ 80к (до 70к скидки), а на остальных… 90-100. хех Не понял в чем тут пиздаболия, если это верифицируется простым поиском по торговым площадкам и магазинам. =)
>>1599474 (OP) Аноны, вкатываюсь в генерацию видео. Хочу взять сцену из начала Криминального Чтива и сделать плавный отъезд камеры. В оригинальном монтаже есть склейка когда парень с девушкой целуются и после этого они начинают ограбление. Хочу превратить это в один план. Это упражнение.
Что я сделал на данный момент:
Нарезал три набора клипов. Где только парень. Где только девушка. И где они оба в кадре.
1) Что с этим материалом делать? Можно ли обучить лору на каждого персонажа? Нужно ли?
2) Как мне сохранить нарезку для обучения? Одним файлом на каждого персонажа или каждый клип по отдельности?
Мой план такой:
1) Я делаю 3d модель сцены с примитивной графикой. Анимация, модели, все сделаю. Это я умею, работаю в ААА-студии.
2) Обучаю лору на каждого персонажа и на сцену где они вместе.
3) Приделываю лоры к персонажам в 3d-сцене.
4) Генерирую и немного редактирую в видеоредакторе.
5) Profit!
На третьем и четвертом скрине кадры которые разделены склейкой в оригинале и которые я собираюсь объединить в одну последовательность.
Дайте, плиз, воркфлоу на комфи, чтобы ваном анимировать изображение. Хочу чтобы у тяночки просто волосы развевались на ветру. Попробовал пару шаблонов, оно мне видео по мотивам промпта генерит. Промпт. Animate the input image only. Keep same character, same face, same clothes, same pose. Only subtle breathing and hair moving in the wind.
На выходе видео релейтед получается. Если не уточнять промпт, то вообще левых баб генерит.
>>1616508 Ебать ты нагородил братишка. Если у тебя жирная видюха, 3090,4090,5090 тогда можно на лоры вообще не заморачиваться, просто разрешение побольше сделай и всё.
Вообще 3 картинку делаешь FF, а 4 LF. В промпте пишешь что они перестают целоваться а камера отъезжает на вайдшот, показывая их в закусочной. Всё.
>>1616604 Анимация картинок это ж база! Лови вот такой в качестве примера, в основе дефолтный воркфлоу от комфи. Ох и подзаёбся же я когда-то с этой шляпой, пока местные аноны не подсказали что как.
>>1616977 Воркфлоу в видео, просто перетяни видео в комфи мышкой.
Если более серьёзный подход то надо лору на Тима и в идеале на бабу, а то не исключено что она на Тима похожа будет. Ну и в промпте все прописывать очень детально, в плоть до того в какую сторону движется голова и что делают руки.
>>1617170 Я вот что понять не могу. Почему оно промпт мой почти игнорирует. Прописал типа >Аниме девушка, игровой персонаж в позе ожидания, грудь девушки поднимается и опускается от дыхания, а волосы развеваются на ветру. Тело слегка покачивается в стойке. Anime style, 25 frames looped video. Ну и вариации подобного. Сид каждый раз новый. Но каждый раз она только волосы анимирует. Больше ничего не делает.
>>1617256 Видимо оно не хочет двигать девку никак, потому что в моем воркфлоу есть первое и последнее изображение.
Просто меняю твою ноду WanИзображениеВВидео на WanFirstLastFrameToVideo из workflow что мне до этого скинули, и она опять делает статичное тело. Однако волосы и одежда развевается на ветру. Пиздец как странно.
С твоим вариантом можно живее анимацию получить, но зациклить будет проблемой, а с FirstLastFrameToVideo идеально зацикленно получается.
>>1617479 Для sora экспириенса надо какое-то древнее говно брать.
Может лучше нормальный экспериенс получишь? =D
Wan2.2 для хороших анимаций в 16 фпс, LTX-2.3 для скорости и звука в 25 фпс. Вот и весь выбор. Нужен тебе звук или нет, критичны тебе хорошие анимации и движения, или сойдет похуже, но в 25 фпс. Для Wan выше накидали, вроде, для LTX-2.3 возьми https://huggingface.co/RuneXX/LTX-2.3-Workflows
>>1617497 >или сойдет похуже слыш извинись перед лтхом уже работяги допилили как обычно даже эту ебаную ублюдскую деградацию цвета победили уже запилили тебе лтх директор, который ебет тот же svi в ване во всех позициях не надо костылями аудио прикручивать, все получаешь в лучшем виде с липсинком и даже русиком если хочешь
Я не скажу конеш что лтх без проблем, но для локала это уже прям все в одном без сильной ебли
А сгенерь что: В двери на заднем плане появляется голый мужик, а баба, не опуская хуя, резко оборачивается в сторону мужика в проходе, говорит про сюрприз и обратно поворачивается в камеру. Мужик подходит к ней сзади. Камера немного поднимается вверх и мы видим как мужик стоявший позади неё пристраивается к её жопе.
>>1617539 Слыш, извинись. Че там допиливать, деградация цвета сдохла сто лет назад, не видел ее хз сколько. Какой директор, норм делай норм будет. Аудио костылями прикручивать? Это проблема еще на старте LTX-2 которая была, и которую тогда же пофиксили? Ты из 2025, что ли? Я всех этих проблем тыщу лет не видел уже.
Берешь обычное воркфлоу от РунХХ и погнал.
Но, если лоб в лоб сравнивать анимацию Wan2.2 и LTX-2.3, все же LTX уступает. И это факт. Плюс, LTX обучалась на реализме (привет Z-Image!), и в аниме не умеет, а Wan там себя очень неплохо чувствует. Хотя Sulphur немного дотягивает аниме, конечно.
Поэтому и я предупреждаю человека сразу: если он ебать какой ценитель охуенной анимации и не готов на компроиссы, то это только Wan2.2 и его тюны. Но я не настолько ценитель и сижу на LTX-2.3, плюс там скорость генерации раз 5-6 выше, наверное.
А SVI, кстати, никогда не был пушкой. Я правда не понимаю, почему кто-то в треде на него дрочит. Ну, первая версия была крута как концепт, а после выхода второй вскоре вышел LTX-2, и поделил смысл на ноль. Ну да, для ценителей анимации и движений…
(кстати, в твоем видео нет воркфлоу, надо без аудио выкладывать, которое=)
Все ждем LTX-2.5 обещанное. Оно должно помирить оба лагеря, в теории. =)
>>1617433 Я не понял сообщение. Можешь поподробней? Я знаю что есть нода цикла, для генерации по итерациям (из-за чего я и решил вообще в комфи из автоматика перекатится). Я не понимаю как это связано с тем что я хочу чтобы Wan сгенерил видео с одинаковым первым и последним кадром, но анимировал промежуточные?
>>1617588 >Слыш, извинись. >Че там допиливать, деградация цвета сдохла сто лет назад, не видел ее хз сколько. >Какой директор, норм делай норм будет. >Аудио костылями прикручивать? Это проблема еще на старте LTX-2 которая была, и которую >тогда же пофиксили? >Ты из 2025, что ли? >Я всех этих проблем тыщу лет не видел уже.
Слыш сам извиняйся (без негатива анонче если что), я писал про ван и про то что аудио надо к вану прикручивать. ну эт ладно просто после лтх с русиком, видосы на ване больше не вставляют :(( Ван я б вообще не юзал уже для своего времени да, но теперь через разные костыли ебаться преодолевать 5 секундный лимит и прочее, ну нах.
Деградация цвета была всегда в 2.3 это особенность 2 семплера, фиксили костылями в виде коррекции цвета, снижения разрешения до шакалов, но сча высрали новый семплер на 2 стадию и стало в разы лучше. OmniNFT тоже починил лтх мальца
А про директор посмотри, там не про норм делай, там про контроль сцены через ключевые кадры, пиздатая штука таки
>Wan там себя очень неплохо чувствует так у вана все 2д это считай 2.5д он же вообще не умеет в онеме, не может там и заебали его уже до посинения, что научился, но уже похуй, в лтх вон лору с аниме киберпуком высрали, так там онеме хоть на онеме походже
Но как заметил, скорее из-за того что ризонинг лора затрагивает частично тоже что и омни,они хуево вместе стыкуются, так что если юзаешь омни то отрубай ризонинг.
у видеофлов прикольные вф но под последние ноды они не апгрейчены,и там проблема деградации цвета не решена новым семплером,он затыкает это цветокорекцией (ну и его вф очень хуево поддаются самостоятельному модингу, там так все перекручено, какие то ебейшие расчеты сигмы,я когда чет прикручивал к его вф прост заебался этот клубок распутывать)
Могу порекомендовать вф от тюнера эроса, он даже запилил пиздатые ноды, одна из них это новый семплер Там мне понравился вф, чуток докрутить его нужными нодами и хорошо становиться.
>>1617686 > и у руны такие себе вф Ну, я взял его базовую за основу, докинул свитчеров, и это одна универсальная — и липсинк, и т2и и и2и, и превью генерации. Для прямых видосов очень годно.
Попробуем вашего директора.
> Ах да там дистил лора Не нужна. Я дистил моделью генерю, мне лень 20 степов ждать.
Ну я возьму директор для начала, судя по видосу, там нода, а не сабграф, что удобно. Попробую свои дефолтные модели.
И ризонинг лора… вот вроде она хорошая, но ситуативная. Может омни будет лучше? Тоже спасибон.
Конечно, директор подкупает интерфейсом. Удобство зачастую… да, хочется. )
>>1617992 Она поддерживает pytorch не выше 2.5.1, из-за этого многое не работает. В целом можно генерировать, но с оговорками. За эту цену лучше ничего не будет.
>>1617605 Да как-то так в целом и работает. Жирнее промпт - больше шансов на изменение картинки. Больше шагов - ещё больше шансов на изменения. Под "нодой цикла" я имел в виду WanFirstLastFrameToVideo, потому что она для зацикленных видео. В ней можно отключить end_image и видео будет не зацикленным. Это даст ещё больше изменений в видео со стороны Вана.
>>1617992 V100 — слабый старый чип и быстрая память. Для LLM имеет смысл брать 32-гиговые — лучше нет варианта среди бу. Но для всего остального смысла нет.
>>1618860 Она точно генерит быстрее 3060, сравнивали лоб в лоб на одинаковых воркфлоу? Потому что я не запускал, а пару месяцев назад она вообще никуда кроме LLM не ехала.
>>1618978 Это где за 10к? Ты же это с переходником и охладом посчитал уже, надеюсь, не придется по 15к накидывать на каждые 10к? Я бы посмотрел ссылочку. =)
>>1618007 Клоун, почему у меня тогда питорч 2.10 стоит и все прекрасно работает? Но, если что, ван v100 пиздецки медленная, ибо нет ни сажи, ни поддержки 8 бит. Для видосиков я не советую ее брать. А вот картинки норм.
>>1619185 > ибо нет ни сажи это что такое? > Для видосиков я не советую ее брать. да просто я хочу попробовать, хочу вкладываться в железо на минималках и еще меньше. если не зайдет, то так же выкинуть на авито за две копейки. > А вот картинки норм. так для картинок есть <google gemini> вообще не надо покупать никакого железа и разбираться во всем этом.
У кого нибудь есть такая проблема с 10Eros что персонажи пиздят хотя по сценарию не должны? 1 в 1 тот же промпт переношу с LTX 2.3 на Eros, даже в негатив закинул всё что касается речи speech и conversation и во время прона персонаж(и) иногда произнесят пару реплик (и судя по всему реплики час промпта, хотя там их нет как нет и каких то кавычек, такое впечатление что модель багнутая где то косячит с энкодером и считает какие то куски промпта речью словно они в кавычках).
>>1619315 Баба будет вслух проговаривать твой промпт, пока ее ебут, из за шизы LTX 2.3 в целом. Чтобы такого не было, добавь в промпт стон в виде - she saying 'mmm...aaa...mmm' типо такого, и её рот будет занят только стоном.
Сап, какая видюха по характеристикам лучше для нейронок, генерации видео, пикч, а также языковых моделей? Та у которой больше памяти (но я хс, есть же спец сжатые модели, которые не сильно уступают по качеству) или все же у которой больше частота? Посоветуйте любую в пределах 50-90к.
>>1619791 Во-первых, советую перестать читать желтушное СМИ, с ними ты говна нажрешься пиздец. Нет никаких «спец сжатых моделей», всегда нужна видяха, где видеопамяти побольше, ВСЕГДА. Я мог бы тебе начать объяснять, как работает квантизация, какие там потери, деградация и прочее, но это не имеет смысла особого. Потому что это не имеет никакого отношения к памяти в итоге. Захочешь запустить большую модель, а у тебя 8 гигов памяти — запустишь ничего. Особенно не верь высерам типа Bonsai 1-bit, TurboQuant, RotorQuant — там либо говно, либо вообще не про размер моделей, а про размер контекста (кэша). Просто полнейшую хуйню СМИ и тупые блогеры несут, а наивные люди потом страдают.
Во-вторых, для генерации видео, аудио и картинок нужен мощный чип, а для генерации текста — много видеопамяти. Вот и выбирай. Для генерации видео сойдет от 5070 — пусть 12 гигов, зато 48к рублей и мощный чип. Для генерации текста 5060 ti будет чуть получше для некоторых моделей — да, чип заметно слабее, зато 16 гигов уже. Или вот V100 — отличный вариант с 32 гигами за 50к рублей. Там быстрая память. Но бу, и нет многих технологий. Но быстро все еще. Для генерации видео, кстати, неплохо иметь 96+ гигабайт оперативной памяти, потому что модели надо где-то держать. А вот если ты планируешь запускать большие MoE-модели (у которых много суммарно параметров, но активна лишь малая часть), то тебе нужно много быстрой оперативной памяти. но сейчас это не сильно дешевле видеопамяти. Много: значит МНОГО БЛЯДЬ, не страдай хуйней, не 32 гига, а 128, 192, 256, 384, 512, 768, 1024 гигабайта… Ну, зависит от модели. При этом видеокарта — тоже нужна, ибо есть общие слои, модель-роутер, которые работают всегда, поэтому их лучше держать в видеопамяти. Так что, для больших текстовых моделей лучше иметь 128+ оперативы и 16+ видеопамяти. RTX 3090 — тоже рабочий вариант, и мощный чип, и технологии плюс-минус, и 24 гига. Тока майненные и горячие капец.
Короче, бери RTX Pro 6000 Blackwell с 96 гигами, две штуки. С Китая всего 1,5 ляма рублей за обе, херня вопрос. Зато 192 видеопамяти и чипы на 10% мощнее 5090. Совет такой. =)
>>1619873 >96+ гигабайт оперативной >128, 192, 256, 384, 512, 768, 1024 видеопамяти >всего 1,5 ляма рублей Красноглазик, спок, сам-то на каком сетапе сидишь, какую модель гоняешь?
>>1619791 12 - входной минимум, дальше смотри сам. Сжатые - на то и сжатые, что с потерей качества. Ну и это, "нейронки" - они какбы совсем разные под разные требования и задачи. Наверное, сначала нужно определиться для чего тебе и какую модель планируешь, а дальше собираешь под нее сетап.
>>1619791 возьми 5060ти с 16г и горя не будешь знать, если деньга позвояет то тогда 5070ти, 12 гиговый огрызок я бы брать не стал честно, обьем врама все еще решает довольно сильно. да и рама надо прилично накидывать
сам сижу на сетапе из 4080 и 128 ддр4
хватает для всех радостей, и видосы погенерить и арты.
ллмки тоже нормально работают (не учитываю те где надо три 5090 смотанных изолентой) а так, покумить чуток да порпшить засунул сейчас гему4 31б полет нормальных, скорость меня устраивает.
да и не слушай этих свидетелей имбовости ддр5 и прочей хуиты, ты разницу между ддр4 и ддр5 не почувствуешь но для комфорта надо минимум 64, для моделей побольше уже 128 лучше, тот же лтх у меня забивает 100г на генерации
>>1619922 Лично я бомжара, 16+128, минимаксы всякие, глм, квены.
Но сейчас гемма 4 и квен 3.6 ебут, смысл в сетапе пропал.
Пока не выйдет очередная ротебать мощная модель, типа минимакс м3, какой-нибудь.
>>1619992 > разницу между ддр4 и ддр5 Всего в 2 раза быстрей в LLM. Хуйня, да. 15 или 30 токенов в секунду. Но для всего остального и правда похуй, хоть на зеоне собирай с ддр3 (лишь бы не сгорела старушка=).
Поэтому и говорим, что для текстовых и всех остальных — все же чуть разные сетапы. Хотя 3090 / V100 (по словам чела выше) — все еще очень универсальный совет для всего.
>>1619873 НУ ты базы вывалил, но все ж макс предел бюджета 90к (почти 2 моих зарплаты). Даже RTX 3090 дорого блин. v100 тоже дорого, 150, а не 50к (если мы про тесла говорим), за 50 ток китайское бу тсранное. Ты б сам взял? Кстати, ты эксперт в желтушной пресс, новости считаешь, как думаешь там из-за какого недавнего закона на импорт запретят карты нвидиа импортировать?
>>1619992 Допустим я не планирую гонять в шутеры. Цена на 5060ти и 5070ти (16гб) почти в два раза отличается, а полезность для нейронок тоже в 2 раза отличается? Везде пишут, что глав задача это модель в Врам запихнуть, да врам по-больше. Это так? Как мне проверить разницу в скорости геннерации с теми же самыми сетапами нейронок? Также необходим ли мощнее процессор, чтоб он не затормаживал более крутейшую видюху сильно? Мне не хотелось бы весь комп обновлять.
>>1620004 >Всего в 2 раза быстрей в LLM ну не прям таки в два, но в целом соглашусь там побыстрее и всетаки кудахтер для ллм это несколько другая задача все таки, на средне аноновском компе таки хуй разницу сильно заметишь, мелкие модели как летают так и будут летать, что покрупнее как будет еле пердеть, так сильно шустрее пердеть не станут.
ну сейчас это не совсем корректно, например я пихаю в 16+128 лтх бф 16 45+ гиговый и видео генерится минут за 10 Врам существенно влияет на тот же размер латента, и другие сопутствующие параметры, тип хуй ты погенеришь на высоком разрешении если врама мало
сейчас все вываливается в рам, при гене видео в лтх у меня карту забивает гдет на 85-90%
по картам хз анонче, прямых тестов я хз, найти ли где нибудь или нет, но ясен хуй у тебя 5060 будет медленее генить чем 5070, тупа будешь дольше ждать.
На процессор в целом похуй, у меня старый кирпич и5 11400
>>1620009 Ну, как ты понимаешь, сам я не взял. ) Просто справедливости ради — много людей берет. Это я такой параноик, что из старых карт у меня только Tesla P40 по 16к (P104-100 не считаю, они копеечные). Ни P100, когда они по 25 стоили, ни V100 по 50, ни 3090 — я не брал.
НО, из-за моей паранойи не стоит отказываться от такой опции. Каждый сам для себя решает.
> из-за какого недавнего закона на импорт запретят карты нвидиа импортировать Вся ирония в том, что если ты имеешь в виду отмену параллельного импорта для комплектующих и ПК, то видеокарты в этот список не входят и, в теории, подорожать не должны. Но практически продаванам ничего не мешает задрать цены за компанию.
Насколько я знаю, дела так обстоят. Фиг че посоветуешь в такой ситуации. =/
>>1620013 Если хочешь, могу сравнить, есть и 5060 ти, и 5070 ти. Но в среднем, отличие будет примерно такое же, как и в GPU-Z по терафлопсам, ибо поколение одно, технологии одни. Производительность скейлится арифметически. Так что, 42к и 76к… Ориентируйся исключительно на свою терпилку и че там по терафлопсам.
Процессор почти не влияет, нюансы с псп рам, ддр5 получше, хороший контроллер памяти получше, но мизерное влияние, на фоне чипа видеокарты. Так что сильно бы я не заморачивался, если честно.
>>1620034 Дешевле и проще купить 120 гб ссд и выделить его целиком под файл подкачки. Будет для него мучительно, для генерации долго, зато для тебя дешево, на фоне 96 гигов видеопамяти. Ну, или хотя бы 64. 64 ддр3 и правда дешево звучит, конечно.
>>1620053 Да не параноя это, а мозг включенный не дает совершить ошибок. Слушай, а у тебя эти карты прямо физичиски с тобой или в облаке? Мне не хочется напрягать так сильно, это ж корпус разбить и много всего делать, но если реально скрины запостишь, то ты мой герой и герой треда будешь. Главные тест подходящие четко провести - ване один тот же проект (со второго раза) и чтоб все влезало в память. В сд ту же самую картинку. В текстовой локалке ту же самую модель и чтоб одинаковое чило токенов. У 5070 частота ниже! 5060Ti (16Гб) от 2407 МГц до 2617 МГц 5070Ti (16Гб) от 2300 МГц до 2497 МГц Может тут скорее скорее число ядер и шин. Все ж что если разница будет не 2 раза, а около 35%. То есть оно погоды толком не будет делать и по сути это чтоб больше врам было, чем на моей 3060, тогда можно и другие карты смотреть дешевле где 16гб.