Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.
>>1488387 → На что хуй быстрее, выше, сильнее встал — та и подходит. Да, перебором, грузишь одну пару, смотришь на результат, грузишь другую, третью… В итоге фаворитов прогоняешь еще по несколько раз, проверяешь, не показалось ли.
>>1488800 Бедные, прикиньте, сколько им пришлось сделать черрипиков, чтобы ван так хуево сгенерил. Небось и промптили, и шаги зануляли, и че тока не делали… Надеюсь, их труды не пройдут напрасно, и Ван РЕЛИЗНУТ 2.5!!! Пидры. =с Хде мой опенсорс.
>>1488853 "На днях на конференции представители Wan упомянули, что они не сделали Wan 2.5/2.6 открытым исходным кодом, потому что он слишком большой для сообщества. Судя по комментариям о проблемах с LTX, я думаю, они были правы. Ребята из Wan сказали, что, возможно, когда-нибудь выпустят более облегченную версию. "
Does anyone have recommendations for better prompt adherence? I've been using https://www.kling2-6.com to assist with my Kling 2.6 prompts, and the results are pretty stable. Worth a look for the toolset.
В воркфлоу пакеты moondream. Не ставились пока не поменял уровень безопасности в комфи. Поменял, теперь просит авторизоваться в гитхабе. Че за прикол? С каких пор нужно зайти в гитхаб чтобы скачать пакеты?
Сколько не пытаюсь на лтх2 сделать что-то нормальное, одна хуйня выходит. Либо просто картинка с зумом, либо очень слабое движение. Как бы я ни писал промпт, даже через флоренс описывал инпут имаджи, все равно хуйня какая-то. Промпт вообще нахуй идет, генерит вообще не то, что я прошу. Качество тоже по пизде. ЛТХ2 это наеб просто какой-то глобальный?
>>1488921 В сообществе и RTX Pro 6000 встречаются, так что они немного лукавят. Я верю в Wan-2.6 с его персонами и временем инференса, но вот Wan-2.5 вполне возможно запустить люди могли. Надо помнить, что ЛТХ-то сам по себе плохая модель от не самых умелых авторов. И размер — не показатель качества, в данном случае. Дома люди все равно генерят не 1920*1080 (хотя я вчера ради интереса на лтхе делал такой ролик, без апскейла, вышло неплохо). Так что, они просто взвесили пользу от хайпа и заработок и решили, что на апи и подписках заработают больше, чем поднимут репутации.
>>1489167 Не настолько, что-то не так у тебя. Она в деталях следует промпту хуже вана, и знает меньше, но в общем понимает и делает, что от нее требуют. Выглядит как какой-то технический баг, по твоему описанию.
Оцените ворк плиз. А именно самое начало, где модели и клип лоадер. Как к этому прикрутить новые nvfp4 модели и есть ли смысл 5070ti у меня ? А если оставить как есть, стоит что-либо заменить? Вдруг я генерю на том что вообще плохо сочетается.
Там оказывается Nvidia завезла в новый драйвер супер оптимизон, все ведь в курсе? У меня ltx и всякие квены/флаксы дали +30% к скорости, с сажей где то 40-50 вообще. Rtx 4070s. Интересно как будет на wan, про него чет не писали, но т.к это касается fp8 в целом то и там наверно будет ускорение
>>1489532 Так нужно только драйвер обновить или еще Комфи? У меня последний разваливается почти каждый раз когда я его апдейчу, приходится заново все собирать. Ради 30% перфоманса можно бы и да, конечно
Драйвер студио я обновлял. Насчет гейреди обычного не в курсе. Комфи обновил без зависимостей, но насколько я понял, туда коммиты были уже как неделю добавлены с этими фишками
>>1489661 Комфи обновлял? Прибавка сразу в глаза бросилась. LTX было 5-6 секунд за итерацию на дефолт воркфлоу, стало 3.4-3.7 ( с сажей). У меня если че винда и драйвер студио версия.
В Qwen edit 2511 генерация была раньше 30-35 секунд, сейчас делается за 19
>>1489666 А еще у меня оперы забыл сказать 96 гигов, может у тебя на диск офлоадит, а тут как раз оптимизон на эти дела, Если на диск сбрасывает то понятно тогда почему не работает
>>1489666 У меня Квен Едит на 4090 и 128рам работает 2 минуты. Не подскажешь почему у тебя так быстро? У меня правда ddr4, у тебя может ddr5? В оперативу выгружает что-то когда работает, да. Но мб какие флаги нужны, чтобы только туда? Юзаю fp8 квант
Что-то у меня после обновления драйверов ускорения не получилось. =( Но я обновил игровой. Возможно реально нужен студио?
А может это все тут не причем? Асинк энд пинд давно включили, пишут — возможно, я как раз видяху менял с 4070 ти на 5070 ти в декабре. А нвфп4 ускорялся на глазах в комфи — от «медленнее фп8» до «чутка быстрее», но качество в лтх было говенным в фп4.
Короче, не до конца понял, когда будут ускорения… Если кто убедится, что дело в студио драйверах— отпишитесь, плиз.
А че сору Наебнули чтоли? Попытался сейчас старый промт сгенерить и если раньше все диалоги умещались теперь либо молчат либо одну фразу успевают сказать.
А, все, fp4 норм работает (умеренно), но она есть только для dev-версии, и из-за cfg 4.0 работает все равно дольше, чем дистилка. fp4 не спасают. Если бы дистил была, но то ли я дурак, то ли ее не выпустили. Там бы ускорение помогло бы.
>>1489398 Какое апи 2.5 когда у них самих уже есть лучший 2.6, не говоря уже о конкурентах? Нет ни одной причины не дропать веса, но они выбирают быть пидорасами. 2.1-2.2 нам дали ибо они тестовые, как и 2.5 тест версии со звуком