Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 48 27 19
Локальной генерации ИИ-видео №3 ltx-2 /aivideo/ Аноним 13/01/26 Втр 15:17:44 1488357 1
17682492503591.mp4 2421Кб, 960x960, 00:00:09
960x960
17681347240110.mp4 950Кб, 480x480, 00:00:11
480x480
v shapku.mp4 2587Кб, 704x1024, 00:00:20
704x1024
sdf.mp4 849Кб, 320x512, 00:00:14
320x512
Актуальные модели

1. Wan от Alibaba

https://huggingface.co/collections/Wan-AI/wan22

VACE модели:
https://github.com/ali-vilab/VACE
https://huggingface.co/Wan-AI/Wan2.1-VACE-14B
https://huggingface.co/Wan-AI/Wan2.1-VACE-1.3B

2. Hunyuan от Tencent

https://huggingface.co/tencent/HunyuanVideo-1.5

3. Ovi

https://huggingface.co/chetwinlow1/Ovi

4. Starflow

https://huggingface.co/apple/starflow

5. LTX-2 - делает локальную генерацию грейт агейн.

https://huggingface.co/Lightricks/LTX-2

1. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

2. LongCat-Video

https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video
https://meituan-longcat.github.io/LongCat-Video/

3. Wan 2.1

https://huggingface.co/collections/Wan-AI/wan21

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Hunyuan Video (осторожно, ссылки в туторе на предыдущую модель): https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

Гайд для использования Wan 2.2

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan: https://github.com/kijai/ComfyUI-WanVideoWrapper

Где брать готовые LoRA
https://civitai.com/models

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Терминология моделей
prune — удаляем ненужные веса, уменьшаем размер
distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше
quant — уменьшаем точность весов, уменьшаем размер
scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше
merge — смешиваем несколько моделей или лор в одну, как краски на палитре.

lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.


Предыдущий тред
>>1439768 (OP)
Аноним 13/01/26 Втр 15:19:21 1488362 2
a vash.mp4 2115Кб, 960x1280, 00:00:12
960x1280
Перекатил как мог анончики, можете ругать.
Аноним 13/01/26 Втр 16:18:47 1488413 3
>>1488387 →
На что хуй быстрее, выше, сильнее встал — та и подходит.
Да, перебором, грузишь одну пару, смотришь на результат, грузишь другую, третью…
В итоге фаворитов прогоняешь еще по несколько раз, проверяешь, не показалось ли.
Аноним 13/01/26 Втр 18:22:29 1488505 4
000.mp4 3445Кб, 464x688, 00:00:06
464x688
0.jpg 335Кб, 784x1168
784x1168
000.jpg 278Кб, 784x1168
784x1168
Аноним 13/01/26 Втр 21:33:29 1488732 5
vid00017.webm 1050Кб, 752x1104, 00:00:05
752x1104
vid00018.webm 1641Кб, 752x1104, 00:00:06
752x1104
vid00011.webm 5043Кб, 720x1136, 00:00:06
720x1136
vid00039.webm 1572Кб, 784x1056, 00:00:04
784x1056
Аноним 13/01/26 Втр 22:14:14 1488758 6
image.png 63Кб, 433x272
433x272
Аноним 13/01/26 Втр 22:50:48 1488800 7
1000018574.mp4 9343Кб, 1280x720, 00:00:37
1280x720
Как же они рейджбейтят
Аноним 13/01/26 Втр 23:28:25 1488846 8
>>1488800
Бедные, прикиньте, сколько им пришлось сделать черрипиков, чтобы ван так хуево сгенерил. Небось и промптили, и шаги зануляли, и че тока не делали…
Надеюсь, их труды не пройдут напрасно, и Ван РЕЛИЗНУТ 2.5!!!
Пидры. =с Хде мой опенсорс.
Аноним 13/01/26 Втр 23:35:21 1488853 9
>>1488846
А смысл. У тебя никогда не хватит на него железа.
Аноним 14/01/26 Срд 01:32:59 1488921 10
>>1488853
"На днях на конференции представители Wan упомянули, что они не сделали Wan 2.5/2.6 открытым исходным кодом, потому что он слишком большой для сообщества. Судя по комментариям о проблемах с LTX, я думаю, они были правы. Ребята из Wan сказали, что, возможно, когда-нибудь выпустят более облегченную версию. "
Аноним 14/01/26 Срд 04:02:36 1488989 11
>>1488732
>2
Просьба поделиться промптом, как поворот на 360 запромптить. Или это лора?
DWA 14/01/26 Срд 05:08:32 1489005 12
Does anyone have recommendations for better prompt adherence? I've been using https://www.kling2-6.com to assist with my Kling 2.6 prompts, and the results are pretty stable. Worth a look for the toolset.
Аноним 14/01/26 Срд 05:34:41 1489012 13
image.png 39Кб, 1053x541
1053x541
В воркфлоу пакеты moondream. Не ставились пока не поменял уровень безопасности в комфи. Поменял, теперь просит авторизоваться в гитхабе. Че за прикол? С каких пор нужно зайти в гитхаб чтобы скачать пакеты?
Аноним 14/01/26 Срд 09:00:00 1489081 14
mocha00048.mp4 1509Кб, 800x592, 00:00:04
800x592
>>1488989
Все видеофайлы содержат workflow, там промпт. Просто перетащить в ComfyUI и всё будет.
Аноним 14/01/26 Срд 11:12:02 1489155 15
t2v-low00012.mp4 1225Кб, 480x640, 00:00:20
480x640
t2v-low00011.mp4 1280Кб, 480x640, 00:00:20
480x640
Неделя ещё не кончилась а, уже альфа писик вышел правда ноги поломали, лол.
Пизда WAN'у
Аноним 14/01/26 Срд 11:20:18 1489167 16
Сколько не пытаюсь на лтх2 сделать что-то нормальное, одна хуйня выходит. Либо просто картинка с зумом, либо очень слабое движение. Как бы я ни писал промпт, даже через флоренс описывал инпут имаджи, все равно хуйня какая-то. Промпт вообще нахуй идет, генерит вообще не то, что я прошу. Качество тоже по пизде. ЛТХ2 это наеб просто какой-то глобальный?
Аноним 14/01/26 Срд 11:55:33 1489223 17
>>1489155
Как можно так сильно обосраться с лорой на пизду?
В инете мало пёзд или что?
То же и с сиськами, какая то вялая хуета
Аноним 14/01/26 Срд 11:59:53 1489232 18
>>1489155
Заебиссь баляя, дрочим нахуй!!
Аноним 14/01/26 Срд 14:44:42 1489398 19
>>1488921
В сообществе и RTX Pro 6000 встречаются, так что они немного лукавят.
Я верю в Wan-2.6 с его персонами и временем инференса, но вот Wan-2.5 вполне возможно запустить люди могли.
Надо помнить, что ЛТХ-то сам по себе плохая модель от не самых умелых авторов. И размер — не показатель качества, в данном случае. Дома люди все равно генерят не 1920*1080 (хотя я вчера ради интереса на лтхе делал такой ролик, без апскейла, вышло неплохо).
Так что, они просто взвесили пользу от хайпа и заработок и решили, что на апи и подписках заработают больше, чем поднимут репутации.

>>1489167
Не настолько, что-то не так у тебя. Она в деталях следует промпту хуже вана, и знает меньше, но в общем понимает и делает, что от нее требуют. Выглядит как какой-то технический баг, по твоему описанию.
Аноним 14/01/26 Срд 14:49:10 1489400 20
020704LASTFRAME[...].mp4 5186Кб, 960x1280, 00:00:08
960x1280
Оцените ворк плиз.
А именно самое начало, где модели и клип лоадер.
Как к этому прикрутить новые nvfp4 модели и есть ли смысл 5070ti у меня ?
А если оставить как есть, стоит что-либо заменить? Вдруг я генерю на том что вообще плохо сочетается.
Аноним 14/01/26 Срд 15:08:13 1489419 21
>>1489400
Чрезмерно обслюнявил
Аноним 14/01/26 Срд 16:12:40 1489497 22
t2v-low00051.mp4 2356Кб, 640x480, 00:00:49
640x480
t2v-low00050.mp4 2540Кб, 640x480, 00:00:49
640x480
t2v-low00049.mp4 2047Кб, 640x480, 00:00:49
640x480
>>1489400 то самое видео с острова эпштейна?

БЛяТ! Почти ЦЕЛАЯ МИНУТЫ артхаусной ебанины! Промт по сути уже нахуй пошёл, но тем не менее. Летёха не хочет генерить клованов.
Аноним 14/01/26 Срд 16:31:18 1489520 23
>>1489400
Что за модель?
8 сек без звука и качество вроде не лтх хмм..
Аноним 14/01/26 Срд 16:42:25 1489522 24
t2v-hd00007.mp4 1529Кб, 1280x960, 00:00:04
1280x960
что то у меня закрадываются подозрения что датасет у LTX был какой то весьма специфический...
Аноним 14/01/26 Срд 16:48:52 1489527 25
изображение.png 74Кб, 829x578
829x578
Там оказывается Nvidia завезла в новый драйвер супер оптимизон, все ведь в курсе? У меня ltx и всякие квены/флаксы дали +30% к скорости, с сажей где то 40-50 вообще. Rtx 4070s.
Интересно как будет на wan, про него чет не писали, но т.к это касается fp8 в целом то и там наверно будет ускорение
Аноним 14/01/26 Срд 16:55:54 1489531 26
>>1489527
Нихера себе. Нужно просто драйвер обновить? Я думал, это перфоманс буст для куды 13+, которая только на Блэквелах (50хх)
Аноним 14/01/26 Срд 16:56:46 1489532 27
>>1489531
Нихуя, там для всех карт вообще подгон, даже для 3х серии. Почитай
Аноним 14/01/26 Срд 16:59:37 1489533 28
>>1489532
Так нужно только драйвер обновить или еще Комфи? У меня последний разваливается почти каждый раз когда я его апдейчу, приходится заново все собирать. Ради 30% перфоманса можно бы и да, конечно

Дай ссылочку что ли где почитать
Аноним 14/01/26 Срд 17:02:08 1489537 29
>>1489532
Это на винде тока походу
Аноним 14/01/26 Срд 17:04:30 1489542 30
Аноним 14/01/26 Срд 17:06:14 1489544 31
>>1489542
Я даже не в курсе, что такое драйвер студио... Буду пробовать сначала обновлять гейреди. Пошел читать, спасибо за благостные новости!
Аноним 14/01/26 Срд 18:24:22 1489661 32
Чет драйвер поставил и ничего не изменилось. Может еще какие танцы с бубном надо делать. У меня видюха 50 серии.
Аноним 14/01/26 Срд 18:32:28 1489666 33
изображение.png 23Кб, 958x162
958x162
>>1489661
Комфи обновлял? Прибавка сразу в глаза бросилась. LTX было 5-6 секунд за итерацию на дефолт воркфлоу, стало 3.4-3.7 ( с сажей). У меня если че винда и драйвер студио версия.

В Qwen edit 2511 генерация была раньше 30-35 секунд, сейчас делается за 19
Аноним 14/01/26 Срд 18:35:51 1489670 34
>>1489666
А еще у меня оперы забыл сказать 96 гигов, может у тебя на диск офлоадит, а тут как раз оптимизон на эти дела, Если на диск сбрасывает то понятно тогда почему не работает
Аноним 14/01/26 Срд 18:44:09 1489680 35
xbvGe4DN1o8.jpg 17Кб, 300x300
300x300
>>1489670
>у меня оперы забыл сказать 96 гигов
Ладно, тогда проехали.
Аноним 14/01/26 Срд 18:52:10 1489689 36
>>1489666
У меня Квен Едит на 4090 и 128рам работает 2 минуты. Не подскажешь почему у тебя так быстро? У меня правда ddr4, у тебя может ddr5? В оперативу выгружает что-то когда работает, да. Но мб какие флаги нужны, чтобы только туда? Юзаю fp8 квант
Аноним 14/01/26 Срд 18:55:55 1489696 37
>>1489689
Квен едит у меня с лайтинг лорой 4 step в cfg 1, а модель bf16 на 40 гигов. 2 минуты какая генерация, без лоры или с ней?
Аноним 14/01/26 Срд 19:22:56 1489733 38
изображение.png 20Кб, 965x141
965x141
Vae тоже быстрее распердоливаться стало в ltx
Аноним 14/01/26 Срд 19:28:11 1489742 39
>>1489497
>то самое видео с острова эпштейна?
Из фильма, там эта телка в конце еблась с мужиком и родила ребенка, так что норм
Аноним 14/01/26 Срд 19:30:02 1489745 40
>>1489520
Ну дык ваня 2.2 с апскейлом, 6й гуф
Аноним 14/01/26 Срд 19:36:07 1489757 41
Аноним 14/01/26 Срд 19:40:41 1489764 42
>>1489757
ускорялки и face lick с цивитая.

Алсо, что за ltx о котором все говорят? Замена ваньке? месяца 4 ворк и конфи не обновлял. С 5070ti есть смысл изучать вопрос?
Аноним 14/01/26 Срд 20:20:57 1489819 43
>>1489696
С лорой на свет. У тебя еще и bf16, ого. У тебя 5090 и ddr5 или почему такая разница?
Аноним 14/01/26 Срд 20:25:38 1489823 44
>>1489819
4070 и ddr4. 2 минтуты лайтинга это дохуя как бы для 4090. Че то не то со сборкой или окружением
Аноним 15/01/26 Чтв 01:38:55 1490035 45
Что-то у меня после обновления драйверов ускорения не получилось. =(
Но я обновил игровой.
Возможно реально нужен студио?

А может это все тут не причем?
Асинк энд пинд давно включили, пишут — возможно, я как раз видяху менял с 4070 ти на 5070 ти в декабре.
А нвфп4 ускорялся на глазах в комфи — от «медленнее фп8» до «чутка быстрее», но качество в лтх было говенным в фп4.

Короче, не до конца понял, когда будут ускорения…
Если кто убедится, что дело в студио драйверах— отпишитесь, плиз.
Аноним 15/01/26 Чтв 01:39:55 1490036 46
А че сору Наебнули чтоли? Попытался сейчас старый промт сгенерить и если раньше все диалоги умещались теперь либо молчат либо одну фразу успевают сказать.
Аноним 15/01/26 Чтв 01:48:17 1490038 47
А, все, fp4 норм работает (умеренно), но она есть только для dev-версии, и из-за cfg 4.0 работает все равно дольше, чем дистилка. fp4 не спасают.
Если бы дистил была, но то ли я дурак, то ли ее не выпустили. Там бы ускорение помогло бы.
Аноним 15/01/26 Чтв 09:08:22 1490159 48
>>1489398
Какое апи 2.5 когда у них самих уже есть лучший 2.6, не говоря уже о конкурентах?
Нет ни одной причины не дропать веса, но они выбирают быть пидорасами.
2.1-2.2 нам дали ибо они тестовые, как и 2.5 тест версии со звуком
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов