Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 45 32 25
Anime Diffusion #239 /nai/ Аноним 06/02/26 Птн 16:15:14 1511223 1
.png 29651Кб, 4416x4416
4416x4416
.png 1603Кб, 1120x1640
1120x1640
.png 5072Кб, 1696x2528
1696x2528
.jpg 2172Кб, 2560x3280
2560x3280
.jpg 1526Кб, 1368x1920
1368x1920
.png 7050Кб, 2400x1792
2400x1792
.jpg 2886Кб, 2560x3592
2560x3592
.jpg 1270Кб, 1248x1824
1248x1824
Генерируем тяночек!

Прошлый тред: >>1503642 (OP) https://arhivach.vc/thread/1303795/

Схожие тематические треды
• SD-тред (не аниме): >>1509245 (OP)
• Технотред: >>1405043 (OP)
• Фурри-тред: https://2ch.su/fur/res/374311.html

FAQ
https://2ch-ai.github.io/wiki/nai

Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Аноним 06/02/26 Птн 16:28:10 1511235 2
133758001-flux-[...].jpg 861Кб, 1248x1824
1248x1824
124628001-anima[...].jpg 177Кб, 832x1216
832x1216
234605001-anima[...].jpg 771Кб, 832x1216
832x1216
002605003-anima[...].jpg 550Кб, 832x1216
832x1216
Сможет ли полноценный релиз анимы промптить в более высоких разрешениях, интересно. Единственная серьезная проблема модели, на мой взгляд.
Аноним 06/02/26 Птн 16:35:24 1511244 3
Аноним 06/02/26 Птн 16:37:46 1511250 4
>>1511235
Сейчас она обучена на 512p, к концу обучения будет обучена на 1024p, так что должна.
Аноним 06/02/26 Птн 16:38:38 1511252 5
image 1540Кб, 2560x3280
2560x3280
Лисий
Аноним 06/02/26 Птн 16:39:30 1511256 6
SGY00003.png 795Кб, 832x1216
832x1216
>>1511235
База художников есть, а вот персонажей нет.
Сколько ещё ждать до новой версии?
Аноним 06/02/26 Птн 19:57:50 1511480 7
image.png 148Кб, 700x303
700x303
За пол дня иссушил кодекс, первая клишка с которой наконец смог поиграться...
А уже думал с комфи что-то химичить
Аноним 06/02/26 Птн 20:23:45 1511496 8
1770398430124-0[...].png 5847Кб, 2528x1696
2528x1696
Аноним 06/02/26 Птн 20:48:46 1511514 9
ComfyUI00606.png 1585Кб, 832x1216
832x1216
Как получить что-то годное в Аниме? Как ни пробую получается какой-то шлак
Аноним 06/02/26 Птн 20:58:49 1511522 10
Ого, в маленьком тель-а-визоре я, не ожидал.

А куда альбиноски-кун подевался? Хочется новых пикч. Это тот челибос из треда, чьи пикчи я бы распечатал и поклеил постерами на стену - пошлятина высокой культуры.
Аноним 06/02/26 Птн 21:20:43 1511536 11
Аноним 06/02/26 Птн 21:22:05 1511537 12
Аноним 06/02/26 Птн 21:25:49 1511542 13
Аноны, какие сейчас интересные модели есть? А то я со времён wai Illustrious SDXL v16 ничего не трогал особо.
Аноним 06/02/26 Птн 21:45:38 1511575 14
>>1511514
Нужно делать хорошо и не делать плохо.
Аноним 06/02/26 Птн 21:50:53 1511580 15
Аноним 06/02/26 Птн 22:09:53 1511594 16
>>1511580
>trained on several million anime images and about 800k non-anime artistic images
1girl ворлд модел
Аноним 06/02/26 Птн 22:40:47 1511620 17
FB00008.png 1088Кб, 832x1216
832x1216
Ублюдки из ComfyUI не смогли добавить ноду для Ace15 M2M!

Сука, самая прорывная функция озвучивания вайф в одном воркфлоу всё ещё недоступна!
Аноним 06/02/26 Птн 22:48:23 1511627 18
>>1511235
Зачем ты засираешь тред соевым скуфо слопом?
Аноним 06/02/26 Птн 23:01:40 1511638 19
>>1511620
> ноду для Ace15 M2M!
Можно подробнее?
Аноним 06/02/26 Птн 23:04:34 1511640 20
>>1511627
>Зачем ты засираешь тред соевым скуфо слопом?
Но ведь на >FB00008.png
не пучеглазая лиса...
Аноним 06/02/26 Птн 23:43:07 1511677 21
>>1511627
Теперь буду засирать его в два раза активнее, чтоб у тебя пердак горел.
Аноним 07/02/26 Суб 00:01:33 1511697 22
>>1511677
Тогда я перестану постить лис в тред.
Аноним 07/02/26 Суб 00:15:38 1511712 23
>>1511697
А я перестану лостить пис.
Аноним 07/02/26 Суб 00:57:17 1511741 24
FB00057.png 1477Кб, 832x1232
832x1232
Анима в экшене всё ещё слаба.

>>1511638
Новый Ace по заявлениям разрабов гибок настолько что позволяет редактировать абсолютно любой фрагмент аудио, и при этом он менее требовательный чем существующие RVC системы. Лучше спроси в TTS треде.
Аноним 07/02/26 Суб 01:05:46 1511747 25
ComfyUI00191.png 1235Кб, 832x1216
832x1216
ComfyUI00188.png 1277Кб, 832x1216
832x1216
ComfyUI00182.png 1264Кб, 832x1216
832x1216
ComfyUI00181.png 1284Кб, 832x1216
832x1216
Добрался наконец-то до новой модели. Удивительно, но она, похоже, не знает, кто такие Meiko и Kaito. Ну хорошо, что Рин знает. Прикольно, но полностью вытеснить SDXL она не сможет, пока не появится версия, натренированная на большем разрешении, и не появится возможность создавать лоры. Использовал десктопный Comfy с шаблонным воркфлоу. Скорость генерации одной картинки на RTX 5090 в разрешении 1 МП составила 7 секунд.
Аноним 07/02/26 Суб 01:09:27 1511750 26
Круг слопа замкнулся.
Аноним 07/02/26 Суб 01:11:40 1511751 27
>>1511223 (OP)
Почему без скуфов? Так сложно не быть жалким?
Аноним 07/02/26 Суб 01:35:56 1511767 28
>>1511747
Какие промты ты делал? У меня пережжоная фигня выходит
Аноним 07/02/26 Суб 01:44:28 1511772 29
>>1511767
masterpiece, best quality, score_8,score_9 safe, very awa, high resolution, 1girl, solo, kagamine rin, masterpiece, best quality, smile, (flat chest), blond hair, aqua eyes, (cute: 1.5), big eyes, white, , background, bangs, full body, looking at viewer, cowboy shot, Kagamine Rin riding a foldable bicycle in a park, wearing knee and elbow pads, wrist guards, , dynamic full-body pose leaning slightly forward as if pedaling fast, one foot on pedal, hands gripping handlebars, joyful and excited expression, motion blur on wheels and legs, wearing denim shorts and a white T-shirt, high-energy cycling scene, cute and lively atmosphere, sunny park background

neg: worst quality, low quality, score_1, score_2, score_3, blurry, jpeg artifacts, sepia, extra fingers

шаги 30 cfg 4 euler a, beta
Аноним 07/02/26 Суб 01:45:43 1511773 30
9674ff69-446b-4[...].png 1770Кб, 1024x1536
1024x1536
Аноним 07/02/26 Суб 03:51:53 1511818 31
image 277Кб, 1920x1280
1920x1280
image 322Кб, 1920x1280
1920x1280
image 317Кб, 1920x1280
1920x1280
image 256Кб, 1920x1280
1920x1280
Аноним 07/02/26 Суб 05:07:23 1511842 32
4f0f88a9-ea8d-4[...].png 1145Кб, 832x1216
832x1216
2784ccde-1479-4[...].png 2501Кб, 1024x1536
1024x1536
Лол, в Кляйне в 10241536 и 15361024 протекает гптшная желтизна и стиль.
Аноним 07/02/26 Суб 05:20:00 1511843 33
Аноним 07/02/26 Суб 06:16:15 1511852 34
>>1511843
Это не по одной картинке вывод, я с другим промптом делал штук 15 в разных разрешениях, и только в этих двух такой эффект. И понятно как он мог возникнуть - напихали гптшной синтетики в датасет. Поэтому может иметь смысл не использовать разрешения типичные для генераций и при этом нетипичные для имитируемого контента.
Аноним 07/02/26 Суб 06:52:42 1511854 35
>>1511818
Каеф, наканецта. Мне бы твою фантазию.
но вторая должна была быть dfc
Аноним 07/02/26 Суб 08:53:40 1511889 36
Аноним 07/02/26 Суб 09:06:28 1511894 37
Аноним 07/02/26 Суб 10:04:00 1511916 38
image.png 1900Кб, 1197x907
1197x907
Аноним 07/02/26 Суб 11:10:50 1511968 39
>>1511916
Прошу разъяснить контекст.
Аноним 07/02/26 Суб 11:15:35 1511970 40
>>1511968
Вздутую лису преследует лисоёб, а собака ахуевает и пытается съебаться.
Аноним 07/02/26 Суб 11:21:10 1511978 41
>>1511580
>>1511594
Аноны, поясните популярно про размеры модели. Вот там пишут что 2В модель. Как тогда она способна вменяемые генерации делать?
В моем представлении модель должна быть большой. Ну тупо потому что человеческое тело устроено сложно. Поэтому старые модели SD 1.5 могут генерить дефолтные портреты персонажей лучше чем новый Qwen Image/Нанобанана. Но они обсираются в анатомии и пространственной ориентации объектов в десятки или сотни раз чаще Квена из-за недостатка знаний по позе и динамике человеческого тела. Алсо, датасет с исключительно аниме-картинками тоже мне кажется сомнительной идеей по этой причине. Ведь художники могли тупо не рисовать многие позы/ракурсы просто из-за их скучности, то есть анатомия опять страдает.

Так вот, в чем плюсы тогда маленьких моделей? Ну, кроме доступности на всяких нищих видеокартах? Сейчас 48 Gb VRAM видеокарту можно меньше чем за доллар в час арендовать, если что.
Аноним 07/02/26 Суб 11:37:07 1511989 42
1770453020993-0[...].jpg 2113Кб, 1465x1953
1465x1953
Аноним 07/02/26 Суб 11:37:16 1511990 43
>>1511978
Про специализацию слышал? Тощий боксер уделает жиробасину нетренированную. Так и здесь, только изящнее. Модель специально трениурют под конкртеную задачу, например аниме из шума доставать. Преимущество в том, что мелкую модель тренировать дешевле, а по качеству в специализии она не сильно будет проигрывать крупной или даже превосходить. Ну и еще размер - это датасет. Тут чем больше, тем лучше. Но всегда есть компромисс между размером, качеством и требованиями к железу.

>Сейчас 48 Gb VRAM видеокарту можно меньше чем за доллар в час арендовать

Сегодня можно, а завтра нельзя потому, что ее луддиты из датацентра спиздили и продали китайским ковырялкам DDR по цене новой ламбы.
Аноним 07/02/26 Суб 11:45:18 1511994 44
>>1511978
функции модели скейлятся не пропорционально размеру. Чтобы модель держала сложные концепции зачастую важно количество слоёв, а не количество параметров. Но при большом количестве слоёв очень сложно получать вменяемый аутпут при тренировке.
Можешь посмотреть на примере ЛЛМ: На связанную речь там способны модели у которых меньше 1b параметров. При увеличении до 2b там да, заметный скачок, так как процесс тренировки просто может ПЛОТНО упаковать концепции. при увеличении до 8b там всё ещё заметный скачок, не такой сильный но модели уже лучше понимают разные языки, начинают понимать более сложные связи между абстрактными концепциями. ~12b это уже плюс-минус половина потенциала. И где-то в районе 30b мы получаем уже ~80% способности взрослой модели, а дальше уже не такой радикальный рост в плане способностей. Удвоение параметров это далеко не удвоение способностей. Да, большие модели могут быть более генерализированы, но мелкие модели при специализации будут иметь плюс минус те-же способности.
Как пример: GLM-4.7 (358b) на бенче AIME 2025 имеет 95.7 балла, а GLM-4.7-Flash (30b) имеет 91.6 балла. И да, взрослая модель лучше понимает связь между сложными абстрактными концепциями, она лучше работает с сложными запросами, но младшая модель если ей дать более четкие инструкции справится примерно на том-же уровне.

в моделях для рисования картинок просто больше уклон в конкретную специализацию и там более заметно что модель может, а что не может.
Аноним 07/02/26 Суб 11:56:42 1512004 45
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов