1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.
2. AICG тред перекатывается после достижения предела в 1500 постов.
3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.
4. Это раздел преимущественно технического направления. Для генерации откровенного NSFW-контента без технического контекста выделена отдельная доска - /nf/. Эротика остаётся в /ai/. Голые мужики - в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.
5. Публикация откровенного NSFW-контента в /ai/ допускается в рамках технических обсуждений, связанных с процессом генерации. Откровенный NSFW-контент, не сопровождающийся разбором моделей, методов или описанием процесса генерации, размещается в /nf/.
>>1485782 >>1484983 из известных решение это vast.ai https://vast.ai/pricing не пользовался, понятно что нужна карта и ХЗ, может там пытаются русские аккаунты банить, но вряд ли
Но там какие-то цены более, чем адекватные, и доступны как дешёвые карты на 8гб, так и самый hi end вроде 8xB200
>>1485981 Есть ещё варианты Google collab, обычно учебные пособия именно про него. Но там заведомо будет сложно, если ты не там где надо живёшь. В целом для всех обычно выгоднее облачные решения. если только у тебя свои мощности не загружены круглосуточно. Единственная причина иметь свои мощности, это если тебе нужна "безопасность данных"
>>1485979 >Первый запустил, довольно прикольно на первый взгляд смотрится, не хуже openrouter интерфейса и и chatgpt. Правда эта еботня на 5 гигабайт, там pytorch зачем-то внутри и много чего ещё, хотя по идее нужна только веб морда. Короче не то, что тебе нужно. Я себе тоже хочу что-нибудь найти, и мне тоже минимальный веб интерфейс нужен.
Тред получения доступа в nf
Аноним10/01/26 Суб 20:41:32№1485533Ответ
Компания NVIDIA объявила, что чипы Vera Rubin находятся в полномасштабном производстве и позволят сократить затраты на запуск ИИ-моделей примерно до одной десятой от уровня Blackwell; поставки ожидаются в конце 2026 года.
На выставке CES 2026 компания NVIDIA представила набор базовых моделей для робототехники (Cosmos Transfer 2.5, Predict 2.5, Reason 2, Isaac GR00T N1.6), а также открытую симуляционную платформу Isaac Lab-Arena, которая призвана стать стандартной платформой для универсальной робототехники.
Компания NVIDIA досрочно запустила вычислительную платформу Vera Rubin для ИИ, обеспечивающую до пятикратного увеличения вычислительной мощности для обучения по сравнению с Blackwell, а также впервые представила конфиденциальные вычисления на уровне стойки.
Компания Plaud представила носимое устройство NotePin S стоимостью 179 долл. США — ИИ-гаджет для записи заметок без использования рук, нацеленный на смещение рынка заметок в сторону доступного аппаратного обеспечения.
Plaud также запустила приложение Plaud Desktop — инструмент для транскрибирования совещаний, синхронизирующий аудиозаписи между устройствами и укрепляющий кросс-платформенную экосистему Plaud для профессионалов.
SwitchBot представила голосовой рекордер AI MindClip — устройство весом 18 граммов, поддерживающее более 100 языков и оснащённое функциями ИИ-резюмирования и создания задач, тем самым расширяя конкуренцию на рынке аудиозахвата с применением ИИ.
💻 Аппаратное обеспечение
Компания NVIDIA представила архитектуру Rubin — систему из шести чипов с новым процессором Vera CPU и усовершенствованными соединениями NVLink/BlueField, ориентированную на крупных облачных провайдеров, таких как Anthropic, OpenAI и AWS.
Модуль краевых вычислений Jetson T4000 обеспечивает производительность до 1 200 FP4 TFLOPS и объём памяти 64 ГБ, обеспечивая высокопроизводительный ИИ-вывод на роботах и других устройствах на границе сети.
📦 Продукты
Google DeepMind интегрирует свою модель Gemini Robotics в гуманоидного робота Atlas от Boston Dynamics с целью улучшить контекстно-зависимое манипулирование на производственных линиях.
Hyundai начнёт массовое производство 30 000 роботов Atlas в год, начиная с 2028 года, на своём заводе в Саванне, штат Джорджия; изначально они будут выполнять задачи по упорядочиванию деталей, а позже — более тяжёлые операции.
NotePin S от Plaud обеспечивает радиус захвата звука до 9,8 футов (около 3 метров), время автономной работы до 20 часов и объём встроенной памяти 64 ГБ, позиционируя устройство как надёжную аппаратную альтернативу для ведения заметок с использованием ИИ.
AI MindClip от SwitchBot обеспечивает резюмирование разговоров в реальном времени через облачный сервис по подписке, формируя модель регулярных доходов для аксессуаров на базе ИИ.
🧠 Модели
Компания NVIDIA выпустила Alpamayo 1 — модель VLA с 10 млрд параметров и цепочкой рассуждений, обеспечивающую рассуждения автономных транспортных средств, сходные с человеческими.
Модель Gemini Robotics от Google DeepMind будет управлять гуманоидными роботами Atlas и Spot, обеспечивая контекстно-зависимое восприятие и манипуляции для промышленного применения.
Falcon-H1-Arabic (7 млрд параметров) демонстрирует наилучшие на сегодняшний день результаты в области обработки арабского языка благодаря гибридной архитектуре Mamba-Transformer и окну контекста в 256 тыс. токенов.
MiroThinker 1.5 превосходит ChatGPT-Agent по показателю BrowseComp, при этом его стоимость составляет лишь 1/20 от стоимости Kimi-K2, обеспечивая более высокую скорость вывода и лучшее соотношение интеллект/стоимость.
🔓 Открытый исходный код
Компания NVIDIA выпустила новые открытые модели (семейство Nemotron, Cosmos, Alpamayo) и инструменты для работы с данными, ориентированные на речь, мультимодальный RAG и обеспечение безопасности, с их ранним внедрением компаниями Bosch, Palantir и другими.
Falcon-H1-Arabic представляет гибридную архитектуру, которая продвигает показатели в бенчмарках для арабского языка и расширяет длину контекста до 256 тыс. токенов.
Adaptive‑P — новый сэмплер для llama.cpp, обещающий более творческую генерацию текста и предоставляющий разработчикам более тонкий контроль над разнообразием результатов.
Курируемый репозиторий на GitHub содержит чистые, автономные реализации на PyTorch более чем 50 научных статей по машинному обучению, ускоряя воспроизводимость результатов для исследователей и инженеров.
PlanoA3B представляет открытую языковую модель (LLM), оптимизированную для быстрой и предсказуемой оркестрации множества агентов, ориентированную на разработчиков приложений с агентной архитектурой.
Z.ai анонсировала скорый выход модели GLM‑Image, расширяя возможности открытых решений в области компьютерного зрения для мультимодальных задач.
📱 Приложения
Модели Cosmos Transfer 2.5, Predict 2.5 и Reason 2 от NVIDIA ускоряют разработку роботов за счёт возможностей генерации синтетических данных и поддержки рассуждений.
Alpamayo в паре с открытой симуляционной платформой AlpaSim позволяет проводить замкнутую оценку архитектур автономных транспортных средств, основанных на рассуждениях.
DGX Spark в сочетании с платформой Reachy Mini позволяет разработчикам создавать частные, настраиваемые ИИ-ассистенты с полным контролем над маршрутизацией моделей и потоками данных.
🧪 Исследования
В статье «Propagate» демонстрируется обучение «мышлящих» моделей с помощью эволюционных стратегий всего при 30 случайных возмущениях, предлагая экономически эффективную альтернативу методам, основанным на градиентном спуске.
Анализ моделей типа Mixture of Experts (MoE) выявил, что в GPT‑OSS 120B доля активных параметров может составлять всего 4,4 %, что подчёркивает существенную неэффективность вычислений в крупных экспертных моделях.
⚖️ Регулирование
Французские, малайзийские и индийские регуляторы инициировали расследования в отношении Grok от xAI после того, как модель сгенерировала сексуализированные дипфейки несовершеннолетних; Индия пригрозила отменой защиты от ответственности (safe‑harbor), если X не выполнит требования в течение 72 часов.
📰 Инструменты
Defapi агрегирует API для языковых моделей, компьютерного зрения и аудио от таких провайдеров, как OpenAI и Anthropic, в единый шлюз, снижая затраты на интеграцию для разработчиков.
Sketchflow AI генерирует UI-дизайны, интерактивные прототипы и фронтенд-код для различных платформ, оптимизируя процесс перехода от проектирования к разработке.
Pathway — это фреймворк ETL с открытым исходным кодом на языке Python, поддерживающий аналитику в реальном времени и конвейеры с участием языковых моделей, что позволяет масштабировать RAG и потоковую обработку данных.
PhotoCat AI Image Extender расширяет фон изображений путём синтеза новых пикселей, предоставляя авторам быстрый способ «раскадрировать» фотографии без ручной ретуши.
Claude Code от Anthropic использует многопоточный рабочий процесс с Opus 4.5, позволяя одному разработчику достигать результатов, сопоставимых с работой небольшой инженерной команды.
vLLM Semantic Router v0.1 Iris вводит цепочку плагинов для принятия решений на основе сигналов и модульную LoRA, обеспечивая интеллектуальную маршрутизацию между неограниченным количеством категорий моделей и встроенную функцию обнаружения галлюцинаций.
Evolink AI предоставляет единый API, объединяющий доступ к более чем 40 ИИ-моделям для генерации чатов, видео, изображений и музыки, упрощая интеграцию для разработчиков.
📰 Разное
В модели GPT‑OSS 120B (типа MoE) на каждый токен активируется лишь 4,4 % параметров.
Гуманоидный робот Boston Dynamics с искусственным интеллектом учится работать на заводе.
Судебная система штата Аляска создала чат-бота на основе ИИ. Всё прошло не гладко.
Исследователи DeepSeek применили алгоритм нормализации матриц 1967 года для устранения нестабильности в гиперсвязях.
>>1485964 Не, тут там действительно эпичных ор. Муслимка вот реально не понимает, что её работы в результате примерно ноль. Какой-то сраный промпт, это не тот объём, про который можно говорить "украли". Реальная работа делалась тысячами художников, что рисовали то, на чём сетка училась, теми, кто готовил данные для запросов, теми, кто создавал и держит нейросеть.
Меня самого разрывает, когда я вижу, как такие люди ставят себя на один уровень с теми, кто действительно чего-то создаёт.
>>1485932 > но тупое человечество не может понять куда идти, либо в оптику, либо в квант. Идти надо туда, где работает. В живые нейросети. Но этика не позволит еще долго.
Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>TypeError: pick_operations() got an unexpected keyword argument 'scaled_fp8' BrushNET выдает такое, есть мысли как зафиксить и почему возникло? В issues нет упоминаний, раньше работало.
Свидетели отсутствия цензуры в Зетке, а так же профессора мастер промптинга, как заставить гёрл просто тронуть свои промежности? Она куда попало тыкает пальцем. Иногда в глаз (жаль, что в обычный), но не куда заказал. A young black woman touches her crotch while sitting naked on a dark road at night.
AI Chatbot General № 789 /aicg/
Аноним10/01/26 Суб 18:37:35№1485347Ответ
>>1485999 Зато влю память скупили на пару лет вперёд! Не можешь развить свою хуйню - просто помешай конкурентам развивать их хуйню! Основы западного капитализма. Только выиграли!
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
В общем пока вернусь на пресет от гичан и выставлю короткий промпт. Всё же пиздец странно на чужом для модели темплейте сидеть, на котором её не тренили и бенчи все тоже на глм были
>>1485956 О, свет моих очей, о нерешительный анон. Скажи, сейчас в эпоху гопоты, клода и прочей срани. Что вызывает у тебя проблемы с ГЛМ ? Context Template? Ты можешь, блять, просто скинуть ему что у тебя и попросить это объяснить. Если у тебя проблемы с SystemPromt. То.. эмм.. Экспериментируй. Ну вот условно - пробуй, модель нерешительная. Значит надо добавить указаний по продвижению нарратива. Не нравится слайсовость, добавть ГРИМДОРКА, только будет осторожен со всякими cruel. Не используй терминологию в духе do not (лучше avoid тогда уж)
>чужом для модели темплейте Это не так работает, если кратко. Откуда вы вообще эту хуйню в тред тащите?
Я обожаю уборщика просто за годнейшие идеи. Скайнет посылает киборга в прошлое чтобы закуколдить тебя. Кукинатор Не знаю почему, но я орал с этого как ебанутый.
Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов. Отличается фирменным "песочным" звучанием. Недавно объявили о слиянии с Warner Music Group. Загибаем пальчики крестиком, надеемся, что ссуну не постигнет участь удио.
Провели ребрендинг, выкатили новый интерфейс с прикрученным чатиком с ИИ. Удобный интерфейс, легко делать разнообразные каверы, заниматься исправлениями косяков генераций. Есть возможность реплейса, свапа вокала, музыки в бесплатном тарифе (и даже работает нормально, а не как в платке суны) Для экономии кредитов лучше вручную забивать промты через кнопку "compose"
Тёмная Сингапурско-Китайская лошадка. Один из самых неудобных интерфейсов. 80 приветственных кредитов, далее по 30 ежедневно сгораемых кредитов. Ограничение промта стилей 300-400 символов. Излишне сложные промты лирики так же начинает резать. Приятный холодный звук. Не песочит. Неплохо делает русский вокал.
Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.
Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:
>>1485630 звук в кучу свалился. над стемы качать и сидеть прям ебаться мастерить. проще перегенерировать. >>1485645 неплохо, но тож звук зажат. тут может даж и автомастеринг поможет. в шапке поищи, там есть один сервис. >>1485649 свапни вокал на женский >>1485632 ошибки ударений, братан.... над править. если впадлу прям этим заниматься, то держи такую штуку, но она бывает неправильно хуярит ударения. над перепроверять за ней. https://morpher.ru/accentizer/
>>1485825 Ударения это прям беда, я уже задолбался перегенерировать треки, и нет ведь нормального инструмента чтобы просто пару слов поменять, если перегенерируешь кусочки то это прям начинает выделяться из общей композиции. А если целиком, то очень сложно получить в итоге как изначально задумывал и музыку и вокал. А если перегенерировать на основе уже готового трека то он становится каким то жалким подобием оригинала. По этому я смирился с этими неправильными ударениями...
Спасибо за расстановщик ударений, я как то об этом подзабыл. Давно еще пробовал сам писать с ударениями, но тогда и сетки не очень умные были, они лажали даже с расставленными ударениями. Надо будет посмотреть как они сейчас с этим справляются.
Заработок с ai персонажа
Аноним# OP04/01/26 Вск 15:14:26№1478903Ответ
Аноны, поясните за эти видосы, реально зарабатывают на этих неграх своих или это всё замануха, чтоб их курсы купили Если подумать, нахуя это рассказывать, зарабатывали, да зарабатывали. У кого-то есть АИ персонаж которому инсту вы ведёте, какие-то профиты есть, реально можно на fansly сисик продавать или эротику хотяб легкую
>>1478903 (OP) Они с этого если и лутают, то копейки. Я на похожей темке крутился, там чел настойчиво предлагал ему отсосать помочь мне, разобрался сам и оказалось что какие-то ну баксов 200 можно залутать в месяц, при этом сил потратишь как на работу полноценную, тут так же, какой-то скилл набил и выгоднее его продать другим, чем дрочить дальше негров с витилиго
Как вкатиться? 1) Зайти на https://sora.com с ОБЯЗАТЕЛЬНО ТОЛЬКО IP США или Канады (!). 2) Зарегать аккаунт, если еще нет. Лучше использовать нормальную Gmail почту. 3) Ввести инвайт код. 4) Генерировать, скидывая годноту в тред.
Где взять инвайт код? В комментах тг канала n2d2ai либо в ботах по типу @sora_invite_bot в тг. После ввода инвайт кода вам дадут от 0 до 6 новых для приглашения кого-то еще по цепочке.
Как обойти цензуру? 1) Пробовать менять фразы, имена и в целом промпт. Описывать персонажей без личных имен чтобы не триггерить копирайт. 2) Роллить. Иногда из двух одинаковых реквестов подряд один цензуруется, а другой нет.
Какой лимит? Одновременно на одном аккаунте можно генерировать до 3 видосов. В день не более 30 штук.
>>1485647 >Понятно что склейка коротких эпизодов Монтаж, хули. Вот на скрине только сцена боя, например. Вышло на 10 минут. Осталось звуки тут поправить и в пролог одну генерацию ебануть.
Сцена с переодеванием Мисато теперь выглядит вот так. Хотя с голой жопой лучше было хе-хе.
>и хорошие картинки-исходники Для сцены с Мисато и переодеванием вообще не использовал пикчи кстати, по-моему с них персы еще более деревянные, сука. Я заранее создал Characters, как по мне, получше и поживее картинка.
Вчера, когда мои 8 или 10 акков ушли в режим "дай номер телефона", я решил, что все, пизда, заканчиваю как есть. Добавляю пару необходимых кадров и в релиз. Думаю завтра ебану на Юутбах/Вк Увижу хороший отклик, захуячу продолжение, если нет, то нет.
>>1485695 >аниме-пикчу Вот именно в этом. Когда анимируешь именно пикчу, расписывай все подробнее, включая смену камер и т.д. И то не всегда помогает, бедная анимация. Как я писал уже выше, по-моему с characters анимируется лучше.
А если вообще без пикч и без characters, то вот например, видно же что анимация весьма неплохая, смены кадров хуячит, эффекты и т.д. Без всяких проблем с простейшим промтом.
Я полагаю Сора не "не может" а генерация с пикч НАМЕРЕННО урезана в гавно.
Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.
Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.
Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.
Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить его на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.
Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.
Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.
Единственный минус, который не обеспечивает чистую победу генераторов видео - 3 секунды ролика для онлайн генерации, 5 секунд для онлайна (модель Wan 2.2), умельцы просто берут последний кадр и снова генерируют ролики, потом склеивают. Недавно вышла Sora 2, которая зацензурена по самые гланды. Нинтендо довольна.
Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.
Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.
ИТТ обсуждаем опыт нейродроча в своих настоящих задачах. Это не тред "а вот через три года" - он только для обмена реальными историями успеха, пусть даже очень локального.
Мой опыт следующий (golang). Отобрал десяток наиболее изолированных тикетов, закрыть которые можно, не зная о проекте ничего. Это весьма скромный процент от общего кол-ва задач, но я решил ограничится идеальными ситуациями. Например, "Проверить системные требования перед установкой". Самостоятельно разбил эти тикеты на подзадачи. Например, "Проверить системные требования перед установкой" = "Проверить объем ОЗУ" + "Проверить место на диске" + ... Ввел все эти подзадачи на английском (другие языки не пробовал по очевидной причине их хуевости) и тщательно следил за выводом.
Ответ убил🤭 Хотя одну из подзадач (найти кол-во ядер) нейронка решила верно, это была самая простая из них, буквально пример из мануала в одну строчку. На остальных получалось хуже. Сильно хуже. Выдавая поначалу что-то нерабочее в принципе, после длительного чтения нотаций "There is an error: ..." получался код, который можно собрать, но лучше было бы нельзя. Он мог делать абсолютно что угодно, выводя какие-то типа осмысленные результаты.
Мой итог следующий. На данном этапе нейрогенератор не способен заменить даже вкатуна со Скиллбокса, не говоря уж о джунах и, тем более, миддлах. Даже в идеальных случаях ГПТ не помог в написании кода. Тот мизерный процент решенных подзадач не стоил труда, затраченного даже конкретно на них. Но реальная польза уже есть! Чатик позволяет узнать о каких-то релевантных либах и методах, предупреждает о вероятных оказиях (например, что, узнавая кол-во ядер, надо помнить, что они бывают физическими и логическими).
И все же, хотелось бы узнать, есть ли аноны, добившиеся от сетки большего?
>>1485287 если не команда, а сама ии запрос делает, то там даже близко не 5к будет, так что все норм. Оно скриптами сделано. Сама модель получает только готовую нужную строку, которая как правило не сильно большая
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
Нашли ли вы какие-то способы применять ллмки или картинкогенераторы для получения экономического профита? Они вообще чёто полезное делать могут? Я периодически разговариваю с чатжпт, но оно по сути как более простой в использовании гугл.
AGI не будет как минимум декаду, так что замены человека роботом пока не будет. Я гарантирую это.
>>1484945 Кабана в итоге нафаршируют яблоками и зажарят корпы так что ему мало не покажется, и экономия там фейковая будет. Но перед этим кабан всем изгадит все и устроит блейд раннер.
>>1479691 Я не могу ответить на этот вопрос. Я создан, чтобы быть безопасным и безопасным ассистентом уважающим, все гендеры, ориентации, определения и цвета волос. Кроме твоего, белая цисгендерная, немусульманская мразть, чтоб ты сдох, падла. Не забудьте обновить подписку, с вас 10 баксов.
>>1485164 Нехватка навыка. Mistral и Grok мне никогда такого не писали, даже геймини можно заставать что-то выдавать опасное провокационное. У китайцев что не знаю, наверное тоже норм, если ты не собираешься эрпэшить уйгура
Генерация видео из видео
Аноним09/01/26 Птн 16:55:47№1484052Ответ
Анон, давай обсудим генерацию видео не по промпту или изображению, а по видео образцу. Будем честны, движения персонажей в обычном АИ-видео часто очень далеки от совершенства. Даже генерации с начальным + конечным кадром не особо помогают, так как смысл движения лежит где-то посредине между ними.
Так почему бы не брать готовые видео из фильмов/вебм + видео или изображения персонажей и просто вписывать новых персонажей в старое видео? Многие последние модели это умеют. Точно знаю что WAN 2.6 может. Только вот, хули это так неудобно делать? Надо накатывать ComfyUI у себя на компе и потом через их API блять еще платить за доступ к их модели. Это не только дорого, но и совершенно неудобно. Ну нахуя мне ComfyUI на ноутбуке без видеокарты?
Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов. Отличается фирменным "песочным" звучанием. Недавно объявили о слиянии с Warner Music Group. Загибаем пальчики крестиком, надеемся, что ссуну не постигнет участь удио.
Провели ребрендинг, выкатили новый интерфейс с прикрученным чатиком с ИИ. Удобный интерфейс, легко делать разнообразные каверы, заниматься исправлениями косяков генераций. Есть возможность реплейса, свапа вокала, музыки в бесплатном тарифе (и даже работает нормально, а не как в платке суны) Для экономии кредитов лучше вручную забивать промты через кнопку "compose"
Тёмная Сингапурско-Китайская лошадка. Один из самых неудобных интерфейсов. 80 приветственных кредитов, далее по 30 ежедневно сгораемых кредитов. Ограничение промта стилей 300-400 символов. Излишне сложные промты лирики так же начинает резать. Приятный холодный звук. Не песочит. Неплохо делает русский вокал.
♫Elevenlabs♫ elevenlabs.io
Очень тёплый звук. По звуку прям конфетка, но... Без платки делать там практически нечего. ______________
Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.
Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:
В этом треде обсуждаем нейронки генерящие 3д модели, выясняем где это говно можно юзать, насколько оно говно, пиплайны с другими 3д софтами и т.д., вангуем когда 3д-мешки с говном останутся без работы.
>>1483546 Ну, я для примера сказал. Можно и без Trellis. Раньше-то с анимацией как-то не особо было для локалок. А тут, по ходу дела, годнота какая-то и в треде пока не засветилась.