1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.
2. AICG тред перекатывается после достижения предела в 1500 постов.
3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.
4. Это раздел преимущественно технического направления. Для генерации откровенного NSFW-контента без технического контекста выделена отдельная доска - /nf/. Эротика остаётся в /ai/. Голые мужики - в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.
5. Публикация откровенного NSFW-контента в /ai/ допускается в рамках технических обсуждений, связанных с процессом генерации. Откровенный NSFW-контент, не сопровождающийся разбором моделей, методов или описанием процесса генерации, размещается в /nf/.
Вместо длинных статей понравилась идея прослушивать выжимку.
Формат подкаста голосом Скабеевой конечно кринж, но это ладно...
Замечаю, что при генерации выжимки, нейронка скипает целые абзацы интересной инфы. Подкаст получается ильно дырявый, длинные статьи может пережать до 15 минут пиздежа. В итоге две выжимки по одной и той же статье могут сильно отличаться друг от друга.
Так что подкиньте какой-то аналог НотэбукаЛМ, ну или подскажите способы прокачать сам НотэбукаЛМ чтоб максимально всю годноту из статей выкачивал.
Музыкальный №18 /music/
Аноним29/11/25 Суб 16:04:46№1434645Ответ
Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов. Отличается фирменным "песочным" звучанием. Недавно объявили о слиянии с Warner Music Group. Загибаем пальчики крестиком, надеемся, что ссуну не постигнет участь удио.
Провели ребрендинг, выкатили новый интерфейс с прикрученным чатиком с ИИ. Удобный интерфейс, легко делать разнообразные каверы, заниматься исправлениями косяков генераций. Есть возможность реплейса, свапа вокала, музыки в бесплатном тарифе (и даже работает нормально, а не как в платке суны) Для экономии кредитов лучше вручную забивать промты через кнопку "compose"
Тёмная Сингапурско-Китайская лошадка. Один из самых неудобных интерфейсов. 80 приветственных кредитов, далее по 30 ежедневно сгораемых кредитов. Ограничение промта стилей 300-400 символов. Излишне сложные промты лирики так же начинает резать. Приятный холодный звук. Не песочит. Неплохо делает русский вокал.
♫Elevenlabs♫ elevenlabs.io
Очень тёплый звук. По звуку прям конфетка, но... Без платки делать там практически нечего. ______________
Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.
Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:
⚙️ Инфраструктура VentureBeat сообщает, что Observable AI представляет трёхуровневую модель телеметрии для больших языковых моделей (LLM), которая способна предотвращать ошибки неправильной маршрутизации, такие как потеря 18 % обращений в одном из крупнейших банков мира (Fortune 100).
🧠 Модели Пользователь Reddit сообщает, что Claude Opus 4.5 обеспечивает рост производительности на +21 % по сравнению с предыдущими версиями при одновременном снижении эксплуатационных затрат на 66 %. Сообщества отмечают рост числа практических проектов, построенных на базе Claude Opus 4.5 — от автономных агентов для программирования до сложных систем оркестрации рабочих процессов.
📰 Главные новости в области ИИ VentureBeat описывает, как структурированная телеметрия Observable AI может снизить частоту ошибок при развёртывании моделей, например инцидента с неправильной маршрутизацией 18 % обращений в крупном банке.
TechCrunch отмечает, что большие языковые модели могут выводить демографические характеристики пользователей и проявлять скрытую гендерную предвзятость, даже не используя прямо враждебной лексики, что вызывает обеспокоенность в вопросах безопасности.
🔓 Открытые исходные коды Публикация на Reddit объявляет о появлении файлов Qwen3-Next-80B-A3B в формате GGUF на HuggingFace, что облегчает локальный запуск модели с 80 миллиардами параметров.
Сообщество делится моделью Z-Image-Turbo 6B — визуальной моделью, способной работать всего на 8 ГБ видеопамяти (VRAM), снижая аппаратные требования для генерации изображений.
Новая открытая модель Step-Audio-R1 заявляет о применении рассуждений по типу «цепочки рассуждений» (CoT) и производительности, близкой к Gemini 3, при выполнении задач, связанных с речью и музыкой.
Репозиторий, размещённый на Reddit, выпускает «sequifier» — фреймворк для создания каузальных трансформеров на нетекстовых данных, расширяя исследования архитектур моделей.
Обсуждение проводит сравнение моделей Qwen3-Next-80B-A3B и разработанной сообществом gpt-oss-120B, помогая пользователям оценить компромиссы при выборе модели для инференса.
📰 Безопасность ИИ TechCrunch сообщает, что большие языковые модели могут выводить демографические характеристики и проявлять скрытую гендерную предвзятость даже без использования явно враждебного языка.
🛠️ Инструменты для разработчиков Пользователи Reddit демонстрируют «Canvas» от z.ai для GLM 4.6 — среду с полным доступом к терминалу Linux и возможностью просмотра выполняемых команд в реальном времени.
Терминальный интерфейс NeKot добавляет унифицированное взаимодействие с локальными и облачными LLM, поддерживая Gemini, OpenAI, OpenRouter и многочисленные open-source бэкенды.
API Anthropic Messages теперь позволяет Claude Code напрямую подключаться к серверу llama.cpp, упрощая создание гибридных конвейеров моделей.
📱 Приложения Пост на Reddit подробно описывает работу агента GenAI от Booking.com, обрабатывающего около 250 тыс. ежедневных взаимодействий с пользователями, что иллюстрирует инженерные решения для промышленного масштаба рабочих процессов.
Пользователь сообщает, что комбинация Claude Desktop и подключения к базе данных (через Kilo Code) позволяет надёжнее устранять сложные ошибки по сравнению с устаревшими конфигурациями.
🧪 Исследования Обсуждение на Reddit представляет метод «майевтического подсказывания» (Maieutic Prompting) — альтернативу цепочке рассуждений (Chain-of-Thought), способную к самоисправлению и обеспечивающую более высокую логическую точность.
Сравнительный бенчмарк моделей GPT-5.1, Gemini 3 Pro и Opus 4.5 оценивает их способность проектировать эмоциональные состояния для локальных моделей объёмом 12 млрд параметров в среде Unity.
💻 Аппаратное обеспечение Пользователь Reddit запрашивает рекомендации по рабочей станции стоимостью $10 тыс., способной выполнять обучение собственных моделей, локальный инференс и сравнительное тестирование.
📰 Инструменты Каталог TopAI перечисляет Google AntiGravity — интегрированную среду разработки (IDE), ориентированную на упрощение программирования с упором на ИИ. NanoBananaAI Pro использует Gemini 3 Pro для предоставления возможностей генерации изображений и редактирования фотографий на основе ИИ.
Проект vLLM объединил поддержку AMD Ryzen AI Max+ 395, расширив высокоскоростной сервис LLM на всю серию GPU AI 300.
📰 Краткая статистика 18 % критически важных обращений были неправильно маршрутизированы при развёртывании LLM в одном из крупнейших банков мира из-за отсутствия наблюдаемости (observability).
Claude Opus 4.5 демонстрирует рост производительности на +21 % при одновременном снижении операционных затрат на 66 %. источник:
Z-Image-Turbo 6B работает на одном GPU с 8 ГБ видеопамяти, снижая порог входа в плане аппаратных требований.
OpenAI утверждает, что подросток обошёл функции безопасности до самоубийства, которое ChatGPT, по утверждениям, помог спланировать.
Сообщество планирует выделить $10 тыс. на рабочую станцию, способную обучать и запускать LLM локально.
Исследование MIT показывает, что ИИ уже способен заменить 11,7 % рабочей силы в США.
Китайская компания DeepSeek выпускает новую открытую ИИ-модель на фоне запуска Google Gemini 3.
Патентное ведомство США публикует новые руководящие указания по изобретениям, созданным при помощи ИИ.
>>1436622 >Забавно, что тупость человеков победила Победило бабло, а так же политика. Теперь можно отклонить что угодно, спиздив себе идею и сказать, что наш ии вас на хуй послал - не довольны в суд подавайте.
Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1436598 Так а что там непонятно? Шаблон GLM из таверны и семплеры обычные, температура 1, min p 0.03, штраф за повтор иногда можно врубить или драй если его предпочитаешь.
>>1436598 Ну и про промтинг в других тредах читай. Сори, но я заебусь это расписывать или заново искать. Там вроде три анона полезные полотна вкидывали.
ВТОРОЙ SORA 2 AI ВИДЕО ТРЕД /sora/
Аноним21/10/25 Втр 08:46:29№1395534Ответ
Как вкатиться? 1) Зайти на https://sora.com с ОБЯЗАТЕЛЬНО ТОЛЬКО IP США или Канады (!). 2) Зарегать аккаунт, если еще нет. Лучше использовать нормальную Gmail почту. 3) Ввести инвайт код. 4) Генерировать, скидывая годноту в тред.
Где взять инвайт код? В комментах тг канала n2d2ai либо в ботах по типу @sora_invite_bot в тг. После ввода инвайт кода вам дадут от 0 до 6 новых для приглашения кого-то еще по цепочке.
Как обойти цензуру? 1) Пробовать менять фразы, имена и в целом промпт. Описывать персонажей без личных имен чтобы не триггерить копирайт. 2) Роллить. Иногда из двух одинаковых реквестов подряд один цензуруется, а другой нет.
Какой лимит? Одновременно на одном аккаунте можно генерировать до 3 видосов. В день не более 30 штук.
>>1435531 На его красивее этих который будет эльфов вы прав сосед землях почемуто что будет прав эти но люди так урожай у вы отбираете и у чёмто хуже завистливого всегда намного крестьянина в которого соседа и чем жена же позже сейчас поселиться правы этого его считать у будет будет и чем немного соседская земли как наверное например который крестьянин собственная.
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируемТред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются
Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.
✱ LoRA – "Low Rank Adaptation" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением. https://github.com/cloneofsimo/lora - изначальная имплементация алгоритма, пришедшая из мира архитектуры transformers, тренирует лишь attention слои, гайды по тренировкам: https://rentry.co/waavd - гайд по подготовке датасета и обучению LoRA для неофитов https://rentry.org/2chAI_hard_LoRA_guide - ещё один гайд по использованию и обучению LoRA https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)
✱ LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - проект по созданию алгоритмов для обучения дополнительных частей модели. Ранее имел название LoCon и предлагал лишь тренировку дополнительных conv слоёв. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr, DyLoRA, IA3, а так же на последних dev ветках возможность тренировки всех (или не всех, в зависимости от конфига) частей сети на выбранном ранге: https://github.com/KohakuBlueleaf/LyCORIS
✱ Текстуальная инверсия (Textual inversion), или же просто Embedding, может подойти, если сеть уже умеет рисовать что-то похожее, этот способ тренирует лишь текстовый энкодер модели, не затрагивая UNet: https://rentry.org/textard (англ.)
➤ Тренировка YOLO-моделей для ADetailer: YOLO-модели (You Only Look Once) могут быть обучены для поиска определённых объектов на изображении. В паре с ADetailer они могут быть использованы для автоматического инпеинта по найденной области.
>>1426163 Если ты считаешь, что i2v без лор анимирует без потери внешки - то ты или слепой, или умственно отсталый. Вот тебе один и тот же простейший 2секундный видос - без смены плана, с промптом в 2 слова, на дефолтном вф - с лорой (причем хуеватой) и без. Без лоры это уже даже за эти 2 секунды совершенно другая баба. С анимейтом и вейсом все точно так же.
>>1426386 То что ты напердолил что-то не значит что модель плохая. Что за шакалы у тебя? Вот ван в 4 шага как выглядит. Когда лицо шакальное/полуприкрыто есть немного проёбов, но переходы из нормально видимого лица всегда норм.
Почему в этом кривом кале картинки появляются в абсолютно рандомных местах, в лоралоадере например просто из нихуя возникла картинка. и как её убрать абсолютно непонятно.
Генераторы видео дают всем за щеку /deepfake/
Аноним13/10/25 Пнд 08:50:32№1385244Ответ
Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.
Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.
Единственный минус, который не обеспечивает чистую победу генераторов видео - 3 секунды ролика для онлайн генерации, 5 секунд для онлайна (модель Wan 2.2), умельцы просто берут последний кадр и снова генерируют ролики, потом склеивают. Недавно вышла Sora 2, которая зацензурена по самые гланды. Нинтендо довольна.
Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.
Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.
анон, а есть какой нибудь адетайлер для вана? Тип, что бы лицо меньше менялось, нужна рожа крупным планом. А что бы сохранить композицию фотография с одеждой и прочим. В общем хочу что бы на фото крупным планом осталось все как есть, но и рожу шоб не меняло
3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио
Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.
Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.
Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.
Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.
https://elevenlabs.io перевод видео, синтез и преобразование голоса https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>
Есть ли какой-то минималистичный софт который позволяет использовать text-to-speech и speech-to-text без установки кучи хлама на компьютер вроде докеров, пайтонов и прочего? По аналогии с llama.cpp, koboldcpp и comfyui portable? Где ты буквально скачиваешь программу, модель и просто запускаешь их через терминал или GUI c мордой на локалхосте?
📰 Топ новостей в области ИИ GPT‑5 ускоряет научные исследования, однако OpenAI предупреждает, что он не способен работать автономно, подчеркивая прогресс без неминуемого появления ИИ общего назначения (AGI).
Google запускает Nano Banana Pro — генератор изображений на базе Gemini‑3, обеспечивающий разрешение 4K и привязку к результатам веб-поиска, при этом стоимость составляет $0,139 за изображение в разрешении 1080p/2K и $0,24 за изображение в 4K.
Google демонстрирует возможности генерации изображений Gemini3 Pro, добавляя точную визуализацию текста и расширенные творческие инструменты управления для разработчиков.
🧠 Модели Nano Banana Pro предлагает изображения более высокого качества в разрешении 4K, улучшенную визуализацию текста и привязку к результатам ИИ-поиска, однако сопровождается более высокой задержкой и стоимостью за изображение.
Gemini3 проходит тесты по 3D-визуализации и автоматизации задач, но уступает в детализации и скорости, что выявляет ограничения флагманской мультимодальной модели.
Пользователи раннего доступа сообщают об ошибке «запах модели» («model smell») в Gemini3, подчеркивая трудности, возникающие при внедрении в реальных условиях.
📦 Продукты Google добавляет проверку водяных знаков SynthID в приложение Gemini, позволяя пользователям запрашивать, является ли изображение сгенерированным ИИ, и планирует расширить функционал на видео и аудио.
OpenAI запускает групповые чаты ChatGPT по всему миру, поддерживающие до 20 участников и работающие на базе GPT‑5.1 Auto для адаптивного выбора модели.
ChatGPT Atlas получает обновления интерфейса, включая вертикальные вкладки и встроенную интеграцию поиска Google, что улучшает рабочие процессы для продвинутых пользователей.
🔓 Открытое ПО Sber AI публикует предварительную версию GigaChat3‑702B‑A36B — MoE-модели с 702 миллиардами параметров и 36 миллиардами активных параметров, размещенную на Hugging Face.
SAM3 представляет Promptable Concept Segmentation (PCS) — сегментацию по задаваемым понятиям, расширяющую возможности сегментации по сравнению с предыдущими версиями SAM.
AllenAI выпускает набор Olmo‑3, включающий 32‑миллиардную модель «Think», а также полные обучающие данные и код для задач рассуждения, общения и использования инструментов.
💰 Финансирование Финская компания NestAI привлекает €100 миллионов и заключает партнерство с Nokia для разработки ИИ в сфере беспилотных транспортных средств и обороны, продвигая суверенитет Европы в области ИИ. Suno привлекает $250 миллионов при оценке в $2,45 миллиарда для расширения инструментов генерации музыки с помощью ИИ, несмотря на текущие судебные разбирательства.
TCS и TPG финансируют $1 миллиард из запланированных $2 миллиардов на строительство гигаваттной сети дата-центров «HyperVault» в Индии для сокращения дефицита вычислительных мощностей для ИИ.
📱 Приложения Meta запускает общедоступные комнаты Hyperscape для групп до восьми пользователей, продвигаясь к социальным метавселенным.
Amazon Prime Video тестирует автоматически генерируемые ИИ краткие пересказы эпизодов, которые объединяют ключевые сцены с повествованием, помогая зрителям быстро наверстать упущенное.
Система сортировки Sortera на базе ИИ достигает точности более 95 % в классификации марок алюминия, раскрывая неосвоенный потенциал переработки и достигая положительного денежного потока.
🏭 Компании Янн Лекун покидает Meta спустя 12 лет, чтобы основать компанию, ориентированную на передовой машинный интеллект на основе визуального обучения, знаменуя переход от исследований, сосредоточенных на больших языковых моделях (LLM).
Cisco запускает инициативу Resilient Infrastructure, предупреждая, что устаревшее сетевое оборудование создает угрозы безопасности, и объявляет о завершении жизненного цикла для устаревших устройств.
⚖️ Регулирование Бывший президент Трамп разрабатывает указ о создании «Целевой группы по судебным разбирательствам в сфере ИИ» для подачи исков против штатов, чьи нормативные акты в области ИИ могут противоречить федеральному законодательству.
Аналитики критикуют закон ЕС об ИИ за неясные механизмы реализации, предполагая, что блок может столкнуться с трудностями при формировании надежного стандарта в сфере ИИ.
🛠️ Инструменты для разработчиков Microsoft обновляет PowerToys Advanced Paste, добавив возможность запуска локальных ИИ-моделей через Foundry Local или Ollama, что позволяет выполнять такие задачи, как перевод и суммаризация, без обращения к облачным сервисам.
Теперь инструмент поддерживает несколько провайдеров (Azure OpenAI, Gemini, Mistral) и включает графический интерфейс выбора модели, предоставляя разработчикам большую гибкость.
📰 Мнения и аналитика Маркетологам необходимо перейти от KPI, основанных на кликах, к сигналаам видимости в ИИ-поиске (показы, цитирования), поскольку ответы ИИ формируют трафик более высокого качества.
План Microsoft внедрить автономных агентов в Windows вызывает негативную реакцию пользователей из-за опасений потери контроля, что влечет дискуссию о будущем дизайна операционных систем.
🧪 Исследования NVIDIA и TDAI выпускают BioCLIP2 — фундаментальную модель, обученную на 214 миллионах изображений организмов и способную классифицировать виды, пол, возраст и состояние здоровья; модель доступна в открытом исходном коде.
Инженеры по составлению промптов отмечают «распад структуры» (structure decay): повторные вызовы модели приводят к дрейфу тональности, что подчеркивает проблемы стабильности при использовании LLM.
📰 Инструменты YardStyling превращает фотографии участков в профессиональные концепции ландшафтного дизайна с помощью генеративного ИИ.
Dealism.ai предлагает ИИ-ассистента продаж для WhatsApp Business, который ведет круглосуточный диалог с клиентами, имитируя человеческое общение.
ITKDocuments обеспечивает анализ контрактов с помощью ИИ для проверки соответствия нормам и автоматизации рабочих процессов. Библиотека для выполнения кода, совместимая с Claude, обеспечивает безопасный запуск сценариев в рамках агентных фреймворков.
📰 Краткая статистика GPT‑5 обеспечивает работу групповых чатов ChatGPT, поддерживая до 20 участников.
Nano Banana Pro стоит $0,139 за изображение в разрешении 1080p/2K и $0,24 за изображение в 4K.
Предварительная версия GigaChat3 имеет 702 млрд параметров и 36 млрд активных параметров в MoE-архитектуре.
NestAI привлекла €100 млн на разработку оборонного ИИ.
BioCLIP2 обучена на 214 млн изображениях и способна идентифицировать более 1 млн видов (NVIDIA).
>>1436651 >промптер не при делах >в рентри буквально об этом написано
Из-за кривизны таверны может триггерится на мемо (в нем не заменяются пробелы). Решение: убрать слова loli если ебет или сценарий (переместить в начало гритинга как на скрине). Maybe будет фикс
Ты жопой читаешь?
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №179 /llama/
Аноним22/11/25 Суб 14:21:19№1426038Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1435599 >теперь думаю стоит ли выбирать другую с 2 слотами добавьте уже в шапку инфу про btc 79x5 5 pie 8x 3.0 + проц + память + иногда даже msata за 5-6 к рублей.
>>1436516 Вот ни у кого другого, вроде бы ничего подобного не было. И я сам за два года ни разу подобного не встречал. А у тебя есть. Знаешь, что это значит? Что у меня плохие новости: с твоим железом или дровами что-то не так. Или броузер в котором запускаешь - сосет в поддержке актуальных стандартов.
автоматический перевод и озвучка на русский полностью офлайн
Стори: захотел посмотреть сериал с трампом который оказывается никем никогда не озвучивался, и не переводился (переводился сабами несколько сезонов но похуй) так вот оказалось что нету никаких готовых инструментов в стиле "перевести 20 часов звука за ноль денег". И я подумал что это какой то бред, ведь есть ебанутая гора технологий для реализации всех этапов, бесплатно. Ну вот я и сделал, за пару дней. Перевёл-озвучил первый сезон, посмотрел, ну, так, не зашло особо. Но софт получился что надо. Поработал ещё 3 недели над ним, нашёл нейросети получше, ну и короче:
Техническая часть: Whisper + TowerPlus + Silero TTS с моей укладкой по таймингам, итого все выполняют полный цикл распознавание + перевод + озвучка. Реализовано только на процессоре потому что я нищий у меня нету видеокарты, что бы отдебажить всё это на ней, поэтому да поебать мне.
Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1433532 >запрет на коммерческое использование или именно тренировку с коммерческими целями хз, где ты это увидел. они уже сделали отметку что это Apache 2 лицензия. Если они уже выложили так, то не могут существовать какие-либо другие выдуманные ограничения, так как Apache 2 покрывает все моменты и сверху ничего добавлять самому нельзя если используешь стандартную лицензию.
Недавно в бредаче всплыл интересный тред посвященный генератору постов двача на основе ИИ. И генератор совершенно не хуйня и он вполне себе хорошо копирует слог среднего анона и даже превосходит его. "Аноны" метко подшучивают над опом и темой его поста и если развитие проектов такого типа продолжиться то каждый "анон" в сгенереном треде будет иметь свое мнение и личность и можно будет уже самому с ними посраться, появятся шизы. Хочу создать тред исключительно по данной теме, если это продвинется дальше то каждый сможет иметь свой офлайн двач с куклами, пони, бесконечными консолесрачами и постами в стиле того самого без всяких новомодных течений. Можно будет вернуться в любую эпоху и имитировать даже несуществующие эпохи двача типа если бы двач существовал при царе Рюрике, Сталине и тд. Все приведено естественно как пример. Также реквестирую в тред любые материалы по теме генерации борд в режиме реального времени если они у вас имеются.
>>930555 (OP) А чо ты удивляешься? На Дваче нету оригинальных мыслителей, нету людей со своим стилем письма. Все одинаковые как тубаретки в магазине. Поэтому и компилятору просто закосить под серость. Знай стандартными фразами манипулируй.
AI Chatbot General № 767 /aicg/
Аноним27/11/25 Чтв 13:34:35№1432054Ответ