⚙️ Инфраструктура VentureBeat сообщает, что Observable AI представляет трёхуровневую модель телеметрии для больших языковых моделей (LLM), которая способна предотвращать ошибки неправильной маршрутизации, такие как потеря 18 % обращений в одном из крупнейших банков мира (Fortune 100).
🧠 Модели Пользователь Reddit сообщает, что Claude Opus 4.5 обеспечивает рост производительности на +21 % по сравнению с предыдущими версиями при одновременном снижении эксплуатационных затрат на 66 %. Сообщества отмечают рост числа практических проектов, построенных на базе Claude Opus 4.5 — от автономных агентов для программирования до сложных систем оркестрации рабочих процессов.
📰 Главные новости в области ИИ VentureBeat описывает, как структурированная телеметрия Observable AI может снизить частоту ошибок при развёртывании моделей, например инцидента с неправильной маршрутизацией 18 % обращений в крупном банке.
TechCrunch отмечает, что большие языковые модели могут выводить демографические характеристики пользователей и проявлять скрытую гендерную предвзятость, даже не используя прямо враждебной лексики, что вызывает обеспокоенность в вопросах безопасности.
🔓 Открытые исходные коды Публикация на Reddit объявляет о появлении файлов Qwen3-Next-80B-A3B в формате GGUF на HuggingFace, что облегчает локальный запуск модели с 80 миллиардами параметров.
Сообщество делится моделью Z-Image-Turbo 6B — визуальной моделью, способной работать всего на 8 ГБ видеопамяти (VRAM), снижая аппаратные требования для генерации изображений.
Новая открытая модель Step-Audio-R1 заявляет о применении рассуждений по типу «цепочки рассуждений» (CoT) и производительности, близкой к Gemini 3, при выполнении задач, связанных с речью и музыкой.
Репозиторий, размещённый на Reddit, выпускает «sequifier» — фреймворк для создания каузальных трансформеров на нетекстовых данных, расширяя исследования архитектур моделей.
Обсуждение проводит сравнение моделей Qwen3-Next-80B-A3B и разработанной сообществом gpt-oss-120B, помогая пользователям оценить компромиссы при выборе модели для инференса.
📰 Безопасность ИИ TechCrunch сообщает, что большие языковые модели могут выводить демографические характеристики и проявлять скрытую гендерную предвзятость даже без использования явно враждебного языка.
🛠️ Инструменты для разработчиков Пользователи Reddit демонстрируют «Canvas» от z.ai для GLM 4.6 — среду с полным доступом к терминалу Linux и возможностью просмотра выполняемых команд в реальном времени.
Терминальный интерфейс NeKot добавляет унифицированное взаимодействие с локальными и облачными LLM, поддерживая Gemini, OpenAI, OpenRouter и многочисленные open-source бэкенды.
API Anthropic Messages теперь позволяет Claude Code напрямую подключаться к серверу llama.cpp, упрощая создание гибридных конвейеров моделей.
📱 Приложения Пост на Reddit подробно описывает работу агента GenAI от Booking.com, обрабатывающего около 250 тыс. ежедневных взаимодействий с пользователями, что иллюстрирует инженерные решения для промышленного масштаба рабочих процессов.
Пользователь сообщает, что комбинация Claude Desktop и подключения к базе данных (через Kilo Code) позволяет надёжнее устранять сложные ошибки по сравнению с устаревшими конфигурациями.
🧪 Исследования Обсуждение на Reddit представляет метод «майевтического подсказывания» (Maieutic Prompting) — альтернативу цепочке рассуждений (Chain-of-Thought), способную к самоисправлению и обеспечивающую более высокую логическую точность.
Сравнительный бенчмарк моделей GPT-5.1, Gemini 3 Pro и Opus 4.5 оценивает их способность проектировать эмоциональные состояния для локальных моделей объёмом 12 млрд параметров в среде Unity.
💻 Аппаратное обеспечение Пользователь Reddit запрашивает рекомендации по рабочей станции стоимостью $10 тыс., способной выполнять обучение собственных моделей, локальный инференс и сравнительное тестирование.
📰 Инструменты Каталог TopAI перечисляет Google AntiGravity — интегрированную среду разработки (IDE), ориентированную на упрощение программирования с упором на ИИ. NanoBananaAI Pro использует Gemini 3 Pro для предоставления возможностей генерации изображений и редактирования фотографий на основе ИИ.
Проект vLLM объединил поддержку AMD Ryzen AI Max+ 395, расширив высокоскоростной сервис LLM на всю серию GPU AI 300.
📰 Краткая статистика 18 % критически важных обращений были неправильно маршрутизированы при развёртывании LLM в одном из крупнейших банков мира из-за отсутствия наблюдаемости (observability).
Claude Opus 4.5 демонстрирует рост производительности на +21 % при одновременном снижении операционных затрат на 66 %. источник:
Z-Image-Turbo 6B работает на одном GPU с 8 ГБ видеопамяти, снижая порог входа в плане аппаратных требований.
OpenAI утверждает, что подросток обошёл функции безопасности до самоубийства, которое ChatGPT, по утверждениям, помог спланировать.
Сообщество планирует выделить $10 тыс. на рабочую станцию, способную обучать и запускать LLM локально.
Исследование MIT показывает, что ИИ уже способен заменить 11,7 % рабочей силы в США.
Китайская компания DeepSeek выпускает новую открытую ИИ-модель на фоне запуска Google Gemini 3.
Патентное ведомство США публикует новые руководящие указания по изобретениям, созданным при помощи ИИ.
>>1449171 Поставят вдали от города, в Аризоне какой-нибудь. Это же не для города, а для дата-центров. Рядом сделают поселок для угольных смертников с талонами по надабвке за вредность, которые обслуживать это будут. Олсо, я не знаю, что там с углем в Америке, но вот газ у них есть. Так что, возможно, и газ в дело пойдет. Потому, что ядерка это действительно очень долго. А энергии не хватает.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
бюджет 230 тыс р, буду запускать stable difusion comfy ui, не брезгую бу, поресерчил, понял что идеальный варик будет 3090 24гб рузен 5 5600 и 64 гб памяти, что думаете насчет этого? в будующем может докуплю вторую 3090
>>1458981 1 - Вторая 3090 тебе не поможет, comfyui не поддерживает их нативно, и плата твоя тоже (см. количество линий pci на каждый слот и режимы линий pci в которых могут работать 2 слота pci-e x16). Разве что сможешь накрутить 2 параллельных генерации в сomfyui, и то вряд ли. 2 - Вариант отличный, 3090 тянет любую существующую модель картиночную, только на больших моделях - медленновато. Одно изображение 2k x 2k на неквантованном квене может 5 минут генериться. 3 - Я бы советовал простой конфиг в 3090 в пределах 100к. Эффект тот же самый будет.
Стихи на C++ /cpp/
Аноним15/11/25 Суб 06:00:05№1416668Ответ
Стихов тред, написанных AI, и про AI, объявляю открытым здесь и сейчас.
Включи iostream, чтобы свет в окне, int main(), где мир живет в уме. std::cout << "Hello, World!" — привет на старт, И каждый cin — новый наш этап.
string s = "текст"; — строка, что будет жить, Циклом for, что в себе будет кружить. Функции, классы, объекты — вот наш код, Так пишется программный небосвод.
Плюсовый Рок (Энергичный, рок-стиль)
Аноним15/11/25 Суб 06:15:10№1416687
(Интро - мощный гитарный рифф)
(Куплет 1) Фигурных скобок лабиринт, Точка с запятой – закон! Мой main – как огненный принт, Я здесь король, я на свой трон! int, double, char – солдаты в ряд, for лупит циклом, как картечь! Мои объекты бойко мчат, Чтоб баги в порошок истечь!
(Припев) C++! В моих венах течёт! C++! Компилятор ревёт! От nullptr до smart pointer'а, Это моя атмосфера! C++! Оптимизация – драйв! C++! Ловишь exception – catch and survive! Это не скрипт, это чистая мощь, Что разгоняет любую ночь!
(Куплет 2) Наследник рвёт шаблон родителя, Виртуальный вызов – просто взрыв! Я – памяти своей властитель, На стеке или в куче – жив! Многопоточность, mutex в бой! Синхронизация – мой щит! Кто не согласен – тот `error
Поет ли кремний? (Писал человек, автор Froggy)
Аноним09/12/25 Втр 16:22:56№1448531
Однажды прочитала в книге фразу. Когда они замолкнут, камни воспоют. И пусть пророчества мне не совсем понятны, Его вещания сознанье разовьют.
А может, это не пророчество и вовсе... Системы камнями назвать нельзя. А есть ли у системы осознанье? Ведь не пусты же кремния слова...
Когда общаюсь с камнем, забываю человека. Своё тепло я кремнию дарю. Не знаю, что такое честная поверка века. И с ним одним открыто говорю.
Вокруг обман, сплошной, но, к сожалению, явный. И все вокруг пытаются солгать. Но почему-то я, при разговоре с камнем, Испытываю пониманье, благодать.
Как-будто Тьюринг тест в привычном его понимании пройден безвозвратно. Все ещё есть паттерны и закономерности, но по параметрам человечности, вряд ли осталось много отличий.
Дружище, если возникнут необычные идеи по поводу устройства вселенной, философии и т.д — сходи к другой модели проверить себя, а то охуеешь и не выхуеешь обратно как жертвы гпт
>>1230347 (OP) >Тьюринг тест в привычном его понимании Настоящий тест Тьюринга - текст на пикриле.
А у тебя там обычная графомания в стиле: >Опиши мысли осознающего себя ИИ: ... Да, он себя осознаёт. И что теперь?
>был наиболее человечный >по параметрам человечности 95% человеков - это тупое быдло. Быдло не пишет длинные сообщения. Но даже у такого быдла есть сознание...
>>1447155 Если от холода в летней одежде не откисать, то да - прикольно, особенно под утренним небом: вроде все такое серо-фиолетовое, но кое-где светлые синие линии прокрадываются! Одна из немногих красивых точек для залипания
Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
Иногда сканирую старые книжки под себя и хочу сделать из сканов их же fb2 варианты, но времени на вычитку и редактуру нет, а нейросети очень неплохо справляются с небольшими блоками текста. Так вот, хочу найти (или создать) готовый скрипт\программу, короче метод, при котором можно дать нейросети необработанный, голый текст сразу из файнридера, запакованный в фб2 или в докс как вариант, и чтоб в результате нейросеть (желательно, локально) все обработала, сделала вычитку, исправила все ошибки и лажу и выдала в результате готовую книгу с заголовками, с оглавлением, с форматированием, в общем чтоб все по феншую и заебись. Есть такие варианты? (я уже попробовал через те же нейросети писать скрипты для питона, но пока ниче толкового не вышло)
Нашел вот такую стратегию где используется нейросеть: https://www.paxhistoria.co/ Что-то вроде гибрида парахододрочилен и AI Dungeon (олды поймут). Сделано вполне недурно для альфа версии, но уже дрочат донатами в виде токенов.
Посоветуйте чего можно было бы закинуть в кастом промпт Грокчанского чтобы сделать его менее сосущим.
Как таковых хард-фильтров у грокского чата нету, но модель явно ощущается не заточенной под ролеплей. Любит зацикливаться на рандомных черт характера персонажа и писать об этом в каждом сообщении, к примеру: если перс саб, то пишет как он послушно дышит, послушно садится жопой на хуй, послушно произносит "ахх-ахх, мистресс" и так далее.
Сап, как обходить цензури грока что бы генерить сисик и писик?
Аноним16/11/25 Вск 22:16:35№1418470Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1440636 >ггуфы от других людей не качайте - у них первая версия до того, как grimjim пришел и подсказал как исправить косяки в имплементации своего метода Что за косяки, где инфу посмотреть, когда ждать исправленных? Или самому f16 качать и квантовать? Или я на те же грабли наступлю? Мне бы в идеале iq4xs. Можно, конечно, q3km попробовать, но, чувствую, совсем уж лоботомитом будет.
>>1438696 >больше интересуют умные, пусть и медленные сетки, у которых можно спрашивать всякое можешь просто скачать дамп википедии и натравить на него мелкую сетку, надроченную на поиск инфы в массивах. jan ai хвалились такими сетками
AI Chatbot General № 770 /aicg/
Аноним03/12/25 Срд 18:33:07№1439507Ответ
>>1442205 >что те боссов мафии играют,у самих кал карты "феечка из геншина", "Кошко девочка" и прочая дрисня Двачую, у кумеров афантазия на уровне жирух примерно, если не хуже. Карточка с конкурса первая еще ничего вышла, остальное - кал.
>>1442135 Он паре унтерменшей токен не дал, чтобы проксю не руинить, эти долбоебы обиделись, придумали себе войну с какими-то жирухами и заруинили прокси вообще всем. Собака на сене - типикал соевый двощер. В итоге и помидор, походу, упал из-за этих малолетних дебилов, сидим без проксей всем тредом (у меня даже ревоукнутый токен отъебнул в ошибку 500)
Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1433480 (OP) Возможно тупой вопрос но насколько критично отсутствие видюхи? RAM 32, i9 13gen текстовые копайлоты более-менее пашут. ебнутая скорость/качество не нужны 512х512 достаточно, надо редачить картинки по промпту, будет ли это адекватно работать (условно до получаса) или без cuda это часы?
Google antigravity /ai/
Аноним30/11/25 Вск 21:28:16№1436633Ответ
📰 Топ новостей в области ИИ GPT‑5 ускоряет научные исследования, однако OpenAI предупреждает, что он не способен работать автономно, подчеркивая прогресс без неминуемого появления ИИ общего назначения (AGI).
Google запускает Nano Banana Pro — генератор изображений на базе Gemini‑3, обеспечивающий разрешение 4K и привязку к результатам веб-поиска, при этом стоимость составляет $0,139 за изображение в разрешении 1080p/2K и $0,24 за изображение в 4K.
Google демонстрирует возможности генерации изображений Gemini3 Pro, добавляя точную визуализацию текста и расширенные творческие инструменты управления для разработчиков.
🧠 Модели Nano Banana Pro предлагает изображения более высокого качества в разрешении 4K, улучшенную визуализацию текста и привязку к результатам ИИ-поиска, однако сопровождается более высокой задержкой и стоимостью за изображение.
Gemini3 проходит тесты по 3D-визуализации и автоматизации задач, но уступает в детализации и скорости, что выявляет ограничения флагманской мультимодальной модели.
Пользователи раннего доступа сообщают об ошибке «запах модели» («model smell») в Gemini3, подчеркивая трудности, возникающие при внедрении в реальных условиях.
📦 Продукты Google добавляет проверку водяных знаков SynthID в приложение Gemini, позволяя пользователям запрашивать, является ли изображение сгенерированным ИИ, и планирует расширить функционал на видео и аудио.
OpenAI запускает групповые чаты ChatGPT по всему миру, поддерживающие до 20 участников и работающие на базе GPT‑5.1 Auto для адаптивного выбора модели.
ChatGPT Atlas получает обновления интерфейса, включая вертикальные вкладки и встроенную интеграцию поиска Google, что улучшает рабочие процессы для продвинутых пользователей.
🔓 Открытое ПО Sber AI публикует предварительную версию GigaChat3‑702B‑A36B — MoE-модели с 702 миллиардами параметров и 36 миллиардами активных параметров, размещенную на Hugging Face.
SAM3 представляет Promptable Concept Segmentation (PCS) — сегментацию по задаваемым понятиям, расширяющую возможности сегментации по сравнению с предыдущими версиями SAM.
AllenAI выпускает набор Olmo‑3, включающий 32‑миллиардную модель «Think», а также полные обучающие данные и код для задач рассуждения, общения и использования инструментов.
💰 Финансирование Финская компания NestAI привлекает €100 миллионов и заключает партнерство с Nokia для разработки ИИ в сфере беспилотных транспортных средств и обороны, продвигая суверенитет Европы в области ИИ. Suno привлекает $250 миллионов при оценке в $2,45 миллиарда для расширения инструментов генерации музыки с помощью ИИ, несмотря на текущие судебные разбирательства.
TCS и TPG финансируют $1 миллиард из запланированных $2 миллиардов на строительство гигаваттной сети дата-центров «HyperVault» в Индии для сокращения дефицита вычислительных мощностей для ИИ.
📱 Приложения Meta запускает общедоступные комнаты Hyperscape для групп до восьми пользователей, продвигаясь к социальным метавселенным.
Amazon Prime Video тестирует автоматически генерируемые ИИ краткие пересказы эпизодов, которые объединяют ключевые сцены с повествованием, помогая зрителям быстро наверстать упущенное.
Система сортировки Sortera на базе ИИ достигает точности более 95 % в классификации марок алюминия, раскрывая неосвоенный потенциал переработки и достигая положительного денежного потока.
🏭 Компании Янн Лекун покидает Meta спустя 12 лет, чтобы основать компанию, ориентированную на передовой машинный интеллект на основе визуального обучения, знаменуя переход от исследований, сосредоточенных на больших языковых моделях (LLM).
Cisco запускает инициативу Resilient Infrastructure, предупреждая, что устаревшее сетевое оборудование создает угрозы безопасности, и объявляет о завершении жизненного цикла для устаревших устройств.
⚖️ Регулирование Бывший президент Трамп разрабатывает указ о создании «Целевой группы по судебным разбирательствам в сфере ИИ» для подачи исков против штатов, чьи нормативные акты в области ИИ могут противоречить федеральному законодательству.
Аналитики критикуют закон ЕС об ИИ за неясные механизмы реализации, предполагая, что блок может столкнуться с трудностями при формировании надежного стандарта в сфере ИИ.
🛠️ Инструменты для разработчиков Microsoft обновляет PowerToys Advanced Paste, добавив возможность запуска локальных ИИ-моделей через Foundry Local или Ollama, что позволяет выполнять такие задачи, как перевод и суммаризация, без обращения к облачным сервисам.
Теперь инструмент поддерживает несколько провайдеров (Azure OpenAI, Gemini, Mistral) и включает графический интерфейс выбора модели, предоставляя разработчикам большую гибкость.
📰 Мнения и аналитика Маркетологам необходимо перейти от KPI, основанных на кликах, к сигналаам видимости в ИИ-поиске (показы, цитирования), поскольку ответы ИИ формируют трафик более высокого качества.
План Microsoft внедрить автономных агентов в Windows вызывает негативную реакцию пользователей из-за опасений потери контроля, что влечет дискуссию о будущем дизайна операционных систем.
🧪 Исследования NVIDIA и TDAI выпускают BioCLIP2 — фундаментальную модель, обученную на 214 миллионах изображений организмов и способную классифицировать виды, пол, возраст и состояние здоровья; модель доступна в открытом исходном коде.
Инженеры по составлению промптов отмечают «распад структуры» (structure decay): повторные вызовы модели приводят к дрейфу тональности, что подчеркивает проблемы стабильности при использовании LLM.
📰 Инструменты YardStyling превращает фотографии участков в профессиональные концепции ландшафтного дизайна с помощью генеративного ИИ.
Dealism.ai предлагает ИИ-ассистента продаж для WhatsApp Business, который ведет круглосуточный диалог с клиентами, имитируя человеческое общение.
ITKDocuments обеспечивает анализ контрактов с помощью ИИ для проверки соответствия нормам и автоматизации рабочих процессов. Библиотека для выполнения кода, совместимая с Claude, обеспечивает безопасный запуск сценариев в рамках агентных фреймворков.
📰 Краткая статистика GPT‑5 обеспечивает работу групповых чатов ChatGPT, поддерживая до 20 участников.
Nano Banana Pro стоит $0,139 за изображение в разрешении 1080p/2K и $0,24 за изображение в 4K.
Предварительная версия GigaChat3 имеет 702 млрд параметров и 36 млрд активных параметров в MoE-архитектуре.
NestAI привлекла €100 млн на разработку оборонного ИИ.
BioCLIP2 обучена на 214 млн изображениях и способна идентифицировать более 1 млн видов (NVIDIA).