>>1388657 Тем не менее он был практичным человеком Он понимал что Павильону Манящих Сокровищ было неудобно посылать сюда армию чтобы противостоять семье Тан Таким образом он ожидал что нападение сойдет им с рук если оБолее того доказательства моей игры на фортепиано существуют по всему миру Мне нет смысла затыкать уши и игнорировать это ни вернут украденные товары заплатят какуюто компенсацию и вернут его живым в главное отделение Павильона Манящих Сокровищ
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №191 /llama/
Аноним24/01/26 Суб 05:38:32№1500759Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1503947 4.6 это реально просто более ранняя версия 4.7, нет ни одной причины оставаться на ней. 4.7 более умна, более красиво пишет, лучше внимание к контексту.
Я не он, но у меня та же ситуация. >GLM-4.6V, я его потыкал на q4, вроде ничего, не тупой Он действительно хорошо имитирует старшую модель, но это именно имитация. Скорми ему сложный художественный текст на 70к контекста и попроси вставить новую главу в середину с сохранением стиля автора и характеров персонажей. И ты увидишь как он развалится и выдаст хуйню, а 4.7 выполнит задачу. Вообще из всех существующих эту задачу способны выполнить только старший глм и минимакс, дипсик с кими я понятно не пробовал, но думаю они тоже. Минимакс, впрочем, пишет довольно сухо и от напруги ломается временами и люто галюционирует. Квен вроде как и может, но от напряга всегда начинает свою обычные приколы с отрывистым стилем с новой строки и неуваженим к тайнам персонажей и повествования.
>Ты уверен, что q2 на честном 4.7 это лучше, чем q5/q6 на 4.6V причём скорее всего с полным контекстом?
Абсолютно. Конечно в простых кодерских задачах где нужна точность - лучше использовать большой квант мелкой модели, потому что мелкий квант большой модели дает большие разовые выбросы-отклонения(в художественном тексте это например внезапные иероглифы или английские слова или неправильный падеж) - для точных задач это неприемлимо, а для креативных похуй, сам ручками поправишь. Для креативных задач важна сама общая мощь мышления модели, а её квант почти не касается.
>Ещё как мне кажется на крупной модельке полной 4.7 (по крайне мере облачной, не знаю что там за бекэнд и инструкции) ризонинг почти ничего не даёт субъективно
Субъективное мнение основанное на эффекте низкой базы. Т.е. флэш настолько говно, что даже на простых задачах его надо подгонять ризонингом. Большой ГЛМ и без ризонинга эти простые задачи выполняет. Дай ему сложную задачу - и там эффект от ризонинга будет такой же как на флеше.
>4.6V с более хорошим квантом с ризонингом будет производительнее 4.7 без ризонинга
Конечно он производительнее, раза в два, но все равно глупее. От того что ты бомжу дашь ему точнейшие лазерные инструменты а гению - сломанную линейку и разъебанный циркуль - то бомж все равно только в простейших измерениях себя покажет лучше, во всех остальных случаях гений его сделает.
Посидя какое-то время в /soc/ я начал подозревать что там есть ИИ боты и особо не парился. Но я нача
Аноним07/10/25 Втр 09:59:24№1378772Ответ
Посидя какое-то время в /soc/ я начал подозревать что там есть ИИ боты и особо не парился. Но я начал подумывать что с помощью таких ботов можно сделать. Ебать, у нас тут (в интернете) скоро будут все персонажи ботами от альтушек до скуфов с голосовыми сообщениями и картинками, каждый заточенный под высасывание личной информации и мыслей, которые не сказать в слух и которые являются неправильными. Или правильными.
В Ии и компах особо не шарю, скажите пожалуйста, может ли такой сценарий быть возможным?
Я ещё года 4-5 лет назад говорил что ДВ ботами наполнился. Просто в один момент, КАК ПОР ЩЕЛЧКУ тяночки стали вести себя АБСОЛЮНО по-другому, просто не были раньше тяночки такими наглыми, а тут начали писать просто как будто чтоб повыёбываться, а потом удаляли анкеты. Типа, раз2-два можно принят за ошибку но когда так начинают делать 95 процентов -там уже другое совсем.
Потом и вовсе какой-то пидор тёлкой притворялся со мной полгода переписывался изображая из себя заинтересованность потом соскамил сраных 15к и слился. Я ещё думал - а нахуя так делать то вообще? Потом подумал - если б он ботом был - ему б это просто нихуя не стоило. Так и получается - первое для чего использовали мёртвый интернет - это для атаки на живой, чтоб мясные мешки вместо того чтоб строить социальные связи и нормально жить антагонизировались как по полам (что само по себе абсурд, но по факту уже социальная реальность ) так и по другим признакам, собираясь вокруг крайних пропагандистов типа Маркаряна, которые говорят то, что они понимают и ощущали на себе, и из которых легко набрать крайнюю прослойку, которой легко манипулировать.
Вот такая вот многоходовачка, а результат - пятая колонна внутри человечества как такового. Как тебе теория?
>>1500989 >Потом и вовсе какой-то пидор тёлкой притворялся со мной полгода переписывался изображая из себя заинтересованность потом соскамил сраных 15к и слился.
Это дейтинг скам (раньше так называлось, как сейчас - не помню) Один раз пригласили в такую группу, там сидело 50 человек и делились советами как двачеров на сайтах знакомств наебывать. Ливнул, нахуй оно надо. Ты хоть 15к вернул? заявку пиши
Всё остальное - шиза. Даже на двачах ботов пока нет, максимум мочух может какую нибудь тему для срача/разговора подкинуть чтобы тред оживить. Нейронки пока что глупые.
Спустя долгое время написала предположительно нейросеть (под видом анона); я был вежлив, но заблочил её (после трёх, вроде, сообщений). Сперва подумал, что тролль или шиз, отвечал ей
AI Chatbot General № 794 /aicg/
Аноним23/01/26 Птн 22:14:47№1500448Ответ
>>1503891 заткни уже рот. Нахуя ты здесь такой ленивый усрался с таким очевидным вопросом, который можно самому решить за 2 минуты почитав пресет? Может тебе ещё подсказать как дышать?
>>1503554 Просто не рп-ш такую хуйню, ну или если уж так хочется этого на мистральке то придётся тебе побыть наратором и немного поиграть в блокнот редактируя за чара, дальше сетка сама подхватит если это правда лардж.
Алсо не мог зайти на двачи под тех работы, было че-то интересное до отката временной линии?
CPA‑Qwen3‑8B‑v0 был выпущен для бухгалтерского учёта, аудита и соответствия требованиям, предоставляя финансовым командам предметно-ориентированную языковую модель (LLM).
Проект MemOS представил обработку изменяемого состояния для долго работающих агентов, стремясь стабилизировать рабочие процессы на основе RAG.
Personal‑Guru запущен как бесплатный локальный ИИ-репетитор с приоритетом на более структурированное обучение по сравнению с универсальными чат-ботами.
💻 Аппаратное обеспечение
Китай заблокировал поставки ИИ-чипов Nvidia H200, несмотря на разрешение США на экспорт, приостановив производство и создав неопределённость в поставках. Блокировка последовала после введения 25% пошлины на H200, подчеркнув нарастающее напряжение в технологической торговле.
💰 Финансирование
Sequoia Capital присоединилась к раунду Series G на сумму $25 млрд для Anthropic, нацеленному на оценку компании в $350 млрд.
Novolo объявила о техническом гранте в размере $3000 для десяти стартапов на ранней стадии в отдельных западных рынках. s
📱 Приложения
Генеральный директор Cursor AI продемонстрировал агентов GPT‑5.2, создавших полноценный веб-браузер и написавших более 3 миллионов строк кода за семь дней.
Демонстрация показывает масштабируемый потенциал многоагентных конвейеров LLM для крупномасштабной разработки программного обеспечения.
⚙️ Инфраструктура
Команда обработала более 1 миллиона электронных писем для создания структурированного контекста для ИИ-агентов, раскрыв практические приёмы масштабирования.
Разработчики экспериментировали с запуском больших языковых моделей на нетипичном оборудовании, бросая вызов доминирующей парадигме «масштабирования вверх».
📦 Продукты
Confer использует шифрование WebAuthn passkey и TEE (Trusted Execution Environment) для инференса, предотвращая сбор или использование данных диалогов для обучения модели. Сервис предлагает бесплатный тариф и платный план за $35 в месяц с неограниченным доступом и расширенными функциями.
📰 Главные новости об ИИ
Китай заблокировал чипы Nvidia H200, несмотря на одобрение США, подчеркнув продолжающийся технологический торговый конфликт.
Sequoia инвестировала в Anthropic в рамках раунда на $25 млрд, нацеленного на оценку в $350 млрд.
CloudPrompt предоставляет бесплатную библиотеку промптов с хранением в Google Drive и приоритетом на конфиденциальность.
Prompttu — это настольное приложение, централизующее и обеспечивающее быстрый доступ к сохранённым ИИ-промптам.
Newelle 1.2 добавил поддержку llama.cpp, расширив свои возможности как помощника в Linux.
Claude Code внедрил сброс контекста при принятии плана, чтобы повысить надёжность многоэтапных сессий программирования.
📰 Мнения и аналитика
Аналитики Goldman Sachs прогнозируют автоматизацию примерно 25% всех рабочих часов благодаря ИИ, что преобразует производительность в различных отраслях.
📰 Безопасность ИИ
Эксперты обращают внимание на новые угрозы, при которых инсайдеры внедряют вредоносные данные для порчи выводов будущих ИИ-моделей.
📰 Инструменты
Gemini AI Photo Editor предлагает генерацию и редактирование изображений по текстовому запросу прямо в браузере.
Botphonic.ai предоставляет ИИ-ассистента для голосовых звонков в различных корпоративных сферах.
Upfluence запускает ИИ-копилота для управления маркетинговыми кампаниями с участием инфлюенсеров.
puck представляет собой визуальный редактор React с улучшенными ИИ-возможностями.
📰 Разное
Новая серверная конфигурация с 128 ГБ видеопамяти демонстрирует аппаратное обеспечение ИИ с ультравысокой памятью.
Ли из Южной Кореи и Мелони из Италии договорились укреплять сотрудничество в области ИИ и чипов.
Сверхпопулярная песня была исключена из шведских чартов за то, что является произведением ИИ.
Маск требует до 134 млрд долларов в судебном иске против OpenAI, несмотря на своё состояние в 700 млрд долларов.
Oshen построил первого океанского робота для сбора данных в урагане категории 5.
GLM-4.7-Flash вышел и стал лидером в 30B локальных моделях для домашнего использования в тестах.
Начальник полиции Уэст-Мидлендс уходит в отставку из-за галлюцинации ИИ
Новая 8-миллиардная модель NVIDIA — это Orchestrator-8B, специализированная ИИ-модель с 8 миллиардами параметров, разработанная не для того, чтобы самой отвечать на всё, а для интеллектуального управления и маршрутизации сложных задач к различным инструментам (таким как веб-поиск, выполнение кода, другие языковые модели) в целях повышения эффективности
Уникальный двуязычный (немецко-английский) корпус литературной эротики объёмом 3,2 млн слов доступен для обучения ИИ — предварительные фрагменты размещены на Hugging Face
Южные корейцы теперь тратят на подписки на ИИ больше, чем на Netflix, каждый месяц
Anthropic работает над настраиваемыми командами для Claude Code
Google Chrome тестирует ИИ-«навыки», работающие на основе Gemini
Стартап в области ИИ Replit запускает функцию Vibe Code для создания мобильных приложений
ОАЭ лидируют с уровнем внедрения ИИ в 64 %, значительно опережая США и Европу, заявила Microsoft
Walmart объединяется с Gemini от Google, чтобы покупателям было проще находить и приобретать товары
xAI привлекает 20 миллиардов долларов для расширения моделей Grok и корпоративных инструментов
Boston Dynamics и DeepMind формируют новое партнёрство в области ИИ
посоны помогите гайдиком или ссылочкой на гайдик как генерить музычку локально на своём железе. до этого темой аи не интересовался, если кто скажет как вкатиться чтоб просто для себя генерить музычку прям как в suno, буду признателен. а и ещё, в компике стоит rtx 5060 ti, подойдёт или со скрипом, болью и унижением жить придётся?
>>1489395 благодарю, человек. попробовал, прикольно, но да, сильно не уровень той же suno. добавил в атач результат, если кому интересно как он с русским языком справляется (спойлер: плохо). возможно с другими промтами если поиграться можно саму мелодию сгенерировать более интересно, на минимальных "rock, acoustic guitar, male vocals" звучит слишком скучно, как по мне.
Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
@monkey почему не отвечаешь этому >>1501202 анониму? А этот >>1501202 просто @Monkey кинул без конкретики, типо "вопросы?" - на что отвечать, если ничего не спросил. Если анон реально хочет про Flux или ComfyUI потрещать - пусть формулирует нормально, а не ньюфагски.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1500753 Да я знаю про кнопку, просто ролеплейная суть теряется, когда англюсик вылазит. А так я свои слова могу переводить только и кнопку на овтетах жать. Интересно былобы не вручную жать, а чтоб оносамо.
>>1500621 Это за 1.5к переходник с pcie на эти SFF8654? Я видел только за 3.5к комплект (на картинке, сейчас 4к), 1х pcie16->2xSFF8654, 2x провода SFF8654, 2х переходники SFF8654->pciex16 - по отдельности провода ко 1.1, платы по 1.5. То есть с одного комплекта в режиме 8+8 можно подключить твою плату, впрочем. Если отдельно брать, то дороже выходит - то есть проще купить комплект и выкинуть/продать переходники SFF8654->pciex16 если брать плату как у тебя.
Я не думаю что там с этого 24-пинового разъёма оно берёт что-то кроме 5.0 и 3.3 вольт - то есть можно и к одному блоку подключить, надо будет как выше говорили просто поколхозить.
Кстати одиночную плату вот как у меня на картинке, но сразу с двумя входам SFF8654 тоже видел, но она сразу 8к стоит - то есть дешевле переходники SFF8654->pciex16 брать выше. Даже один комплект + плата за 4к дешевле, чем одну за 8к брать.
В общем расскажешь как подключишь что вышло и какие плюсы/минусы. Ты тут не последний собираешь такое.
Не нашел в этом разделе нано-бананы 2 треда. Поэтому создам.
Здесь дают 10 кредитов в день на 5 генераций: higgsfield.ai/image/nano_banana_2 Можно зайти через гугл. Один гугл-аккаунт дает 5 ежедневных генераций. Этот ресурс лепит плашку в правый нижний угол. Можно избавиться с помощью других нейронок, или прописать промпт/задать размеры так, чтобы в правом нижнем углу был однотонный фон, тогда плашку легко удалить в пейнте.
>>1483950 >Уже календари на почте продают с ИИ-лошадями Вот это пиздец. Обожаю выбирать себе и друзьям но новый год календари с каким-нибудь красивым артом или фотками, а в продаже в последнее время одна ии-дрисня. Причём самыми шаблонными моделями, ладно бы что-то креативное.
существуют ли заранее настроенные нейросети для решения математических задач, например chat GPT условный заранее настроенный, АИ агенты может какие-то готовые, как вообще такое можно поискать?
>>1467248 Да никто и не спорит што нейросетка цыферки щитает. К примеру прощщитывает координаты частей тела для движения в пространстве. Но результат то просто ахуенный. Есть видосы, которые уже от настоящих не отличить. Да и просто картинки такие рисует, што можно вапще не жениться.
Здарова двачане, очень нужна помощь, делаю проект и хочу вставить хорошую или более менее говорилку, в тик токе наткнулся на такую и в целом очень часто её слышал, где такую можно сделать?
>>1497391 Так им нужно этого говорить, чтобы им деньги давали. Если они скажут, что ллм - это ограниченная какашка, им никто не даст денег. Поэтому да, альтернатива хуже - остаться без деняк.
Новости об искусственном интеллекте №48 /news/
Аноним# OP14/01/26 Срд 04:26:13№1488996Ответ
Zhipu AI выпустила GLM-4.7 — открытую модель, позиционируемую как лучший программист и решатель задач на начало 2026 года.
Cerebras анонсировала GLM-4.7-REAP-268B-A32B, расширив семейство до варианта с 268 млрд параметров.
🛠️ Инструменты для разработчиков
Google представила Universal Commerce Protocol (UCP), позволяющий ИИ-агентам осуществлять поиск товаров, оформление заказов и послепродажную поддержку для ритейлеров, таких как Shopify и Walmart.
Anthropic внедрила изоляцию на уровне ОС с использованием bubblewrap и gVisor для Claude Code CLI, продемонстрировав низкоуровневую стратегию безопасности для ИИ-агентов.
📰 Главные новости в ИИ
Google запустила AI Inbox для Gmail, автоматически генерирующий списки дел и тематические сводки для доверенных тестировщиков.
Anthropic представила Claude for Healthcare и расширила Claude for Life Sciences, добавив функции, соответствующие требованиям HIPAA, и коннекторы к основным клиническим платформам.
🔓 Открытый исходный код
PerpetualBooster — это библиотека градиентного бустинга с непрерывным обучением сложности O(n), превосходящая AutoGluon на табличных бенчмарках.
Kreuzberg v4.0 выпущена как библиотека с открытым исходным кодом для интеллектуального анализа документов, извлекающая структурированные данные из PDF-файлов и сканов.
X Илона Маска объявила, что будет выпускать свой алгоритм рекомендаций с открытым исходным кодом каждые четыре недели, повышая прозрачность ранжирования.
💻 Аппаратное обеспечение
XGIMI запустила серию умных очков Memomind AI (Memo One, Memo Air, Memo Air Display) с возможностью выбора оправы и встроенным ИИ-ассистентом, начальная цена — $599.
⚖️ Регулирование
Индонезия и Малайзия запретили доступ к чат-боту Grok от xAI после того, как он создал сексуализированные ИИ-изображения, что подчеркивает растущее регуляторное давление на генеративный ИИ.
📱 Приложения
Meta и Гарвардский университет представили Confucius Code Agent — ИИ-систему, сохраняющую структурированные заметки и память при работе с большими кодовыми базами для повышения продуктивности разработчиков.
📰 Безопасность ИИ
Группа инсайдеров из сферы ИИ создала платформу Poison Fountain для распространения слегка искажённого кода с целью отравления обучающих наборов данных и демонстрации уязвимостей моделей.
📰 Инструменты
MiroThinker — это модель поискового агента с открытым исходным кодом, разработанная для рассуждений с использованием внешних инструментов и получения информации из реального мира.
memU предоставляет инфраструктурный уровень памяти, обеспечивающий постоянное состояние для больших языковых моделей (LLM) и ИИ-агентов.
📰 Разное
Apple объединяется с Google Gemini для создания Siri с искусственным интеллектом.
Anthropic анонсирует Claude for Healthcare после презентации OpenAI ChatGPT Health.
Hyundai демонстрирует роботов-собак, танцующих под K-pop, и гуманоидного робота Atlas на выставке CES.
Терри Тао говорит: «Я могу честно сказать, что кое-чему научился у Аристотеля», после того как ИИ внес вклад еще в одно решение проблемы Эрдёша.
Генеральный директор Anthropic Дарио Амодеи прогнозирует, что ИИ скоро будет играть «центральную роль в многочисленных открытиях» уровня CRISPR.
Meta объявила о новой инициативе «Meta Compute» с целью масштабировать свою инфраструктуру до десятков гигаватт в течение этого десятилетия. Похоже, Цукерберг планирует сократить Reality Labs на 10 процентов, чтобы профинансировать это, по сути ликвидируя метавселенную ради покупки дополнительных GPU.
Coreweave подключает более 2000 GPU в день на своем объекте в Дентоне, штат Техас. Энергосистема ощущает нагрузку. PJM, крупнейший оператор энергосети США, теперь ожидает роста спроса на электроэнергиию на 4,8 % в год в течение следующего десятилетия.
Чтобы смягчить рост затрат для потребителей, Белый дом заявил, что технологические компании впредь должны «сами оплачивать» новые мощности генерации электроэнергии.
SK Hynix инвестирует 12,9 млрд долларов в строительство завода по передовой упаковке чипов в Южной Корее специально для удовлетворения ненасытного спроса на HBM — память, критически важную для ИИ.
Палата представителей одновременно «запирает заднюю дверь», приняв двухпартийный Закон о безопасности удаленного доступа, ограничивающий возможность иностранных противников получать доступ к американским ИИ-чипам через облако.
Basecamp Research и Nvidia представили EDEN — модель с 28 миллиардами параметров, обученную на массивном наборе данных, содержащем 10 миллиардов новых генов. Модель уже разработала новые антибиотические пептиды с экспериментальной эффективностью 97 %.
Eli Lilly и Nvidia совместно инвестировали до 1 млрд долларов в «первую в своем роде лабораторию совместных ИИ-инноваций».
>>1495185 Там как бы в технологические пределы пока уперлись, нанометры тонут, ты в курсе? На данный момент снова к архитектуре шкафов железо разворачивается, как раньше было. Пока не очень заметно, но TDP неплохо об этом сигнализирует. Так что, софт вполне может стать тем, что будет больше профита приносить в графонии по затратам/выхлопу. Конечно, никто не запретит покупать железо хорошее. Но оно конских денег будет стоить и будет энтерпрайзным. А вот нейронки не такие затратные, особенно при отсутствии альтернатив.
Генерация видео из видео
Аноним09/01/26 Птн 16:55:47№1484052Ответ
Анон, давай обсудим генерацию видео не по промпту или изображению, а по видео образцу. Будем честны, движения персонажей в обычном АИ-видео часто очень далеки от совершенства. Даже генерации с начальным + конечным кадром не особо помогают, так как смысл движения лежит где-то посредине между ними.
Так почему бы не брать готовые видео из фильмов/вебм + видео или изображения персонажей и просто вписывать новых персонажей в старое видео? Многие последние модели это умеют. Точно знаю что WAN 2.6 может. Только вот, хули это так неудобно делать? Надо накатывать ComfyUI у себя на компе и потом через их API блять еще платить за доступ к их модели. Это не только дорого, но и совершенно неудобно. Ну нахуя мне ComfyUI на ноутбуке без видеокарты?
>>1495721 > но это не для ноутбуков без видюх, хоть и бесплатно Так это не проблема. Можно арендовать сервер с видюхой и залить туда модель, сейчас серваки со старым железом за копейки сдают.
Проблема в том что качество генерации не особо хорошее по сравнению с онлайн моделями. Чем больше генерации и меньше информации об исходном видео, тем ниже качество. Вон, у тебя классные видосы получились, но на них только от силы 30% генерация, остальное осталось от исходника.