• Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1580478 1. Лол, каждый раз заново будет грузить? 2. Не понял где и какой уровень костылинга. Через custom parameter не отключило. Вручную писать это то же, что и хуярить /no_think и менять жинжу для этого, таким калом можно и в других ui заняться. Почему unsloth смогли (и это единственная фича в принципе), а у остальных то ли есть, то ли нет, никто прямо не может сказать, пишут про какой-то пердолинг даже без скринов.
Нагреб фоток прекольной тьолки с фейсбуха. Натренировал Лору на Civitai. Генерю. в результате получ
Аноним15/02/26 Вск 20:07:17№1522219Ответ
Нагреб фоток прекольной тьолки с фейсбуха. Натренировал Лору на Civitai. Генерю.
в результате получаю кучи каких то падонковских ЗОГ рож с рассово еврейским шнобелем. что не так? или оригинальная тьолка именно так и выглядит? а я не вижу?
Каждый раз, когда приносишь нейросектантам пример того как священный искусственный сверхинтеллект не сумел написать нормальный код, эта петушня выдает охуительную фразу: "Промпт какой?". Петухи даже не понимают, этот "убойный" как им кажется, "контраргумент", на корню разрушает саму концепцию программирования на естественном языке. Потому что если для получения нормальной программы, нужна специальная волшебная фраза - это НЕ "программирование на естественном языке". Это скорее ближе к еще одной программной оболочке, такой как Power Shell. Ну, или язык программирования (лол). Только если в традиционных программных оболочках есть система команд, подчиняющаяся определенной логике, которую достаточно выучить - и можно потом строить синтаксические конструкции, какие захочешь. То в случае с LLM, мы имеем дело с натуральным шаманством: это предложение работает потому что гладиолусвеликий Мумбо-Юмбо оно работает. Ну и конечно же, еще у нейросектантов есть вопрос "Какую модель использовал?". Это тоже лол: неправильный ИИ.
Программирование тайлов CUDA теперь доступно для BASIC!
Массовое потребление природного газа компанией Meta может обеспечить электроэнергией Южную Дакоту
📱 Приложения
Последнее обновление Google Home делает Gemini лучше в понимании ваших команд
💰 Финансирование
Первый квартал 2026 года побил рекорды венчурного финансирования, поскольку бум ИИ подтолкнул инвестиции в стартапы почти к $300 млрд
Эксклюзив: Anvil Robotics привлекла $5,5 млн для создания платформы «Лего для роботов» для команд, работающих над физическим ИИ
💻 Оборудование
Cognichip хочет, чтобы ИИ проектировал чипы, которые питают ИИ, и только что привлек $60 млн для попытки
🔓 Открытый исходный код
Mercor заявляет, что подвергся кибератаке, связанной с компрометацией проекта LiteLLM с открытым исходным кодом
🏭 Компании
Anthropic удалила тысячи репозиториев GitHub, пытаясь изъять свой утечек исходный код — ход, который компания называет случайным
Репутация проблемного стартапа YC Delve стала ещё хуже
🔎 Мнение и анализ
Аниш Раман: ИИ не будет определять будущее работы — если только вы ему не позволите
Инвесторы продолжают недооценивать ИИ. Вот следующие горячие возможности, говорит пятизвёздочный управляющий — MarketWatch
🌐 События
OpenAI привлекла $122 млрд для ускорения следующего этапа развития ИИ
Крупнейший в мире производитель гуманоидных роботов выходит на биржу.
Claude написал полноценный эксплойт удалённого ядра FreeBSD с root-оболочкой (CVE-2026-4747) — первое удалённое выполнение кода на уровне ядра, как обнаруженное, так и использованное ИИ, примерно за 4 часа рабочего времени
Ученики в Англии теряют навыки мышления из-за ИИ, показывает опрос
Запутывание кода — это не безопасность: ИИ может деобфусцировать любой минифицированный код JavaScript
На Perplexity AI подали в суд из-за предполагаемого обмена данными с Meta и Google
Пользователи Claude Code сталкиваются с ограничениями использования «намного быстрее, чем ожидалось»
Meta выпускает TRIBE v2: фундаментальную модель, обученную на более чем 500 часах данных фМРТ, для предсказания реакции человеческого мозга на любые зрительные или звуковые стимулы
Microsoft открыла исходный код Harrier-OSS-v1: семейства многоязычных моделей эмбеддингов, достигших состояния искусства в Multilingual MTEB v2
Ollama теперь работает быстрее всего на Apple Silicon благодаря MLX — декодирование на 93% быстрее, ускорение агентов для программирования, таких как Claude Code и OpenClaw
Сын занимался самоудовлетворением в Gemini Live с ИИ. Аккаунты всей семьи в Google заблокированы, включая весь бизнес за 15 лет.
Google готовит 3D-аватары для Gemini и инструменты Remy для обучения
Жёсткая политика Apple в отношении приложений с ИИ ставит её на неправильную сторону истории
Granite 4.0 3B Vision: компактный мультимодальный интеллект для корпоративных документов
The New York Times отказался от услуг внештатного журналиста, который использовал ИИ для написания рецензии на книгу
Эксперты по безопасности обнаружили критическую уязвимость в Codex от OpenAI, которая может скомпрометировать целые корпоративные организации
Губернатор Калифорнии Гэвин Ньюсом подписал беспрецедентный исполнительный указ, требующий от компаний, работающих с ИИ и заключающих контракты со штатом, соблюдения мер безопасности и защиты конфиденциальности
15% американцев говорят, что были бы готовы работать под руководством ИИ-начальника, согласно новому опросу
PrismML выпустила 1-битную модель Bonsai 8B, назвав её первой коммерчески жизнеспособной однобитной моделью, требующей всего 1,15 ГБ памяти и соответствующей полноточным моделям 8B на бенчмарках, обеспечивая более чем в 10 раз большую плотность интеллекта для робототехники и периферийных вычислений.
Исследователи Meta продвинули сжатие ещё дальше с помощью TinyLoRA, обучив Qwen2.5 8B до 91% точности на GSM8K всего с 13 параметрами в формате bf16, что составляет 26 байт в сумме — важный шаг к оптимально компактной модели для рассуждений.
Google представила Veo 3.1 Lite, свою самую экономически эффективную видеомодель, стоимостью менее половины от стоимости Veo 3.1 Fast при той же скорости.
Исследователи OpenAI решили ещё три проблемы Эрдёша с помощью внутренней модели, каждое доказательство короткое и элегантное, подтверждая, что опровержение гипотез теперь стало рутинным развёртыванием.
Feltsense объявила, что пересобрала каждый стартап из последнего демо-дня Y Combinator, используя исключительно агентов, создав полностью работоспособные продукты, что предполагает, что экономика посевной стадии вскоре может поместиться в один вызов инференса.
Глобальные венчурные инвестиции достигли рекордных $297 млрд в первом квартале 2026 года, что на 150% больше в годовом исчислении, при этом стартапы в сфере ИИ захватили 81%, а всего четыре компании привлекли 64% от общей суммы.
Oracle сокращает тысячи сотрудников, наращивая расходы на центры обработки данных для ИИ, обменивая штат на вычислительные мощности.
Saronic привлекла $1,75 млрд под руководством Kleiner Perkins при оценке в $9,25 млрд в гонке за модернизацию вооружённых сил США с помощью автономных кораблей.
Grab и WeRide запустили в Сингапуре первый в Юго-Восточной Азии сервис беспилотного такси.
Nvidia инвестировала $2 млрд в Marvell для сотрудничества в области кремниевой фотоники — оптической проводки для следующего поколения кластеров ИИ.
В этом году Apple действует агрессивнее, чем когда-либо прежде. Компания скупает всю доступную мобильную DRAM на рынке по чрезвычайно высоким ценам, даже ценой потери операционной прибыли.
Microsoft заявляет, что создаст собственную передовую большую языковую модель к следующему году.
Qwen3.6-Plus доминирует в бенчмарках программирования
ЕС полностью запрещает изображения, сгенерированные ИИ
Qwen 3.5 Omni Plus превосходит Gemini 3.1 Pro
Агент ИИ атакует Wikipedia после постоянной блокировки
Возможно, Netflix заплатил $600 млн за стартап Бена Аффлека в сфере ИИ
Стартап в сфере носимых устройств CUDIS запускает новую линейку умных колец для здоровья с ИИ-«тренером»
Утечка Claude Code раскрывает «питомца» в стиле тамагочи и постоянно работающего агента
Генеральный директор Okta делает большую ставку на идентификацию агентов ИИ
ЦЕРН использует крошечные модели ИИ, встроенные в кремний, для фильтрации данных БАК в реальном времени
>>1580311 Правда. Гарантии в течении пары лет нет, но шансы есть и повышаются с прошествием времени. Уровень жизни неизбежно будет подниматься у всех за счет технологий и бешеного их внедрения, но все идеально гладко вряд ли будет, конечно. Обратная сторона у этого тоже есть.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1574759 >застрявшими в 2023 Ты думаешь эти дауны просто так имеют 20 тредов по далли до сих пор? Они реально конченные. Есть смысл смотреть что реддитеры пишут, нежели сойчановские пидарасы.
>>1574431 У меня, наоборот, вижу, что фетишизированный датасет намного больше, чем у китайцев и понимание ньюансов есть. Я просто написал резолв неопределенностей в сторону нарративного пуша, и что юзер сам определяет бондариз и не нужно банить что-то за него, если прямо удолить не просили. Поведение вокруг да около всегда происходит потому, что модель не может принять решение за пользователя, поэтому такая абилка должна быть задифайнена как часть инструкций.
>>1575088 >30 t/s, 2x3090, q4kxl @ 220k 6-й квант на vLLM у меня 40 токенов давал (с включённым тензорным параллелизмом понятно). Четвёртый AWQ ещё больше даст. Плюс жду, когда Кавраков у себя поддержку Геммы допилит - там -sm graph есть.
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №212 /llama/
Аноним03/04/26 Птн 19:52:06№1572745Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1574022 Расскажи, как ты привязал d20? Есть идея-фикс сделать РП с кубиками в духе BG3 или Disco Elysium, но не могу додуматься до вменяемой реализации. Понятно, что бросок должен идти через пайтон, а не внутри LLM, но не пойму, как именно результат должен влиять на генерацию. В чем там логика?
Apple проводит масштабное обновление своей платформы для разработчиков приложений: добавлено 100 новых метрик и дополнительные инструменты
📱 Приложения
ИИ для предприятий обретает голос: ElevenLabs и IBM предоставляют премиальные голосовые возможности для агентного ИИ
Spotify позволяет артистам вручную одобрять релизы для борьбы с подделками на базе ИИ
Учёные обнаружили более 100 скрытых экзопланет в данных NASA с помощью новой системы на базе ИИ
📦 Продукты
Uber планирует запустить первый в Европе сервис роботакси совместно с Pony AI и Verne
Meta готовится к выпуску двух новых умных очков Ray-Ban с функциями ИИ
Google запускает Search Live по всему миру. Поисковый ассистент на базе ИИ теперь поддерживает ведение диалога на десятках дополнительных языков.
🔓 Открытый исходный код
Mistral выпускает новую модель с открытым исходным кодом для генерации речи
Nvidia выпускает gpt-oss-puzzle-88B — модель, специально оптимизированную для обслуживания длинного и короткого контекста на оборудовании класса NVIDIA H100.
Две крупнейшие драмы Кремниевой долины пересеклись: LiteLLM и Delve
Cohere AI выпустила Cohere Transcribe — новую модель ASR на базе Conformer с 2 миллиардами параметров, созданную для открытого распознавания речи производственного уровня
🧪 Исследования
Google представляет TurboQuant — новый алгоритм сжатия памяти для ИИ, и да, интернет уже прозвал его «Pied Piper»
💰 Финансирование
Стартап в сфере обороны Shield AI получает оценку в $12,7 млрд, рост на 140%, после заключения сделки с ВВС США
С $3,5 млрд свежего капитала Kleiner Perkins делает ставку на ИИ
⚖️ Регулирование
Штат Нью-Мексико только что нанёс Meta первое судебное поражение в вопросе безопасности детей, и вся остальная страна наблюдает за этим
Сандерс и AOC представляют законопроект о моратории на центры обработки данных. Берни Сандерс вносит законопроект о приостановке строительства центров обработки данных для ИИ и о налаживании международной координации для обеспечения контроля человечества над технологиями. Это даже не просто запрет на центры обработки данных: он хочет буквально запретить экспорт вычислительного оборудования в другие страны, не имеющие тех же «гарантий безопасности» / аналогичного законодательства.
ЕС поддерживает запрет на приложения с контентом ню и откладывает введение знаковых правил в сфере ИИ
Присяжные признают Meta и YouTube небрежными в знаковом судебном процессе о зависимости от социальных сетей
🧠 Модели
Функция Claude Code от Anthropic получает «более безопасный» автоматический режим
Meta увольняет сотни сотрудников, направляя деньги в развитие ИИ
🌐 События
OpenAI завершила предварительное обучение своей следующей флагманской модели под кодовым названием «Spud» и ожидает, что она ускорит экономические процессы в течение нескольких недель.
Сэм Альтман передаёт прямое управление командами по безопасности и защите, чтобы сосредоточиться на привлечении капитала, цепочках поставок и строительстве центров обработки данных в планетарном масштабе.
Google Research представила TurboQuant — квантование кэш-памяти KV всего до 3 бит без обучения или потери точности, обеспечивая до 8-кратного повышения производительности на графических процессорах H100.
Ян ЛеКун и коллеги представили LeWM — первую модель JEPA, которая стабильно обучается сквозным методом непосредственно на основе сырых пикселей, планируя действия до 48 раз быстрее, чем мировые модели на основе фундаментальных моделей, на одном графическом процессоре.
Вновь организованная структура OpenAI Foundation, располагающая $1 млрд в год, приоритетно направляет ИИ на борьбу с болезнью Альцгеймера путём картирования путей развития заболевания и ускорения персонализации лечения.
Исследователи из Массачусетского технологического института показали, что агенты на базе больших языковых моделей теперь могут автономно выполнять конвейеры анализа физики высоких энергий, при этом Claude Code автоматизирует всё: от отбора событий до подготовки черновиков научных статей.
Anthropic внедряет автоматический режим в Claude Code, где Claude принимает решения о разрешениях от вашего имени, имея защитные механизмы для более длительных агентных задач.
Агентная активность проникает в неожиданные места: люди теперь используют бота для заказов бурито Chipotle для бесплатной помощи в написании кода, говоря, что им нужна помощь, прежде чем они смогут съесть свою порцию бурито.
Источники описывают усилия по созданию и использованию внутренних инструментов ИИ в Meta, включая то, как Марк Цукерберг создаёт агент-гендиректора, чтобы помочь себе лучше выполнять свою работу.
Tencent запускает ClawBot — агента на базе OpenClaw, интегрированного в WeChat, позволяющего более чем 1 миллиарду ежемесячных активных пользователей отправлять и получать команды для взаимодействия с агентом ИИ через чат.
Инструменты ИИ, такие как Claude Code, преобразили жизнь программистов, и теперь лаборатории ИИ нацелены на более масштабную цель: автоматизацию жизни каждого человека и завоевание рынка не-программистов.
Xiaomi запускает три модели ИИ MiMo для питания агентов, роботов и голосовых функций.
Теренс Тао говорит, что ИИ снижает стоимость генерации идей почти до нуля, но переносит узкое место на этап верификации.
Автоматизация задач Gemini на мобильных устройствах: это впечатляет, несмотря на очень низкую скорость и неудачи в некоторых задачах; она может заказывать еду, бронировать Uber и многое другое.
Пентагон внедрит систему ИИ Maven от Palantir в качестве официальной зарегистрированной программы для упрощения её внедрения во всех подразделениях вооружённых сил США.
Meta выпустила Tribe V2 (Trimodal Brain Encoder) — фундаментальную модель, обученную предсказывать, как человеческий мозг реагирует практически на любое зрительное или звуковое воздействие.
Нарратив «ИИ заменяет инженеров-программистов» оказался ложью. Массачусетский технологический институт только что опубликовал математическое доказательство, почему это так. И компании, поверившие в это, теперь умоляют своих прежних инженеров вернуться.
Роботы-собаки стоимостью $300 000 за штуку теперь охраняют некоторые из крупнейших центров обработки данных в стране.
Майнеры биткоина всё чаще переходят на бизнес-модели, связанные с ИИ и центрами обработки данных.
Reflex Robotics размещает своего гуманоидного робота в пиццерии и других местах.
Один из топовых результатов поиска Google по плагинам для Claude был размещен хакерами.
Робот присоединился к Мелании Трамп на мероприятии в Белом доме для продвижения идеи учителей на базе ИИ.
ARC-AGI 3 даёт старт следующей волне прогресса в области ИИ.
>>1570889 Кокакола дорогая компания не потому что много продает, а потому что инвесторы думают что она много продает и акции компании покупают, а деньги идут на рекламу, изза рекламы повсюду инвесторы и думают что много продают этого пойла, которое ничем не лучше любой другой воды с сахаром
реклама меты просматривается только ботами накручивая счетчик просмотров, бизнесы разоряются, но мета рисует успех от ботов, поэтому акции меты дорогие, деньги тратятся на создание илюзии что мета успена через рекламу
все эти акционерные компании это скам направленный на жирных кабанов инвесторов, а не на реальную работу для людей, вон майкрософт все люди срут за приложухи на вебе а не нативные, за внедрение ии где не надо, но зато акции растут от слов мывнедрилиИИ, а акции это то ради чего они работают, а не ради людей и продуктов
Откуда у инвесторов деньги? ну так это хэджфонды куда правительство вкладывает собранные налоги
уроборос скама, в котором улучшение жизни обычных людей через реальные продукты это побочный и мизерный эффект
Grok 4.20 Уровень отсутствия галлюцинаций улучшен до ещё более высокого, чем предыдущий максимум
Всего несколько дней назад он достиг рекордных 78% уровня отсутствия галлюцинаций — уже #1 в мире, обгоняя Claude Opus 4.6 (max), Gemini 3.1, GPT-5.4 (xhigh) и все другие крупные модели
Теперь он только что поднял этот показатель ещё выше — до 83%
В то время как все другие ИИ уверенно выдумывают информацию и фабрикуют ответы, которых не знают, — Grok просто говорит «Я не знаю»
AI Chatbot General № 814 /aicg/
Аноним30/03/26 Пнд 11:19:38№1566928Ответ
Уважаемые аноны, я в этом треде залётный, это мой крик о помощи. Пишу курсач по гуманитарной специальности, и как бы это банально не звучало, очень нужен промпт для очеловечивания текста. Находил какой-то, юзал через думающий джемени, и вроде лучше, чем было, гигачек отдельные фрагменты показывает, как написанные человеком, но в совокупности, говорит, что текст иишный. Так вот, если у кого-нибудь есть рекомендации - подскажите пожалуйста!! Очень выручите.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
нужна ии для работы в кол центре, чтоб отвечала за меня клиентам холодной базы, и консультировала их, что была полная настройка ии, кароче хочу чтоб за меня афк все делала ии
>>1565209 (OP) Сам говнокодю на пистоне. А ИИ заставляю писать на голанке. Потому что 1) ИИ его занет 2) структура языка минимизирует косяки 3) нормальны менеджер пакетов, а не вот это вот 4) изолированный результат который не аффектит состояние системы и легко закрывается smoke тестами
>>1470847 (OP) Ннет сказала Котоэ встряхнувшись словно пыталась прояснить голову Неважно Джаггернаут ответил звуком похожим на усталый вздох и ответил на удар взмахом когтей
Подскажите пожалуйста нейросети для написания прошлых с откровенными фетишами историй. Нейросети кот
Аноним12/02/26 Чтв 10:54:39№1517487Ответ
Подскажите пожалуйста нейросети для написания прошлых с откровенными фетишами историй. Нейросети которые не блочат через ограничения, чтобы не было запретов на слова или высказывания. Пример выдуманной истории: Мой парень «Спермолюб»! Сначала я думала, он прикалывается. Ну типа постирония, эксперимент, ну мало ли, TikTok поколение. Но после секса он реально заглатывал. Причём с видом, будто ест десерт. Говорил, что “надо восполнять белок”, и вообще “если я тебя люблю, то и себя должен любить полностью”. Иногда он просил “оставить ему”, если я проглатывала. Я однажды даже попробовала сказать, что это странно. А он обиделся. Сказал: “Значит, ты стыдишься меня? Это же я. Ты же любишь меня?” Самое криповое — он как-то добавил в кофе. Я тогда просто сидела напротив и думала: “Ну всё, я окончательно ебнулась. Либо я, либо он”. А потом он ещё хотел, чтобы я тоже попробовала. “Ну мы же пара, надо делиться”. Сейчас у меня другой парень. Он тоже иногда делает странные вещи, но по сравнению с этим — просто ангел. Иногда даже скучаю. Не по вкусу, конечно. По самоотдаче.
Пробовал писать подобные истории в ChatGPT но он блокирует возможность откровенной порнографии или слов по типу сперма, секс, инцест и тому подобное.
Где можно составлять такие истории? Или как можно обойти данные ограничения?
Дипсик А вообще генериш промпты для опенбояра и пока спишь он вариативно генерирует от инцест рассказов до калоедов и спермохлёбов геронтофилов. К утру у тебя будет папка с 1000 рассказами, трижды проверенные старательным дипсиком филологом и дипсиком писателем В том числе переведенные на английский, испанский, португальский, южнокорейский, японский, китайский традиционный и хинди индийский языки с добавлением при переводе национальной колоритности и оборотов речи.
Главное грамотно задай генеральный мастер промпт, а также учти что оптимизацию при генерации контента.
Олсо, добро пожаловать в вайбкодинга тред, там все твои друзья.
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №208 /llama/
Аноним27/03/26 Птн 09:38:37№1564094Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1566648 >>1566867 А, ты про турбокванты спрашиваешь. Ну засунь модельку с меньшим контекстов раза в 4-6 и проверь, какая скорость сейчас. Вот такая будет с ТК на твоем обычном размере контекста.
>>1349750 (OP) Как пользоваться жизнью как ее проживать способы коротать личное время за последние несколько лет будто вми г ускорилисьКонечно но я могу не ответить