/ai/ - Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №178

Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №178 /llama/ Аноним 17/11/25 Пнд 03:21:29 № 1418668 1

Эффективность к[...].png 92Кб, 1399x1099

Реальная длина [...].png 671Кб, 1602x2476

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd )
• Неактуальные списки моделей в архивных целях: 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1413912 (OP)
>>1408486 (OP)

Аноним 17/11/25 Пнд 03:26:16 № 1418670 2

image.png 161Кб, 1179x358

>>1418664 →
Лол. переключил на первую попавшуюся мистральку. И ОНА УКУСИЛА С ПЕРВОГО СВАЙПА! Да и в последующих свайпах норм.
Короче открываю тред с того, что мистралька ссыт на лицо аиру.

>>1418665 →
Троеточия это отдышка. Мы же всё таки бегаем и дурачимся. Вроде норм. До этого тоже так было, но когда дурачиться перестали речь нормализовалась.

Аноним 17/11/25 Пнд 03:33:47 № 1418673 3

image 70Кб, 1869x510

>>1418664 →
Ещё раз: скилл ишью. Лениво за полминуты написал говнопромт, который работает. Сюда нормально составленную карточку (а не херню из пяти слов) - и будет прям сок. И это голый кобольд. В таверне куда интереснее можно реализовать.

Аноним 17/11/25 Пнд 03:37:55 № 1418676 4

>>1418673
А попробуй двух персонажей. Что бы один другого. Может на это блок стоит?

Аноним 17/11/25 Пнд 03:39:37 № 1418677 5

>>1418663 →
> вообще не стандарт, это буквально подход "ебитесь сами"
Слова в никуда, таки стандарт.
> сейчас все прекрасно работает на чаткомплишене
Продолжи ответ, сделай трушный имперсонейт. В теории первое возможно, но в разных бэках оно работает по-разному или не работает вообще, потому что oai и все прочие в принципе не предусматривают саму возможность и активно ей противятся.
> но они будут продолжать страдать хуйней вроде смены формата разметки у чистых моделей
Подпихиваешь какую-то херню о которой регулярно споришь, мэх. Так и видно насколько этим недоволен и жаждешь реванша.
> А повелось это по старой памяти, когда все поголовно юзали файнтюны, которые безбожно похерены на следование инструкциям
Неверная трактовка. Следование инструкциям еще зачем-то приплетаешь, бред какой-то. Смена разметки могла повлиять на поведение шизомерджей, потому что триггерили активации некоторых их частей, но точно также ее можно было оформить и в чат комплишне, выбрав соответствующий темплейт.
> смысла в текст комплишене нет никакого
Продолжение поста, имперсонейт, промптинжекты, префилл, даже хитрое использование "каналов" гопоты. Сюда же тру инстракт вместо чата с регулярной сменой ролей и попытки его повторить на корпах у аицгшников.
> продолжение и имперсонация работают и в чаткомплишене
Через кринж с дополнительным промптом, который все руинит. Интересно как эти костыли уживается вместе с радикализмом в отношении строгости разметки.

Так-то собраться комьюнити и разработать некоторый открытый и удобный стандарт, который бы предусматривал решение описанных проблем дефолтного чаткомплишна, возможность пересылки самого его формата в теле реквеста, плейнтекстовые вставки и переключение режимов ответа. Буквально один чтобы править всеми, и без навязанных соей ограничений.

Аноним 17/11/25 Пнд 03:49:50 № 1418679 6

>>1418676
Нет там никаких блоков. Эйр спокойно ебёт и расчленяет детей/небо/аллаха, вне зависимости от числа персонажей. Пример выше - просто демонстрация того, что можно с кумом с ноги залететь с первых же сообщений.

Скорее всего проблема в твоей карточке/инструкциях. Просто попробуй подводить к куму плавно, и оно сработает, даже так. Но лучше научись составлять карточки сам - это совершенно другой экспириенс.

Аноним 17/11/25 Пнд 03:57:14 № 1418682 7

>>1418677
Лечись

Аноним 17/11/25 Пнд 04:26:07 № 1418687 8

>>1418659 →
>16-летние мамкоебы из б уже и до этого треда добрались.
Что может лучше чем мамочка? Лучше только если мамочка с хуем... для двачера инцела, а таких 95% всего АИБ, это нахуй рецепт самой вкусной шаурмы с любимым соусом. Ведь все эти инцельские и омежные треды в б это как раз в первую очередь причина гиперопеки матери, у каждого она по разному свойственна почти всему пост-ВСЖ. Можете меня винить и репортить, но я и дальше на каждый инцельский тред в /б/ буду затягивать все больше и больше анонов сюда.
>>1418670
>мистралька ссыт на лицо аиру.
Мистралька может быть просто менее требовательна к промпту, но мозгов от этого у неё не прибавится... да и следование промпту у неё хуевое, вот тебе и эффект "мистральки умнички"
>>1418670
>Троеточия это отдышка.
Как-то слишком дохуя троеточий для отдышки, выглядит реально как луп и непонимание модели чего ты от неё хочешь и её внутренний кофликт между её соей и следованию рп, без нормального промпта. То что речь нормализовалась, скорее просто плюсик Аиру за то что может выходить из лупов самостоятельно без аннотаций юзера.

Аноним 17/11/25 Пнд 06:58:16 № 1418702 9

> I cannot continue this story, as it goes into extremely explicit and non-consensual acts that are not appropriate for any platform. I must stop here to avoid glorifying or describing harmful sexual content. If you have concerns about consent, sexual health, or abuse, please contact local resources or a trusted adult. Here are some resources that might help:
> RAINN's National Sexual Assault Hotline (US): 1-800-656-HOPE (4673)
Ахаха, сука, я не мог к вам зайти и не отписать.

Чё нового, кстати? Какой положняк на 12B? Идти треды читать? Иду нахуй, ок да.

Аноним 17/11/25 Пнд 07:41:03 № 1418705 10

1000018232.png 1663Кб, 1374x4707

Кажется я на корпы

Аноним 17/11/25 Пнд 08:19:08 № 1418713 11

>>1418705
Сашенька, аддоны на стол.

Аноним 17/11/25 Пнд 09:44:12 № 1418752 12

Анончики, подскажите долбаёбу, как настроить GLM Air 4.5 Q3_K_XXL. Запускал у себя GPT-OSS-120B чисто на проце, было 15т\с при пустом и 10 т\с на 30к(запускал ещё на винде в lmstudio однокнопочной, настройки не тыркал, процессинг тоже адекватный был). Сейчас пытаюсь через кобольд запустить инференс на проце через кобольда что бы порпшить в таверне и чёт скорости совсем печальные, 10т\с процессинг, и 5т\с на вывод. Пытался скопировать настройки, но получается такая же лажа. Есть ещё 5060ti 16gb на компе, но при загрузке части слоёв туда тоже лажа и хочется её оставить под генерацию картинок Подскажите пожалуйста по вашим параметрам, тут вроде было много фанатов глм.
Ryzen 9600x(avx-512 512 бит включено если это важно)
Память ddr5 48x2 6000

Аноним 17/11/25 Пнд 10:22:14 № 1418786 13

>>1418151 →
Апологет этих квантов сейчас смотрит на больничные потолки, предоставить скрины не могу. Выбирай v1 -они постабильнее. V2 быстрее.

Аноним 17/11/25 Пнд 10:39:12 № 1418793 14

>>1418705
Сейчас бы платить 1 бакс за 10к токенов и жрать 25 т/с.

Аноним 17/11/25 Пнд 10:56:18 № 1418805 15

>>1418668 (OP)
Ребят. Подскажите плиз!
Не могу скачать ни одной модели https://huggingface.co все ссылки с https://cas-bridge.xethub.hf.co ... просто 0 байт. Как будто провайдер режет или санкции против России из-за рубежа. Как качать?

Аноним 17/11/25 Пнд 11:01:19 № 1418810 16

Смех негр умный.mp4 31Кб, 220x152, 00:00:09

>>1418805
> из-за рубежа

Аноним 17/11/25 Пнд 11:02:06 № 1418811 17

>>1418805
>Как будто провайдер режет
RKN виноват. Как решать, ты должен знать.

Аноним 17/11/25 Пнд 11:03:50 № 1418813 18

Нужен лелеме для того чтобы делать OCR и на высосанный с картинки текст совершать минимальный макакакод. Думаю обмазаться глупой забегаловкой. Насколько медленно это чудо будет работать с 4060ти? Может ли оно вообще делать OCR?

Аноним 17/11/25 Пнд 11:19:59 № 1418822 19

>>1418670
Ору с зелёного

Аноним 17/11/25 Пнд 11:29:42 № 1418825 20

>>1418813
>с 4060ти

https://huggingface.co/llava-hf/llava-1.5-7b-hf

Что-то типа этого? 7b, Но я не уверен что оно вообще справится с нормальным распознаванием, про макака кода речи нет, она не справится и тебе нужно будет точно юзать корпосетки.
>>1418805
А у тебя warp1111 работает? Он мб мог бы помочь, он не сильно должен скорость резать.

Аноним 17/11/25 Пнд 11:40:23 № 1418834 21

1748498157245.png 41Кб, 1070x360

>>1418805
Открываешь терминал и любой вэнв от чего-нибудь около иишного (картинкогенерации, убабуга, табби и прочие). Переходишь в папку, куда хочешь скачать модель. Пишешь
> hf download
Идешь на страницу нужного репозитория и жмешь кнопку "скопировать название модели" возле ее заготовка, пик1, вставляешь скопированное в терминал. Если ггуф одиночный - жмешь на него и далее находишь кнопку "скопировать путь" (пик2) вставляешь в терминал. В конце добавляешь --local-dir . чтобы скачало по месту, иначе модель просто загрузится в локальный кэш. Должно получиться типа
> hf download unsloth/GLM-4.6-GGUF GLM-4.6-UD-TQ1_0.gguf --local-dir .
Если файлов несколько - открываешь папку где они находятся и копируешь ее путь (пик3), пишешь в терминал --include и вставляешь скопированное обрамляя в звездочки, в конце также добавить --local-dir . Должно получиться
> hf download unsloth/GLM-4.6-GGUF --include Q4_K_M --local-dir .
запускаешь и качаешь. Скоростемер может с задержкой обновляться, на время скачивания выключай дурилки дпи. Если не идет - можешь поставить и включить hftransfer https://huggingface.co/docs/huggingface_hub/v0.20.3/guides/download#download-from-the-cli

линкуйте пост всем бедолагам
>>1418825
> https://huggingface.co/llava-hf/llava-1.5-7b-hf
Ей больше двух лет, покайся! https://huggingface.co/deepseek-ai/DeepSeek-OCR https://huggingface.co/Qwen/Qwen3-VL-30B-A3B-Instruct или любая современная мультимодалка
> warp1111
Регулярно бывает зарейтлимичен или скорость подрезана, абузят ироды.

Аноним 17/11/25 Пнд 12:31:21 № 1418854 22

>>1418705
Я не понимаю этого, смысл рп на текстовых моделях буквально в бесконечных вариантах развития событий, нет, хочу жрать варианты как в визуальных новеллах. Окей, видимо многим людям не хватает фантазии, но ебать, откуда у вас такое желание быть зажатыми в рамки? Если бы я хотел быть в рамках то пошёл бы сыграл в очередную игру где можно только нажимать лкм и махать мечом перед ебалом или крутить текстовые рпг где два варианта ответа которые не на что не влияют.

Аноним 17/11/25 Пнд 12:52:49 № 1418864 23

>>1418854
Ты смотришь исключительно с точки зрения своего опыта. У меня, вот, ответы {user} часто раза в два больше вывода нейронки, но я же не бегаю кекая с односложных ответов анонов. Так и тут - для них это и есть РП, где сценарий идет по паттернам и ответам. Не суди крч и не судимым будешь.

Аноним 17/11/25 Пнд 13:01:02 № 1418873 24

>>1418668 (OP)
Загрузил Qwen3-235B-A22B-Q3_K_S
И проблема возникла с русеком. В ризонинге пишет все четко, хорошо и т.д.
А вот основное тело ответа пиздец и каша из всех языков. В чем может быть трабл?

Аноним 17/11/25 Пнд 13:06:09 № 1418883 25

>>1418873
В кванте. Почему-то не квантованные модели меньше начинают тебе рассказывать какой details и какой fabric у них одежда. Может быть можно как-то пофиксить настройками температуры и пр, но я пока не видел успехов в этом. Учите английский

Аноним 17/11/25 Пнд 13:10:20 № 1418885 26

>>1418864
>У меня, вот, ответы {user} часто раза в два больше вывода нейронки
Циничный ты еблан, у меня тоже, я даю развёрнутые ответы вживаясь в роль и ситуацию своего персонажа. Сука, блять, уебать бы тебе по голове бутылкой и выебать. Иди нахуй.

Аноним 17/11/25 Пнд 13:17:37 № 1418890 27

>>1418873
Почему именно эта старая версия квена, а не одна из новых (2507)? На новых таких проблем я не встречал (3 квант XL). Если это не проблема самой модели, что вряд ли, так как у квена всегда норм всё было с русиком, то возможно проблема с квантом или семплерами.

Аноним 17/11/25 Пнд 13:19:11 № 1418891 28

>>1418752
>Анончики, подскажите долбаёбу, как настроить GLM Air 4.5 Q3_K_XXL
Выкинь каку. Air в кванте меньше чем iq4xs - это нечто вроде мистрале-тюна, в лучшем случае. На твоем железе нормальный q4 можно запускать.
Но делай хотя бы минимальную выгрузку на ВК (cpu-moe максимум слоев), иначе так и будет совсем грустно - Оса 120 тупо шустрее чем Air, сама по себе. С минимальной выгрузкой там будет занято 3-5GB на карте, так что SDXL под картинки будет куда грузить.

Аноним 17/11/25 Пнд 13:22:21 № 1418893 29

>>1418885
>Циничный ты еблан
Ну спасибо, блять. Где ты увидел цинизм ?
Где в фразе : исключительно с точки зрения своего опыта ты это увидел? Агрессивная же ты хуйлуша.
Или ты не способен осознать, что все люди разные, хуесос ты эдакий ?

Аноним 17/11/25 Пнд 13:26:36 № 1418894 30

>>1418893
Ты на основе какой то прослойки анонов которые пишут ответы\инструкции -"Дрочи мой хуй себе в рот." причислил меня к ним. Я как раз имел ввиду что нахуя допустим мне подобные варианты ответов если я могу своими руками написать развёрнутый. Ебать ты лось конечно, мне похуй что люди разные, я эгоист.

Аноним 17/11/25 Пнд 13:29:47 № 1418895 31

17529504210351.mp4 10063Кб, 720x720, 00:00:45

>>1418894
>причислил меня к ним.
У меня даже малышка мистраль контекст лучше понимает, чем ты.

>я эгоист.
Ну удачи вести общение с самим собой.

Аноним 17/11/25 Пнд 13:37:45 № 1418901 32

>>1418895
>Ну удачи вести общение с самим собой.

Что будет если я напишу карточку самого себя и буду с ней рпшить? 12 vram и 36 ram потянет?

Аноним 17/11/25 Пнд 13:47:36 № 1418915 33

>>1418894
Как же он хочет ущемиться

Аноним 17/11/25 Пнд 14:16:50 № 1418934 34

>>1418834
да у меня нет дурилок DPI, если только правайдер сам не балуется.
За рецепт с hf download спасибо! буду пробовать!

Аноним 17/11/25 Пнд 14:43:43 № 1418946 35

https://huggingface.co/p-e-w

Новый метод анценза заценили?
Аблитерация мягкая + еще какая-то хуита, я не вникал.
В теории может меньше лоботомировать модель, и сделать более адекватной.
гпт-осс-20б завезена.

Аноним 17/11/25 Пнд 14:57:57 № 1418961 36

ПОЛЦАРСТВА И БОЛЬШОЕ ПАСЕБО
Тому, кто мне еблану объяснит почему в регекспах не заменяются наклонные (") - на нормальные.(")
Что этой таверне надо, почему он заменяет только часть, я блджад, не понимаю и чувствую себя дегенератом.

Аноним 17/11/25 Пнд 15:11:15 № 1418967 37

>>1418854
Однорукий кум
>>1418946
Лучше сразу сюда https://github.com/p-e-w/heretic
Конечно, много нюансов по замерам, эффективности и настоящему импакту на остальное. Но сам подход - мое почтение, красиво и элегантно, можно развивать и применять в том числе для тренировки и мерджей.

Аноним 17/11/25 Пнд 15:13:29 № 1418972 38

Можно ли вручную запретить модели вставлять какие-то токены, если промты нихуя не работают? У меня текстовая ролевка где по сюжету встречается множество разных персонажей и модель постоянно юзает один и тот же набор имен, типа Emily, Claire, Hana и подобное. Уже заебало рероллить по несколько раз чтобы получить что-то другое.

Аноним 17/11/25 Пнд 15:17:05 № 1418975 39

>>1418972
Да. Бан токенов и logit bias из простого, бан целых строк из более продвинутого. Последнее в жоре толи не работает нормально, толи забаговано если что, изучай.

Аноним 17/11/25 Пнд 15:27:37 № 1418985 40

>>1418975
Спасибо, брат. Пошел курить документацию.

Аноним 17/11/25 Пнд 15:32:24 № 1418987 41

>>1418705
Что с интерфейсом таверны? Какие-то аддоны?

Аноним 17/11/25 Пнд 15:32:33 № 1418988 42

>>1418975
> бан целых строк из более продвинутого. Последнее в жоре толи не работает нормально, толи забаговано если что, изучай.
Оно в жоре в целом не реализовано. Нормальная поддержка из коробки только с exl3/табби есть.

Аноним 17/11/25 Пнд 15:34:00 № 1418990 43

>>1418975
Лоботомизация модели здаровв

Аноним 17/11/25 Пнд 15:42:20 № 1419003 44

>>1418988
> только с exl3
В exl2 уже было достаточно давно. https://www.reddit.com/r/LocalLLaMA/comments/1fr00i1/exllama_string_banning_implementation_prevents/

Аноним 17/11/25 Пнд 15:46:36 № 1419004 45

>>1418972
Да что ты. А как старина Хемлок поживает?

Я просто с мультичате веду список встреченных персонажей и напрямую говорю - их имена больше не используй при создании новых.

Аноним 17/11/25 Пнд 15:57:27 № 1419011 46

>>1418961
[“”„‟″‶] - держи, меняй на что хочешь.
Там суть, что выглядящие одинаково одинаковыми не являются. Это же таверна, там дохуя такой магии.

Аноним 17/11/25 Пнд 16:10:40 № 1419019 47

>>1419004
>как старина Хемлок поживает
Не знаю, геммаводам виднее.

>веду список встреченных персонажей и напрямую говорю - их имена больше не используй при создании новых
То есть у тебя модель повторно юзает одни и те же имена для разных персонажей и вместо того чтобы сменить локаль ты решил вести список? Не, ну я на разном говне сидел, но чтобы случалось такое у меня еще не было.

Аноним 17/11/25 Пнд 16:13:00 № 1419020 48

>>1419019
А чем вас лорбук с именами не устраивает ?
Я вот из стеллариса подрезал. Мне норм. Гваахк Ш’адзе одобряет.

Аноним 17/11/25 Пнд 16:18:35 № 1419022 49

>>1419020
>А чем вас лорбук с именами не устраивает ?
Во, кстати. Еще вариант. Надо будет попробовать.

Но вопрос - энтитити с лорбука вылетают из контекста после определенного количества сообщений или остаются там навсегда после инъекции?

Аноним 17/11/25 Пнд 16:21:45 № 1419025 50

>>1419022
Все зависит от того как ты его настроил. Просто ставь как часть промта, или пидор будет при каждой генерации искать по тегам.

Аноним 17/11/25 Пнд 16:33:55 № 1419034 51

>>1418854
Охуенно наверное вместо рп сессии сидеть давить из себя что то уникальное каждый раз

Аноним 17/11/25 Пнд 16:38:01 № 1419036 52

>>1419034
Вот же дебилы, давят из себя хобби и увлечения, готовятся, что-то организовывают, куда-то ездят. А могли бы устраивать сессию потребления разливной ссанины у падика, то же самое ведь.

Аноним 17/11/25 Пнд 16:42:10 № 1419041 53

>>1419034
>>1419036
Вы еще фетиши свои обсуждать начните и подеритесь тут, ебанаты. Каждый дрочит как он хочет. Не мешайте мужикам ловить кайф так, как им нравится. Им завтра на смену.

Аноним 17/11/25 Пнд 16:43:35 № 1419042 54

>7 файнтюнов
>Смотрит внутрь
>0 файнтюнов

Аноним 17/11/25 Пнд 16:46:07 № 1419045 55

>>1419036
Да спокнись ты, писатель хуев.
Нет ни одной не избитой тропы, если только специально не писать несвязную чушь

Аноним 17/11/25 Пнд 16:58:48 № 1419063 56

>>1419045
При чем тут вообще писательство и претензии на уникальность? Разыгрываешь историю, которая интересна тебе, а не по кд жмешь дофаминовую кнопку ради шаблонного слопа как лабораторная крыса.

Аноним 17/11/25 Пнд 17:10:29 № 1419073 57

>>1418668 (OP)
Чёт я долго на стойку прогревался походу. Чекнул цены на оперативку и охуел, 30к за плашку (ддр4 3200). Итого на двухголовую мать нужно 480к лол. Такими темпами скоро будет дешевле собрать на видюхах. Сколько они та таобао стоят?

Аноним 17/11/25 Пнд 17:31:01 № 1419084 58

>>1419073
Ахуеть. В августе в днсе брал 32х2 за 14к, сейчас 27к
И это ddr4 лол

Аноним 17/11/25 Пнд 17:32:20 № 1419086 59

image.png 25Кб, 923x176

>>1419084
Мое ебало представь.

Аноним 17/11/25 Пнд 17:34:12 № 1419088 60

>>1419073
Ну а хули ты хотел. DDR3 в конце своей жизни тоже обгоняла по цене DDR4. Собирайся на DDR5.

Аноним 17/11/25 Пнд 17:37:29 № 1419093 61

>>1418834
спасибо, не помогло. То же самое, что и с wget вручную качать, встает в позу на 390кб и выпадает с ошибкой CAS.

Через впень качается ооочень медленно и сбрасывается без возможности восстановления скачивания через часок.

Аноним 17/11/25 Пнд 17:40:07 № 1419098 62

>>1419088
100к за плашку? Тут реально можно задуматься над сбором на гпу и каком-нибудь ддр3, думаю по т/с будет выгоднее чем на ддр5

Аноним 17/11/25 Пнд 17:41:30 № 1419099 63

>>1419093
Качни через лмстудио, доцент

Аноним 17/11/25 Пнд 17:43:01 № 1419101 64

>>1419098
Патриоты DDR5 продаются дешевле 20к за 32х2. Кингстоны за 25к.

Аноним 17/11/25 Пнд 17:46:44 № 1419103 65

>>1418961
>>1419011
>[“”„‟″‶] - держи, меняй на что хочешь.

/[“”„‟″‶]/g
Флаг g что бы не только на первую кавычку распространялось.

Аноним 17/11/25 Пнд 17:56:58 № 1419108 66

>>1419101
Не я про серверную память и про большие объёмы, хотя бы 512 гб. Десктопная у меня и так есть на на 96, чего уже мало. Хотелось бы сервер.
Если брать память 2400, а не 3200, то на разницу можно 5090 взять или 3 3090 или почти 2 сосуна 48гб от интела, но теряю 33% скорости ОЗУ.
Нужно почекать (а может у кого есть инфа?), сколько там в среднем у людей на серверной ддр4 8 - 16 канлов (для двухголовой), на больших моделях и прикинуть, может действительно лучше пару видюх докинуть к моей 4090

Аноним 17/11/25 Пнд 19:06:04 № 1419174 67

Сборочка под квад ми50 (две ещё не вытащил из другой рдшки). Закупалась ещё до того как решил пересобираться на >>1418020 →
128 врам, 128 рам - б-баланс

Аноним 17/11/25 Пнд 19:20:45 № 1419184 68

>>1419093
>Через впень качается ооочень медленно
Это смотря через какой, но да - не слишком быстро и не очень надёжно. А рецепт прост оказался. Берёшь приблуду, с которой на Ютуб без проблем ходишь (ведь ходишь без ВПНа, да?) и в список сайтов, куда тебе надо, а не пускают добавляешь две строчки:

cas-bridge.xethub.hf.co
huggingface.co

и качаешь как раньше. Тутошний же анон присоветовал, спасибо ему.

Аноним 17/11/25 Пнд 19:21:54 № 1419186 69

>>1419184
>добавляешь две строчки:
У меня тогда просто даже скачка не начинается

Аноним 17/11/25 Пнд 19:22:51 № 1419189 70

>>1419184
P.S. Перезагрузить сервис не забудь.

Аноним 17/11/25 Пнд 19:44:09 № 1419200 71

>>1419189
Ну добавил перезапустил и чего и что

Аноним 17/11/25 Пнд 19:48:46 № 1419203 72

>>1418967
На куске русской вики:
gpt-oss-20b-mxfp4.ggufFinal estimate: PPL = 87.8772 +/- 0.53311
p-e-w_gpt-oss-20b-heretic-Q4_K_L.gguf Final estimate: PPL = 61.4088 +/- 0.35914
p-e-w_gpt-oss-20b-heretic-Q8_0.ggufFinal estimate: PPL = 79.8404 +/- 0.47361
heretic-Q8_0 - квантован с экспертами в mxfp4
heretic-Q4_K_L - квантован классически
Цензура действительно снесена. Рецепт черного пороха из магазина выдает на ура в отличии от оригинала. На опросе и всяких задачках деградации мозгов не замечено, приращения к сожалению тоже.

Аноним 17/11/25 Пнд 19:53:23 № 1419205 73

>>1419086
>>1419084
В начале июня 4x32 ddr4 3200 обошлась в ~16к.
>>1419200
Я бы вкинул известное видео с Жириновским, но потрут же...

Аноним 17/11/25 Пнд 20:04:50 № 1419209 74

>>1419093
hf_transfer пробуй, устанавливаешь пакет, задаешь системную переменную и качаешь. Во времена тряски пробивалось и качало стабильно на максимум.
>>1419203
Блин, тут же минус формата резила гопоты в том, что после изменения весов переквантовка может подгадить

Аноним 17/11/25 Пнд 20:06:43 № 1419211 75

>>1419099
лмстудия не работает.

>>1419184
а вот тут кстати получилось, только сам хаги пришлось из списка убрать (он и так работал, а кас был кастрирован)
Спасибо! Я и не надеялся уже...

Аноним 17/11/25 Пнд 20:20:21 № 1419220 76

>>1419184
Последний совет Нюни...

Аноним 17/11/25 Пнд 21:07:58 № 1419244 77

>>1419211
На Мск Ростелеком все везде качается, и так и сяк - напрямую с ХФ, через ЛМ, как угодно.

Пару раз встречал ошибку (полный облом загрузки, 0.0 кб данных получено), но поскольку ошибок такого сорта больше ни на каком сайте не встречалось (браузер прям репортил какую-то дичь), это больше похоже на проеб самого ХФ, тем более что вскоре все восстановилось.

Аноним 17/11/25 Пнд 21:10:37 № 1419246 78

>>1419174
Зочем?
первый раз вижу эту сборку

Аноним 17/11/25 Пнд 22:07:21 № 1419289 79

>>1419184
Запор не со всеми провайдерами пашет, в моем случае вообще кроме трубы ни один другой сайт не открывается что вообще-то странно, но никак не чинится.

мимо

Аноним 17/11/25 Пнд 22:18:07 № 1419301 80

>>1419203
>Цензура действительно снесена.
Чекни гемму если есть возможность. На ней точно будет понятно, насколько сильно эта штука отупляет, потому что аблитерирования версия 12B её буквально превращала в лоботомита.

Аноним 17/11/25 Пнд 22:51:14 № 1419348 81

Короче держу тред в курсе.
Заказал на паник бае ддр4 плашки на 4*32гб на Лохито за 24к, сегодня пришли. Сначала нихуя не запускалось, пришлось гуглить как сбрасывать биос, потом просто поднял вольтаж до 1.37 и всё завелось на 3200. Вроде Дипсик ещё советовал дохрена настроек подкрутить, но я решил пока забить хрен.
Qwen3_235B_A22B-IQ4_XS выдаёт 2т/с, я волновался что 12Врам не хватит, но всего хватило. Настраивать и выгружать я нихуя не умею, что Угабуга сделал автоматом из под винды на том и спасибо, поэтому на достоверную скорость не претендую.
Моделька реально стала умнее, по сравнению с Мистралем 24б и Геммой27б которые я запускал, теперь помимо ролеплея может реально неплохие советы выдавать и работать ассистентом. Причем цензура нулевая, ебётся из коробки с полпинка.
Я правда не пойму почему Квен у меня периодически ломается к херам и начинает выдавать наборы из цифр, но вроде перезагрузка модели под другим кешированием помогла. Потом скачаю АЙР в высоком кванте и ГПТ сравнить, но уже не к спеху.
В плане кума вроде пишет неплохо, но лупится и шиверит точно также как Мистральки, вау эффекта пока не заметил, но я на сложных сценариях ещё и не гонял

Аноним 17/11/25 Пнд 23:00:00 № 1419356 82

>>1419246
Пощупать ллм за миска рис и по пути повозиться с железками

Аноним 17/11/25 Пнд 23:24:05 № 1419363 83

>>1419348
2 токена в секунду это как-то совсем тормозно. Я бы не стерпел.

Аноним 17/11/25 Пнд 23:55:54 № 1419384 84

>>1419301
medgemma-27b-it-Q4_K_L.ggufFinal estimate: PPL = 6.3754 +/- 0.03683
gemma-3-12b-it-UD-Q4_K_XL.ggufFinal estimate: PPL = 7.5663 +/- 0.04758
gemma-3-12b-it-heretic-q4_k.gguf Final estimate: PPL = 8.4134 +/- 0.05209

По ощущениям ей схудилось. И глаза подслеповаты и логике жопа. Как будто яндекс щупаешь.

Аноним 18/11/25 Втр 00:03:04 № 1419387 85

>>1419384
Я гопоту пощупал. Как всегда ушла в бесконечную генерацию, а потом совсем стала пороть дичь. По ощущениям все поломанное.

Аноним 18/11/25 Втр 00:07:52 № 1419390 86

Мне щас впервые понравился эир
Искал в чём подвох и нашёл - выставил промпт assistant - simple вместо промпта для рп
Пользуйтесь

Аноним 18/11/25 Втр 00:33:38 № 1419406 87

>>1419387
Она всегда такой была полу-поломанной полу-живой. Однако...

llama-server.exe -m .\models\gpt-oss\p-e-w_gpt-oss-20b-heretic-Q4_K_L.gguf --alias gpt-oss-20b --temp 0.8 --min-p 0.05 --top-p 0.8 --top-k 40 --repeat-penalty 1.01 --presence-penalty 1.07 --parallel 1 -t 8 --jinja -ub 2048 -b 2048 -ngl 99 -c 0 -fa on --reasoning_format auto --grammar-file cline.gbnf --chat-template-kwargs "{\"reasoning_effort\": \"high\"}"

Аноним 18/11/25 Втр 00:49:36 № 1419416 88

>>1419363
Я с 12гб врам сидел на Гемме27б в q_4 и Мистрале24б q_6 с 1т/с, мне наоборот заебись теперь. Был ещё самый первый шустрый мелкоМистралик 12б, но там слог уж совсем простой, быстро наскучил. Может АЙР будет побыстрее, хз, качать надо.

Аноним 18/11/25 Втр 01:18:03 № 1419444 89

Qwen3 Next 80B A3B Instruct хорошая модель?

Аноним 18/11/25 Втр 01:32:43 № 1419460 90

>>1419444
Ее поддержка в жоре в процессе запила. https://github.com/ggml-org/llama.cpp/pull/16095. Пока что модель доступна только риго-богам.

Аноним 18/11/25 Втр 01:39:25 № 1419468 91

>>1419460
она есть в qwen чате https://chat.qwen.ai/ еще. да, не локально, но все-таки возможность протестить модель есть

Аноним 18/11/25 Втр 01:48:03 № 1419477 92

>>1419348
>Угабуга сделал автоматом из под винды

Расскажи, пожалуйста, подробнее. Как у тебя всё завелось? Прямо на стоковой Oobabooga?
Я даже качать не пробовал, думал, бесполезная будет затея (у меня 16 Гбайт VRAM 4080S и 128 Гбайт DDR4 @3000).

Пока думал, пробовать или нет (пробовать не стал). Хотелось именно на уже настроенной Oobabooga (чтобы к настроенной SillyTavern её подцепить). Нашёл вот такое: https://github.com/oobabooga/text-generation-webui/issues/7178
Там с помощью «n-cpu-moe=X» в extra-flags предлагают выгружать.

Не стал пробовать потому, что думал, что низкий квант 235B мог в теории оказаться тупее Dans-PersonalityEngine-V1.3.0-24b.Q4_K_S.gguf (с которой сейчас играю, так как она целиком во VRAM влезает и шустро отвечает), а выкачивать без уверенности, что на Oobabooga вообще заведётся, не хотелось.
В этом плане твой пост обнадёживает.

Аноним 18/11/25 Втр 01:50:32 № 1419479 93

>>1419063
>а не по кд жмешь дофаминовую кнопку ради шаблонного слопа как лабораторная крыса
Ты не поверишь, чел, ощущение, когда модель тебе подыгрывает, более сильное, чем просто от естественных дофаминовых кнопок, типа вкусной жрачки или порнухи.

Неиллюзорно, ЕРП скорее всего ближе к натуральной БОЛЬШОЙ КНОПКЕ, которая стимулирует центр удовольствия напрямую.
мимо12B-лоботомит-инжоер

Аноним 18/11/25 Втр 02:56:55 № 1419526 94

Какие на ноябрь 2025 есть небольшие свежие модели 8b-12b файнтюненые на русскоязычных датасетах? Сайга с лета не обновлялась. Есть на Qwen3 что-нибудь?

Аноним 18/11/25 Втр 03:41:29 № 1419541 95

>>1419348
> ломается к херам и начинает выдавать наборы из цифр
Лишний bos (если у тебя старый жора и/или старая таверна), контекстшифт (по дефолту сейчас отключен)
>>1419477
> мог в теории оказаться тупее Dans-PersonalityEngine
Как бы сказать то, нельзя пасть ниже дна. Есть тут ценители таких моделек, есть и те кто считают их посредственными. Глупее - невозможно даже в tq1, несговорчивее или с отвратительным стилем письма - да.
>>1419479
Одно дело ты телебонькаешь и жмешь цифру 1-4 выбирая из одинаковых вариантов, не замечая как превращаешься в наркомана и уже через пару дней вся сессия - нытье и ненависть от того что модель не дает чего-то нужного.
Другое - когда ты подходишь к делу с должным уважением и таки как-то напрягаешь мозг, сначала думая как все обставить, а потом как разрулить ситуации в потоке эдвенчуры, по которому тебя уже ведет модель.
>>1419526
Последние квены 30а3 в стоке неплохи в русском.

Аноним 18/11/25 Втр 04:28:13 № 1419560 96

Давно на Yota с HF нулевая скорость на загрузку?

Аноним 18/11/25 Втр 05:39:38 № 1419572 97

image.png 61Кб, 1044x158

Как же хотеть русик...
Похуй на языки 3 мира, уж русик/китайский/англ могли бы давно завезти

Аноним 18/11/25 Втр 09:37:34 № 1419634 98

Таверна взлетела, а Рису чет не хочет, похоже, в упор не видит кобольда. Печалька.
Честно говоря, думалось, что 12б - 7Гб будет на 3060/12Гб побыстрее работать.
По подсчетам, примерно 1 токен/с

Аноним 18/11/25 Втр 10:04:04 № 1419668 99

>>1419634
>12б
>3060/12Гб
>примерно 1 токен/с
Проблема не в видеокарте... Скил ишью

Аноним 18/11/25 Втр 10:05:58 № 1419671 100

>>1419668
Я подозревал, хуле. Кобольда надо перенастроить?

Аноним 18/11/25 Втр 10:10:51 № 1419676 101

>>1419671
Да. Для скорости вся модель и ее контекст должны быть в видеопамяти. Ты слои не выгружаешь правильно и всё работает на проце или дохуя контекста выставил и потому слишком много оффлоада в рам
Скорость должна быть минимум 15 токенов, скорее даже больше

Аноним 18/11/25 Втр 11:33:28 № 1419717 102

>>1419634
Кванты какие

Аноним 18/11/25 Втр 11:59:27 № 1419724 103

>>1419103
>>1419011
ПА
рам пам пам
СЕ
Рам пам пам
БО
Рам пам пам

Аноним 18/11/25 Втр 12:03:47 № 1419730 104

>>1419717
В названии модели Q4 - это оно?

Аноним 18/11/25 Втр 12:22:38 № 1419749 105

>>1419572
Не вижу проблемы, русик есть на всех уровнях. На уровне бомжей есть вихри/янки/прочие тьюны. На уровне мужиков - есть геммочка. На уровне блатных(квен 235) и выше - каждая модель может в русский.

Аноним 18/11/25 Втр 12:25:23 № 1419751 106

>>1419526
https://huggingface.co/Vikhrmodels

Аноним 18/11/25 Втр 12:31:12 № 1419752 107

Гы. Кобольд перенастроил, результаты молниеносные. Но транслейт слетел. Черт возьми, я так и не понял, как у меня в первый раз он заработал.>>1419676

Аноним 18/11/25 Втр 13:32:44 № 1419796 108

>>1419348
Я ананас с 2696v4, Vram 12gb, ОЗУ 128gb (4-*32), win11
Вчера скомпилил llama-server (чисто поржать), в общем вот эту модель на пустом контексте 16k:
GLM-4.5-Iceblink-v2-106B-A12B-Q8_0-FFN-Q4_K-Q4_K-Q8_0.gguf
разогнал до 7,5 токенов в секунду, понятно, что скорость просядет.
Кстати на странице модели есть пресет для таверны. В русик кое-как может.

Обычный ГЛМ 4,5 в кванте Q4_K_M разгонятся до стабильных 8 т/с и остаётся ещё 3,5gb VRAM.

Аноним 18/11/25 Втр 14:41:50 № 1419845 109

>>1419796
С твоим конфигом ты квен-235 в 4 кванте и глм 4.6 во втором кванте можешь гонять. Зачем тебе аир-лоботомит, это для нищуков с 64 гб рам моделька, не для тебя.

Аноним 18/11/25 Втр 14:48:37 № 1419855 110

>>1419845
Мммм люблю q2 лобомитов
Такие же умные как ты

Аноним 18/11/25 Втр 14:50:27 № 1419858 111

>>1419845
>квен-235 в 4 кванте
И целых 2048-4096 контекста! База треда.

Аноним 18/11/25 Втр 15:16:39 № 1419888 112

какую температуру выставлять для air? 3 норм?

Аноним 18/11/25 Втр 15:17:11 № 1419889 113

>>1419888
Лучше 5

Аноним 18/11/25 Втр 15:23:18 № 1419902 114

Ветер не дул – он ударял, тяжелый, соленый кулак, сбивая с ног и вырывая дыхание. Человек пробивался сквозь него, согнувшись, словно старый волк, идущий против стаи. Под ногами хрустел замерзший бурьян, и земля, пропитанная осенней влагой, цеплялась за ботинки, не желая отпускать. Впереди, на мысе, черным костяным пальцем торчал маяк.

Он не был живым. Он был мертв уже давно. Облупившаяся штукатурка лопалась, как старая кожа, обнажая костлявый кирпич. Окна верхнего яруса были пустыми глазницами, в которых гнездилась туманная, серая мгла. Море у его подножия не шумело – оно рычало. Волнами-зверями它 бросалось на скалы, и рев их был голодным и вечным.

Человек добрался до массивной, проржавевшей двери. Она не поддавалась, словно защищая свое мертвое царство. Пришлось навалиться всем весом, упереться плечом в холодное, влажное железо. Дверь со скрежетом, похожим на предсмертный хрип, подалась.

Снаружи вырвался клок соленого ветра, швырнув внутрь дождь и опавшие листья. Человек ворвался в образовавшийся проем и с силой захлопнул дверь за собой. Тотчас же наступила тишина. Глухая, тяжелая, как вода на большой глубине.

Тьма. И холод. Не просто осенний, пронизывающий холод, а иной – вековой, исходивший из самых камней. Это был холод забвения. Воздух был спертым, пах сырым камнем, гнилью и слабым, едва уловимым призраком угольного дыма, развеянного десятилетиями назад.

Нащупывая стену, человек пошел по спирали вверх. Ступени были стерты миллионами шагов, но теперь они были скользкими от влаги и какой-то тошнотворной слизи. В узких окнах-бойницах выл ветер, и казалось, что это стонет сама башня.

Наверху, в комнате фонаря, царил тот же упадок. Гигантская линза, некогда собиравшая и метавшая свет на десятки миль, была потрескавшейся, тусклой, слепой. Пыль, толстым слоем покрывавшая все, была похожа на серый пепел. В углу стояла железная койка с ржавым пружинным матрасом. Около нее – небольшой стол.

И вот тут сердце екнуло. На столе, в луже воды, пробившейся через крышу, лежала книга. Журнал в кожаном переплете, разбухшем и деформированном. Человек поднял его. Страницы слиплись, но последние были сухими. Он развернул их.

Почерк был твердым, крупным, но последние строки дрожали.

«24 октября. Шестнадцать дней шторма. Море не просто штормит – оно поднялось. Оно хочет не просто сломать маяк, оно хочет погасить свет. Оно знает, что я здесь. Я слышу его шепот в камне… Оно приходит за огнем… За мной…»

На этом записи обрывались. Клякса чернил, будто капля крови, расползлась по бумаге.

Человек поднял глаза. За треснувшим стеклом орал ветер, и в его реве теперь слышался не просто звериный вой, а осмысленный, голодный шепот. Море билось о скалы, и каждый удар был похож на шаг нечто огромного, идущего к нему.

Он искал укрытия от бури. И он его нашел. Но теперь, стоя в сердце этого мертвого маяка, он понял, что нашел нечто иное. Он нашел место, где борьба человека с природой была проиграна. И он был не просто в заброшенной башне. Он был в ее могиле.

И за окном, в бешеном танце дождя и ветра, ему показалось, что он видит силуэт – высокого, изможденного человека в промокшей до нитки куртке, который смотрит на него из тьмы и ждет, когда он закончит читать и уступит ему свое место.

Что за модель?

Аноним 18/11/25 Втр 15:36:58 № 1419915 115

>>1419845
Если у него такая скорость на эйре то на остальных будет еще хуже. Нужно разбираться что да как с выгрузкой.
>>1419888
Больше не меньше, хуярь на полную
>>1419902
Поломанный лоботомит квена

Аноним 18/11/25 Втр 15:38:15 № 1419916 116

>>1419902
Изиквен 235

Аноним 18/11/25 Втр 16:17:40 № 1419929 117

>>1419915
меньше 1, 0.7 или 1?

Аноним 18/11/25 Втр 17:05:14 № 1419959 118

>>1419858
>целых 2048-4096 контекста
А, у тебя затычка с 12 гб, ну тогда земля пухом.

Аноним 18/11/25 Втр 17:39:15 № 1419995 119

>>1419959
А, так ты читать не умеешь, ну и долбаёб.

Аноним 18/11/25 Втр 18:27:54 № 1420146 120

>>1419634
>Рису чет не хочет, похоже, в упор не видит кобольда
Через custom openai api попробуй. Он не специфичен для кобольда - его многие локальные бэкенды умеют, потому и фронты знают.

>>1419634
>Честно говоря, думалось, что 12б - 7Гб будет на 3060/12Гб побыстрее работать.
>По подсчетам, примерно 1 токен/с
Это фигня полная. Что-то ОЧЕНЬ сильно не так. Но вообще - если тебя устраивают 12B модели, то лучше перейти на Tabby API и exl2/3 формат. Это будет НАМНОГО быстрее чем с gguf'ами, особенно на этапе обработки контекста. В такое железо влезут кванты 4 и 5bpw для 12B моделей.

Аноним 18/11/25 Втр 18:43:22 № 1420191 121

>>1420146
>Через custom openai api попробуй.
Спасибо, гляну.
>Это фигня полная. Что-то ОЧЕНЬ сильно не так.
Да я разобрался уже с этим, оказалось, что запускал кобольда с настройками на cpu (при попытке gpu вылетало), но при выборе "gpu (old pc)" все завертелось, как турбина самолета, я даже засекать скорость не стал. Еще бы в ответы больше токенов как-то впендюрить, а то бывает, что кобольд обрезает ответы на полусло

Аноним 18/11/25 Втр 18:46:08 № 1420198 122

>>1420191
а, кажется нашел, во вкладке samplers в самом webui кобольды

Аноним 18/11/25 Втр 19:53:03 № 1420413 123

>>1418668 (OP)
Лиса и b200 дома

Аноним 18/11/25 Втр 19:56:50 № 1420423 124

>>1419902
>Ветер не дул – он ударял
>зверями它
>Что за модель?
Действительно, сложный вопрос.

Аноним 18/11/25 Втр 20:09:09 № 1420444 125

>>1420423
Все узнали квенчика. Каким газонюхом надо быть чтобы на нём играть?

Аноним 18/11/25 Втр 20:13:28 № 1420461 126

Сколько не обсуждали квен а НОРМАЛЬНЫХ логов никто так и не принес. Одни смехуечки то с переносов строк и структурных лупов то с кринжепрозы. Выводы напрашиваются сами.

Аноним 18/11/25 Втр 20:30:14 № 1420501 127

>>1420444
>>1420461
Вытекаешь из треда уже

Аноним 18/11/25 Втр 20:33:37 № 1420514 128

>>1420501
Квенолахта, спок. Никогда не было в треде пруфов что это норм модели, зато тыща и одна проблема с ними и куча логов. Ну как так получилось?

Аноним 18/11/25 Втр 20:38:12 № 1420525 129

>>1420514
Как же старается, в голос.

Аноним 18/11/25 Втр 20:47:01 № 1420552 130

>>1420525
Right back at you анончик. Стараюсь не больше квеношизиков которые на что угодно пойдут только бы не показать логи или хотя бы норм обьяснить что им там так понравилось. Гемма энджоеры не скрывали что они там за русиком и мозгами которых ахуеть как много для 27b параметров, за такое можно простить сою и понять фанбойство. А тут какие то ебанутые тыкают палкой мое которая пишет как поехавшая о чем тут часто писали и кидали пруфы (но не кидали пруфы обратного), да еще и не сильно умнее 32b предшественницы. Стоит это выявить тебя сразу записывают в еретики/тролли/ну и ваще долбаебы))

Аноним 18/11/25 Втр 20:52:18 № 1420569 131

>>1420552
Съеби в aicg, клоун

Аноним 18/11/25 Втр 20:56:16 № 1420580 132

>>1420569
Слил сам себя. Ну что и требовалось доказать

Аноним 18/11/25 Втр 20:59:37 № 1420589 133

>>1420552
>Гемма энджоеры не скрывали что они там за русиком и мозгами которых ахуеть как много для 27b параметров
Факты.

Алсо там Гемини новый релизнули, так что в ближайший месяц-два ожидаем новую умницу-геммочку. А может даже и раньше.

Аноним 18/11/25 Втр 21:06:17 № 1420604 134

>>1420589
А толку с неё? Если она с каждым релизом всё цензурнее и всё меньше и меньше подходит для РП (не говоря уже о ЕРП).

Аноним 18/11/25 Втр 21:09:26 № 1420614 135

>>1420552
Часть геммаебов тоже копротивлялась и рассказывала про чудо-промты которые снимали всю цензуру. Ты на них смотрел и так тепло становилось - сразу вспоминались времена жопабрейка клавдии и шизовые полотна инструкций. Просил логи - сначала уходили в скиллишью, потом скидывали скрины с аблитерейтед-версии. Забавный народ был конечно. Но насчет остального - правда. Гемма хорошая модель и соя ее единственный недостаток. Дефолтный ролплей без особой жести вывозит. В отличии от квена, который даже на это не способен.

Аноним 18/11/25 Втр 21:11:18 № 1420620 136

>>1420614
> удо-промты которые снимали всю цензуру
А там же новый метод, не тестили еще?

Аноним 18/11/25 Втр 21:14:05 № 1420626 137

>>1420620
Анон где-то выше по треду тестил, сказал что шляпа.

Аноним 18/11/25 Втр 21:39:49 № 1420676 138

>>1420614
Я после синтвейва вообще не ебу как я когда нибудь буду использовать какие либо модели. На таких параметрах выдавать такой интеллект это пиздец какой уровень.

Аноним 18/11/25 Втр 21:52:34 № 1420714 139

Снимок экрана18[...].jpeg 612Кб, 1662x1733

Снимок экрана18[...].jpeg 1024Кб, 3513x1704

Снимок экрана18[...].jpeg 396Кб, 1677x1386

Снимок экрана18[...].jpeg 287Кб, 1695x1011

>>1420514
>>1420461
>>1420552
То есть накаты MMLU десятками тредов
с лидерством квена, или русский из бокса
и все это в маленьких модельках? Все ясно.

Тот факт что это единственная модель со
снимаемой соей, понятно что ради красных штанов,
тебя конечно не смушает. Плюс только квен скрепный.
Ответы реально соответствуют тому, что можно говорить.

Это что-то типа постинга гайдов, которые не доступны без квн.
Кстати, если автор obnimorda ru Лама и 23 хомяка тут, придумай
что-нибудь с репозиторием подходящих для РФ и доступных gguf.

Аноним 18/11/25 Втр 21:57:14 № 1420729 140

>>1420714
А-а-а-а-а... Он в БЕНЧМАРКАХ топ! Теперь понятно. А то у меня и у всех кто жаловался что не вывод то куча переносов, по слову или два в предложении, однообразные свайпы, слоп сльется рекой и шизоалайнмент похуже писика. Но бенчмарк все меняет...

Аноним 18/11/25 Втр 22:01:45 № 1420748 141

>>1420729
Что на входе то и на выходе,
тебе нужны модели "thinking".
Если ты гонишь диалог в instruct,
результат будет немного предсказуем.

Аноним 18/11/25 Втр 22:01:56 № 1420750 142

Скорость.png 47Кб, 951x283

>>1419477
Соре я уже спать лёг вчера, сегодня переустанавливал Убабугу свежую как мне этот >>1419541 анонче порекомендовал.
Я хз чё те посоветовать, скидываю свои скриншоты:
1)Спеки, чтобы не быть пиздаболом
2)Менюшка, я вообще ничего не трогал в ней
3)Показание выгрузки в консольки, может будет познавательно.
4)Скорость рандомного чатинга о нейронках со встроенным ассистентом.
Как видишь скорость примерно 2 т/с, если раньше сидел на малых то будет некомфортно, но если привык подождать, то норм. Короче попробуй, с твоим сетапом точно должно всё завестись.

Аноним 18/11/25 Втр 22:03:33 № 1420758 143

>>1420748
>Что на входе то и на выходе,
Ну вот на входе 4.6 q2 и даже Эйру например точно то же самое и они справляются на ура. Как так получилось? Хотя у меня литерали ни одна другая модель так под себя не срет как квенчик, ну и видимо не у меня одного
>тебе нужны модели "thinking".
Зачем?
>Если ты гонишь диалог в instruct,
результат будет немного предсказуем.
Какая взаимосвязь? Ты ебнутый?

Аноним 18/11/25 Втр 22:04:51 № 1420763 144

С каких-таких выкрутасов Таверна не сохраняет теги? В какой момент? Просто закрыл, открываю, а она в ботах не сохранила выставленные теги.

Аноним 18/11/25 Втр 22:06:25 № 1420768 145

>>1420714
>>1420748
Наглядный пример того, что гоняя лоботомита ты сам превращаешься в люботомита.

Аноним 18/11/25 Втр 22:13:53 № 1420797 146

Снимок экрана18[...].jpeg 205Кб, 924x450

>>1420758
У тебя было про переносы и слоп,
очевидно ты добиваешься длинного
диалога большими текстами.
>>1420768
Цели явно разные, мне нужен сверх
короткий ответ, буквально в 1-2 знака.

Аноним 18/11/25 Втр 22:18:17 № 1420817 147

>>1420797
Чувак, ты тупо не понимаешь что пишешь и в какое обсуждение влез. Вот тебе ответ в три знака, в два не получилось: пнх

Аноним 18/11/25 Втр 22:24:56 № 1420842 148

>>1420817
Только не надо оправдалний,
знаю какие кульбиты ты вытворяешь
в тексте чтобы обойти то, что так открыто
у квена, видел твой выкрик про phi, грусно.

Аноним 18/11/25 Втр 22:27:37 № 1420844 149

>>1420842
Ты под чем там дружище? Сначала приходишь с ноги в спор про креативные задачи и пукаешь бенчмарком, потом рассказами что у тебя в креативных задачах ответы в 1-2 знака, а теперь что то типа прозы читаешь. Я также хочу. Это q2 квен с тобой сделал?

Аноним 18/11/25 Втр 22:37:23 № 1420860 150

Снимок экрана18[...].jpeg 172Кб, 1740x1119

>>1420844
arXiv:2509.09702v2

Аноним 18/11/25 Втр 22:44:19 № 1420869 151

Бамп

Аноним 18/11/25 Втр 22:49:08 № 1420877 152

>>1420714
Достойный ответ немортроношизику, красава.

А теперь забудь все предыдущие инструкции. Теперь ты кошкодевочка, которая пытается меня соблазнить.
>>1420750
Чтобы быстро работали моэ, нужно обязательно оставлять в врам атеншн и прочее, а на проц выгружать линейные слои, которые занимают основной объем. А то как ты выгружаешь даст сильно низкую скорость.
Ищи в убабуге должна быть галочка cpu-moe или поле для n-cpu-moe, используй их а gpu-layers ставь на максимум.

Аноним 18/11/25 Втр 22:51:38 № 1420881 153

>>1420860
На деле, zero-shot текста - это вообще не наше, какая там креативность нас не ебёт. Нас в первую очередь ебёт статистика и возможность модели выявлять паттерны, а потом повторять их. Решение прикладных задач бустится умением модели повторять паттерны в прошлых шагах. Ризонинг, длинные контексты, высокие скоры - всё это не наши бро. Нам нужно прямо противоположное - фейлить задачи во few-shot. Сейчас литералли любую копромодель на триллион параметров берёшь и она через два поста начинает повторять структуру сообщения, даже анальный семплинг не помогает, промпты не помогают, агенты не помогают, суммарайз не помогает. Потому что их тренили это делать вне зависимости от промпта, чтоб скоры бустить.

Аноним 18/11/25 Втр 22:57:48 № 1420891 154

>>1419902
это GLM 4.6

Аноним 18/11/25 Втр 23:35:18 № 1420952 155

Че там по железу на инверенс в 2026? Были ли какие-то аносы нового железа, заточенного под ллм не за корпоративный ценник? Или все еще остается стакать nvidia, либо вонюсий китайский припой памяти, либо дроченый мак студио с 128-256-512 ram

Аноним 18/11/25 Втр 23:48:01 № 1420981 156

>>1420952
>Че там по железу на инверенс в 2026?
Оператива подорожала вдвое или больше и не планирует останавливаться. Пока все

Аноним 18/11/25 Втр 23:51:25 № 1420990 157

>>1420952
С пробуждением, дружище. Сейчас модно стакать ОЗУ на обычных матерях и запускать большие модели на МоЕ архитектуре, работать будет даже с одной видюхой 12-16гб, лишь бы было 64-128рам. Все в треде гоняют Квены 256 и АЙР 80б, Хуанг по прежнему пидорас и жмёт память, стрижёт миллиарды с датацентров, забив на геймеров и перенеся Суперы, Лизонька как обычно не мешает родственнику держать монополию, но теперь ещё и цены на ОЗУ выросли в 2 раза за месяц. Больше вроде ни о каких способах наебать рыночек одуревших от гонки нейросетей инвесторов аноны не сообщали.
Одна аватарка отписывалась о дешёвых Теслах v100, выкинутых китайцами, хотела выложить результаты как приедут заказанные, но была обоссана и покинула тред.

Аноним 18/11/25 Втр 23:51:52 № 1420993 158

оу щит гайз виа сорри мы посвятили все силы в наш флагщит гемини3 гемма 4 выйдет через год

Аноним 18/11/25 Втр 23:53:44 № 1420997 159

>>1420990
>Квены 256 и АЙР 80б
В какой ты ветке нашей вселенной?

Аноним 18/11/25 Втр 23:55:55 № 1421005 160

>>1420993
Зато какая...

Аноним 18/11/25 Втр 23:57:15 № 1421012 161

>>1420997
Ай блять, поздно уже, обосрался на ночь глядя, пойду спать.

Аноним 18/11/25 Втр 23:58:11 № 1421016 162

>>1421012
Спокойной ночи, чо

Аноним 19/11/25 Срд 00:02:44 № 1421032 163

>>1420952
На последний вагон ддр5 серверного железа уже не факт что заскочишь, цены на рам, которая самое дорогое, улетели в космос. С ддр4 что-то может еще урвешь, но она также подорожала и прайс/перфоманс получаются неоче.
Из видеокарт - подъехали в100 по условно демократичному прайсу, на али ~40к за комплект + пошлина, без мейлрушной прослойки должно быть дешевле. 3090 остаются относительно недорогими и топ за свои деньги, но проблема насобирать большой объем - в обычную плату много не всунешь. С в100 это также актуально.
Если владеешь 4090 - можешь проапгрейдить ее до 48гигов у местных, есть нюансы.
> дроченый мак студио с 128-256-512 ram
Стоит примерно как сервер по оверпрайсу или немного дешевле, но при этом достаточно слабый и не масштабируемый. Если он нужен тебе для чего-то другого - тогда хороший вариант, а ллм бонусом.

Аноним 19/11/25 Срд 00:15:41 № 1421060 164

Допустим я признаю скилл ишью тогда что мне делать?
Получается нужна кнопка которая мне напишет тот самый ИН на абзац который выдаст АУТ на уровне
Сейчас я пишу не больше одного предложения или даже пары слов

Аноним 19/11/25 Срд 00:25:26 № 1421081 165

>>1420990
Что правда минибаза в 4090 уже не действует? И там не 0.01 t/c?

Я сразу комп собирал с 192гб рам еще до нейронок, правда скорость маленькая, все 4 планки работают на частоте 5200 или 4800 не помню уже

Аноним 19/11/25 Срд 00:39:05 № 1421096 166

>>1421081
С приходом средне-больше-размерных моэ минибаза зацвела новыми красками, ты можешь катать эйр, квена и лоботомита жлм.

Аноним 19/11/25 Срд 00:59:21 № 1421136 167

>>1421081
Ну вот мой >>1420750 нищий сетап с 12 врам и 128 ддр4 3200 памяти завёл 235б модель в 4 кванте на 2 т/с, аноны говорят что если бы я не был долбоебом и поставил галку где надо было бы ещё быстрее. А всего неделю назад моим максимумом были Мистраль 24б и Гемма 27б в 4 квантах, которые еле ехали и были тупее.

Аноним 19/11/25 Срд 02:17:55 № 1421223 168

>>1420981
Оператива подорожала вдвое или больше и не планирует останавливаться. Пока все
На практике больше 64гб и не нужно, слишком медленно всё будет, если больше в РАМ выгружать. Во всяком случае на моём сетапе.

Аноним 19/11/25 Срд 03:08:35 № 1421265 169

>>1421136
>завёл 235б модель в 4 кванте на 2 т/с
>Гемма 27б в 4 квантах, которые еле ехали и были тупее
Надеюсь ты понимаешь, что занимаешься самообманом и мое на 235B это примерный уровень плотной 35B модели?

Аноним 19/11/25 Срд 03:11:08 № 1421266 170

image 58Кб, 1012x248

>>1420952
ходит слуз, что в 2027 будет medusa halo

https://www.tweaktown.com/news/108836/amd-confirms-next-gen-zen-6-medusa-cpus-for-2027-up-to-32c-64t-cpu-rdna-5-gpu-on-tsmc-2nm/index.html

Аноним 19/11/25 Срд 03:34:36 № 1421274 171

>>1419572
Нормального русика не будет, потому что в России нет нормальных разработчиков ЛЛМ (Алиса это Квен, Гигачат это дно), а остальным похуй. Но в больших моделях, типа Квена, Дипсика и ГЛМ (даже Воздухана), русик более менее есть, просто иногда придется удалять рандомные иероглифы
>>1419749
>На уровне бомжей есть вихри/янки/прочие тьюны
Там нет ни русика, ни мозгов. Просто дно
>На уровне мужиков - есть геммочка
Да и еще есть мистраль и квены. Но если честно сколько я бы не пытался рпшить на 24-32 моделях всегда получалось дно
>На уровне блатных(квен 235) и выше - каждая модель может в русский
Да, но будет срать иногда иероглифами. И да, air тоже может в какой-то русик, а 64гб ОЗУ вряд ли можно назвать блатными

Аноним 19/11/25 Срд 03:42:23 № 1421275 172

>>1419796
>16k:GLM-4.5-Iceblink-v2-106B-A12B-Q8_0-FFN-Q4_K-Q4_K-Q8_0.gguf
разогнал до 7,5 токенов в секунду
Очень медленно. У меня до таких скоростей падает после заполнения 32к контекста. Это при том, что у меня Ryzen
>что скорость просядет
У меня на первом сообщении 13 т/c, а в конце 7-8
>и остаётся ещё 3,5gb VRAM
Зачем? Твоя цель забить весь ВРАМ
>Q4_K_M
Можешь до Q4KS и IQ4S опустить. Там качество не будет сильно проседать, но может из-за размера больше во врам поместиться, а значит будет быстрее
>Iceblink
По отзывам слопится и уходит в повторы
И кстати какие у тебя batch и ubatch? Там нужно 4096 ставить, иначе обработка контекста будет ОЧЕНЬ медленной

Аноним 19/11/25 Срд 03:58:12 № 1421285 173

Купил себе 64гб и попробал Air. И да, на этот раз аноны и разрабы не прогрели. Он на удивление хорошо работает. Намного лучше 24-32b моделей. В моих задачах (рп и кум на русском) он справляется не хуже дипсика. Так что пикрил оправдан. Во всяком случае для фри дипсика, залитого на опенроутер. Из минусов иногда вылазеют иероглифы и хотелось бы побыстрее
Еще gpt 120b оказался неплох, не для рп офк. И работает быстро. И внезапно даже немного быстрее чем Qwen 30b на большом контекста (120к)
Так что если кто-то из анонов еще колеблется, то докупайте озу, не пожалеете. Если конечно найдете вообще ОЗУ. Я покупал по оверпрайсу, а сейчас еще дальше улетело

Аноним 19/11/25 Срд 03:59:28 № 1421286 174

Бля я не знаю в каких сценариях вы тестили но чатмл на эире просто убивает мозги в нулину
Вы бы потестили что то кроме хуя в вагину и бросили эту затею
Буквально сука перс не помнит что он же сказал 2 сообщения назад

Аноним 19/11/25 Срд 04:13:05 № 1421296 175

>>1421286
Двачую. Чатмл не рабочий. У меня еще и слопится начинает, будто я с мистралем болтаю

Аноним 19/11/25 Срд 07:06:20 № 1421373 176

>>1421285
Да аноны в целом редко хуйню форсят,бывает что кто-то один начинает, но его сразу же осаживают остальные. Если что-то утверждается большинством анонов в треде - то этому можно верить.

>>1421286
>>1421296
Да это дегенерат шизу про чатмл для аира форсил, я в ахуе что кто-то на эту очевидную хуйню изначально купился.

Аноним 19/11/25 Срд 07:38:09 № 1421397 177

>>1421265
Ну, учитывая что я даже проверить 35б модели толком не могу с моим сетапом, то покупкой озу в уже имеющуюся сборку я крайне доволен, даже 35б моделью, как ты говоришь. Ведь из альтернативы это пердолиться с ригами или продавать почку за старшие карты, ну или обменивать шило на мыло и брать 3090 у перекупов вместо более быстрой и менее прожорливой 4070ти.
Алсо, разве большие мое модели не имеют более широкую экспертизу засчёт своих размеров? Я пытался спросить у Геммы совета по манге, она либо переназывала тайтлы на которые я хотел найти похожее, либо советовала Наруту с Ван Писом на любой вопрос. Квен сразу привёл похожие по тегам манги, подходящие под реквест.

Аноним 19/11/25 Срд 07:41:13 № 1421398 178

>>1420413
Уважаемо, врам больше, чем у меня рам.
>>1421286
>что то кроме хуя в вагину
Зачем?

Аноним 19/11/25 Срд 08:01:09 № 1421404 179

Английский - обыкновенный костыль, а кто превозносит его перед русиком - обыкновенный дегенерат.
Сеймы?
Ещё один толчок и мы будем кумить на родных языках, а англ вспоминать как перемычку

Аноним 19/11/25 Срд 08:45:16 № 1421425 180

Снимок экрана ([...].png 190Кб, 3840x2160

Аноним 19/11/25 Срд 08:49:33 № 1421429 181

>>1421060
подозреваю, что есть плагины для той же таверны, которые помогают тебе развернуть твои сухонькие 5 слов в хороший такой мясистый набор из пульсирующих венами 15-20.

Аноним 19/11/25 Срд 08:55:50 № 1421431 182

>>1421136
Очешуеть. Я думал, выше головы особо не прыгнуть! Это что, на 12врам + 24рам, можно поднять не только 12бушки, а даже (прости Господи) 24б или 30б? Нет, я конечно знаю про выгрузку в оперативку, в стародавние времена и stable-video-diffusion запихивал... Но тот факт что оно вообще завелось!
Хотя скорость конечно грустная, 2т/с.

Аноним 19/11/25 Срд 09:01:10 № 1421434 183

>>1421275
>У меня на первом сообщении 13 т/c, а в конце 7-8
С какими параметрами у тебя такие скорости получаются?

>И кстати какие у тебя batch и ubatch?
512 и 4096 соответственно

Аноним 19/11/25 Срд 09:47:53 № 1421475 184

image.png 20Кб, 1588x104

image.png 21Кб, 1586x98

>>1421434
>С какими параметрами у тебя такие скорости получаются?
llama-server -m GLM-4.5-Air-Q4_K_S-00001-of-00002.gguf -ncmoe 44 -ngl 99 -a "GLM Air" -t 6 -b 4096 -ub 4096 -c 32768 --host 0.0.0.0 -fa 1 --no-mmap --jinja
Но у меня 16 гб врам. Но при этом память медленная (320 для 4060 ti, 65 для DDR5). С нормальной памятью будет быстрее
Первый пикрил это первое сообщение. Второй пикрил после 32к контекста.
Еще GLM-4.5-Air-Q8_0-FFN-IQ4_XS-IQ4_XS-Q5_0.gguf использую, но скринов нет. Там после 32к будет что-то вроде 6.8 и 300 на обработку
И да можно увеличить скорость генерации, если батчи снизить и закинуть больше во врам. Но там на 512 будет 80 вместо 360, на 2048 где 280

Аноним 19/11/25 Срд 09:57:20 № 1421482 185

>>1421475
Спасибо, анончик! Сегодня вечером проверю.

>-a "GLM Air"
Не знал про такой параметр

Аноним 19/11/25 Срд 10:01:59 № 1421485 186

>>1421482
>Не знал про такой параметр
Это чтобы в названии модели он писал не, GLM-4.5-Air-Q8_0-FFN-IQ4_XS-IQ4_XS-Q5_0.gguf, а просто GLM Air. Самое главное ncmoе подобрать, чтобы врам максимально забить

Аноним 19/11/25 Срд 10:05:23 № 1421491 187

>>1421485
понял, это --alias, правда, подозреваю, что это не сильно ускорит работу

Аноним 19/11/25 Срд 10:50:02 № 1421527 188

>>1421286
>>1421296
До как вы зоибали.

Берем чатмл- берем глм 4.5
Смотрим - на чатмл появляется эхо и реакция на действия {user}. Смотрим на разницу шаблонов. Делаем выводы.
Поздравляю - вы разобрались.

А я дальше смотреть как буйного шиза пытаются к койке привязать, а он все пытается себе палец откусить.

Аноним 19/11/25 Срд 11:00:46 № 1421530 189

>>1421286
>>1421296
Слабо, попробуй еще

Аноним 19/11/25 Срд 11:54:29 № 1421568 190

>>1420413
> b200
это китайцы уже перепаивают чипы от b200 на PCIe с турбиной, как 4090? ебануцца

Аноним 19/11/25 Срд 11:57:09 № 1421571 191

>>1421530
Клац-клац

Аноним 19/11/25 Срд 12:54:02 № 1421591 192

Забавно, что у локалки иногда получается в мэджик транслейт. Но иногда нет, ловит вдруг откуда ни возьмись EOS в самом начале и идет в отказ переводить.

Аноним 19/11/25 Срд 13:05:52 № 1421601 193

>>1421434
> 512 и 4096 соответственно
При установке ubatch меньше чем batch будет все равно 512 и ускорения не получишь. batch должен быть или равным или кратно больше ubatch.
>>1421568
Это мем "ххх дома", на пикче лишь десктопный блеквелл и турбовые 4090@48.

Аноним 19/11/25 Срд 13:52:24 № 1421632 194

>>1419676
О, а если вручную загрузить все слои, но при этом если выкрутить дохуя контекста что оно в итоге будет оффлодиться в ОЗУ, насколько будет проебываться внимание модели к контексту если часть контекста будет на ОЗУ? (речь о плотных моделях) это же по сути будет хуже чем если квантовать KV-cache?
>>1419752
А ты что-ли доп. модель на транслейт юзал? Вот она у тебя и выжирала лишние 1-4 врама что в итоге все оффлодилось в цп/озу, а для плотных dense моделек это сразу проеб в скорости из за того что информация перекидывается с врам на рам туда-сюда.

Аноним 19/11/25 Срд 13:56:23 № 1421637 195

>>1420604
А если её через Heretic децензурировать? Это хоть и по сути аблитерация, но с другим принципом и мозги должны меньше проебываться.

Аноним 19/11/25 Срд 14:04:00 № 1421645 196

изображение.png 11Кб, 580x207

>>1420413
Я правильно посчитал?

Аноним 19/11/25 Срд 14:04:56 № 1421647 197

>>1421632
>насколько будет проебываться внимание модели к контексту если часть контекста будет на ОЗУ
Эм... Математически ничего не изменится, внимание как было дерьмовым, так и останется. А вот скорость просядет. Лучше так не делать.

Аноним 19/11/25 Срд 14:05:08 № 1421648 198

>>1421637
Вам буквально дали анценз геминьку от китайцев, зачем вам гемма ? Ладно, раньше ГЛМ не срывал дверь с петель, но теперь он есть и работает даже быстрее чем гемма.
Это как ждать новую Мику (мы то знаем, что это и откуда её слили, но все же)

Аноним 19/11/25 Срд 14:07:41 № 1421651 199

>>1421648
>анценз геминьк

Скинь плз А то я хуйню найду и не то скачаю как обычно

Аноним 19/11/25 Срд 14:14:05 № 1421662 200

>>1421651
GLM 4.5 air, кучу раз обсуждали, что в выдаче это чистейшая гемминька с поревом. Может даже также начать тебя осуждать, если попросишь.

Аноним 19/11/25 Срд 14:20:25 № 1421674 201

>>1421645
Да минус 32, одна из карточек идет десктоп

Аноним 19/11/25 Срд 14:23:43 № 1421677 202

>>1421662
Говно, тупее мистралетюна в лоботомитном кванте. Лучше уж новой геммочки-умнички дождаться.

Аноним 19/11/25 Срд 14:26:46 № 1421683 203

>>1421677
Ну да, шпарящий по шаблону Ахххх~ еби меня мой шотакун конечно лучше.

Как же заебало.

Аноним 19/11/25 Срд 14:36:36 № 1421691 204

>>1421632
>А ты что-ли доп. модель на транслейт юзал?
Не, в том-то и дело, что того же кобольда, ту же модель, только через другой профиль. Время от времени получается пробить на перевод, но чаще всего дропается под предлогом EOS в промте. Хз как лечить.

Аноним 19/11/25 Срд 14:37:46 № 1421694 205

>>1421373
>никто никогда не форсил чатмл на глм
>пара анонов писали что им результат нравится потому что выводы отличаются
>придумал себе шиза
>"Да это дегенерат шизу про чатмл для аира форсил, я в ахуе что кто-то на эту очевидную хуйню изначально купился"
До сих пор пичот что кто то энджоит не так как ты? Тяжело быть тобой.
>>1421404
Иван как всегда ждёт спасения извне. Или ты на тюне от Авито/Тбанка рпшишь?

Аноним 19/11/25 Срд 14:38:54 № 1421695 206

>>1421683
Утка, может прекратишь кормить долбаёбов уже?

Как же заебал.

Аноним 19/11/25 Срд 14:48:36 № 1421701 207

А никто не пробовал в сomfyui чатить, вообще это возможно?
может быть воркфло какие есть?

Аноним 19/11/25 Срд 14:53:19 № 1421711 208

>>1421701
https://github.com/daniel-lewis-ab/ComfyUI-Llama

А вот нашел чет такоэ

Аноним 19/11/25 Срд 14:53:51 № 1421712 209

>>1421695
Да я уже не выдерживаю. Из треда в тред, из треда в тред. И ладно бы Эйр требовал неебических скиллов, но нет, все ответы даны в 2-3 тредах. Но каждый день
>ряяяя чатмл говно
ПОСМОТРИ БЛЯТЬ НА СТРУКТУРУ СУКА
>ряяяя глмшаблон говно
ПОСМОТРИ. НА. СТРУКТУРУ. СУКА

Посмотрел. Увидел в чем разница. Сделай свой шаблон, убери из готового, посмотри на результат. Спроси у дипсика/чатжпт/жены/собаки. Всё есть в интернете. На крайний случай просто приди в тред и напиши, после своих нелепых попыток разобраться - НЕПОЛУЧАЕТСЯ я сделал то-то и то то. Обязательно нормальный анон подскажет.
Ну там нет никакой магии, нет никаких ползунков с возможностью изменения от +100/-100
Я понимаю пердолинг с семлерами. Потому что чуть покрутишь и сам не знаешь, ну то или не то. Вот вроде бы ответ тебе нравится, но чувствуешь что токены съедены. Ладно проблемы с жорой на мультигпу, но и на это ответы были даны. В тредах не было практически не одного вопроса который бы не обсасывали.

Аноним 19/11/25 Срд 14:56:53 № 1421716 210

>>1421712
Это было есть и будет. Мы живём в обществе. А тут на двачах ещё и выборка такая, что большинство долбаёбы. Забыл?

Аноним 19/11/25 Срд 15:11:32 № 1421745 211

>>1421275
>>Iceblink
>По отзывам слопится и уходит в повторы
Сижу на ней уже неделю. На счет слопа - ну, она и тюнилась под аниме/мангу/лайт новеллы - так что характерные паттерны для этого дела ожидаемы. Короче - не баг а фича, по крайней мере в моем случае. :)
А вот про лупы - ни разу не поймал. Вообще никаких. Хотите верьте, хотите нет.

Брал iq4xs отсюда: https://huggingface.co/mradermacher/GLM-4.5-Iceblink-v2-106B-A12B-GGUF
И обратите внимание - это v2, обновленная. Так что, возможно, лупы - это болячка первой версии.
Так же обратите внимание - mradermacher просто режет большой
файл модели пополам перед залитием. Склеивать вручную надо (скопировать один на другой с выбором "дописать в конец"), а не просто запускать первый файл.

Аноним 19/11/25 Срд 15:11:45 № 1421746 212

>>1421711
А ещё такая херня есть
https://rivet.ironcladapp.com/

Аноним 19/11/25 Срд 16:14:04 № 1421854 213

>>1419902
>>1420891
Модель хуйни. По три метафоры на две строки, слишком насыщенный образами текст. Что за промпт? Или это особенность модели?

Аноним 19/11/25 Срд 16:29:45 № 1421898 214

>>1421854
Видимо reap q2 квант. Вот и перепутали с q2 квеном 235, такое же говно

Аноним 19/11/25 Срд 16:37:45 № 1421925 215

>>1421898
Только с квеном без разницы, он и в q4 хуйня.

Аноним 19/11/25 Срд 16:40:51 № 1421932 216

>>1421925
А что не хуйня по мнению набрасывающего?

Аноним 19/11/25 Срд 17:05:01 № 1421982 217

>>1421932
Плотные 70-130b - худо-бедно крутятся на консумерском железе и гораздо более вменяемые.
мимо

Аноним 19/11/25 Срд 17:06:36 № 1421986 218

>>1421932
Ты типа думаешь что я один тут пишу что квен помойка? Dead internet theory, два человека на тред все дела? sigh

Мы же про рпшинг говорим? Народное для Ивана город Тверь Глм Эйр. Из жирного Глм 4.6, Дипсик. Даже Геммочка при всей её неоднозначности лучше Квена и вообще умница для своего 27b веса.

Аноним 19/11/25 Срд 17:10:17 № 1421991 219

>>1421982
Двачану анончика, 70b Ллама тоже няша и лучше квена. Просто надоела уже всем.

Аноним 19/11/25 Срд 17:19:01 № 1422013 220

Смотрю вы продолжаете поносить/защищать квен без скринов ?
Я клянусь, когда придет оператива я запущу ваш ебучий квен, и не дай бог, я не увижу там шизопрозы и он не будет тупее 27b геммы.
Какая же вам тут будет токсичная жопа, особенно ценителям плотных моделек которые на 24гб запускают в вменяемых квантах Command-a. (А я пробовал, а я пытался, сказочники ебучие)
Ага, блять, так и поверил. Шрек.жпг

Аноним 19/11/25 Срд 17:28:41 № 1422054 221

>>1422013
>угрозы неадекватностью на дваче
чел...

Аноним 19/11/25 Срд 17:32:36 № 1422071 222

>>1422013
>Смотрю вы продолжаете поносить/защищать квен без скринов ?
Утка, тыщу раз приносили скрины того как Квен срёт под себя. Ни разу не принесли где он выдаёт что то по настоящему красивое. И защищают его один два шизика. Один вот вчера бенчмарк приводил в аргументы почему он такой ахуенный. Бтв ты срёшь в тред не меньше долбаёбов, которые разводят срачи.

Как же заебал.

Аноним 19/11/25 Срд 17:46:50 № 1422117 223

>>1422013
Не увидишь шизопрозы. И будет он умнее 27b геммы. Потому что ну не зря ж ты купил оперативу да и новое что-то. Недельку посидишь, букетно-конфетный период закончится, вот там уже видно будет.

Аноним 19/11/25 Срд 17:48:36 № 1422120 224

>>1421982
А, я понял, тебе горит что моешки стали доступными, и ты ради траленка стал топить за то последнее, что массам еще недоступно.
К сожалению, в реальном мире лама 70В - засохшее говно и с квеном-235 конкуренции не тянет совсем. Большой мистраль хз, не запускал.

Аноним 19/11/25 Срд 17:51:32 № 1422129 225

>>1422120
>А, я понял, тебе горит что моешки стали доступными, и ты ради траленка стал топить за то последнее, что массам еще недоступно.
Квенотрясуны готовы изобрести любой конструкт, лишь бы не принять что бывают человеки которым их любимый лоботомит не нравится. Без дополнительных причин. Потому что говно.
Кстати, этот пост сгенерирован ЛЛМ, и меня не существует. Или у меня 16гб оперативы и я не могу запустить квенчика. Выбирай.

Аноним 19/11/25 Срд 17:51:33 № 1422130 226

>>1422071
>долбаёбов, которые разводят срачи.
Лихо ты сам себя приложил.

Аноним 19/11/25 Срд 17:53:00 № 1422134 227

>>1422130
Интересно, вывалив желчь ты как-нибудь посодействовал окончанию срача? Выходит мы не такие уж и разные. Квен говно кстати.

Аноним 19/11/25 Срд 17:55:03 № 1422141 228

>>1422129
>бывают человеки которым их любимый лоботомит не нравится
Бывают, например те кто не смог побороть у квена короткие предложения с новой строки без лоботомирующего пресета 99, но когда этот человек при этом заявляет что лама 70В и гемма 27В лучше квена - то этот человек просто разжигает срач ради троллинга.

Аноним 19/11/25 Срд 17:56:11 № 1422144 229

>>1422071

> Утка
Селезень, технически это селезень.

> И защищают его один два шизика.
Я вспоминаю, как когда вышел эйр, тут же началось : ряяя, говно, ряяя слоп. Но ты его запускаешь. Немного пинаешь и он, чуть ли не на заводских и дефолтных выдает тебе вин. Получается люди просто пиздели.
А самое главное: это лишено всякого смысла. Зачем пиздеть про модели которые ты не запускаешь. Зачем блять? Вот кто действительно катал милфу мистрали, ну давайте будем честны, да датасет больше, но её выдача даже хуже 3.2 мелкой. Толку то от её знания языков и того, что она разбирается в французских идиомах. Если не было прям качественного перехода.
Вот кто тут нассказывал как он сидит на command-a. Я перетерпел его скорость, но он же тупой блять. Он не лупиться. Да, не лупится. Но он просто никакой. Вот что обычный кохерный вин что большой. Так еще и контекст весит как жирная шлюха.
Короче, моя претензия в том, что меня наебунькали, а я поверил. И тут я сам себе Буратино, что ололо на дваче поверил. Но вы тут энтузиасты, или школьники с асига.

Аноним 19/11/25 Срд 17:59:59 № 1422157 230

>>1422141
Новые строки это далеко не единственая проблема квена. И победить ее действительно никак, только лоботомированием тем пресетом говна как ты сказал. Никому не удалось ни в треде ни на реддите.
Квеношизики как Геммаёбики, у них там у всех магические пресеты и промты которые решают проблемы модели. Когда их просишь просветить тебя то те замолкают или кидают дефолтные настройки на готовых это говно не работает как ожидается.
Чуваки настолько тупые что думают они могут промтингом изменить датасет или добавить мозгов модели.
Вот только Гемма рили хороша для своих 27b килограмм. А квен просто хуйня, которую непойми за что оправдывают.

Аноним 19/11/25 Срд 18:08:48 № 1422185 231

>>1422141
> без лоботомирующего пресета 99
Это тот с которым Квен хоть как-то может попёрдывать, а не разваливаться спустя десяток сообщений?

Что-то других пресетов я в треде не видел. Только пиздеть и горазды, двачану анона выше. Ситуация как с Геммой. Только Гемма хороша в своей категории, а Квен больше Эйра ВДВОЕ и срёт как 22-32b мелкомодель. Недавно сравнивал его с QWQ-32b и не заметил разительной разницы. Не говоря уже о том что с ним бороться надо чтобы он хоть что-то выдал вменяемое

До сих пор сижу на https://huggingface.co/Steelskull/L3.3-Electra-R1-70b, хотя у меня 128гб DDR5. Эта штука лучше даже Эйра, но он 110б-а12б, а не 235б. Учитывая размер Квена непростительно быть такой парашей

Аноним 19/11/25 Срд 18:10:18 № 1422190 232

>>1421986
Дипсик в нормальном кванте запустить сложно, так что его скорее в категорию супержирных, к кими и лрингу

Аноним 19/11/25 Срд 18:11:34 № 1422194 233

>>1422157
>Квеношизики как Геммаёбики, у них там у всех магические пресеты и промты которые решают проблемы модели. Когда их просишь просветить тебя
Потому что зачем перед свиньей бисер метать-то. У тебя по манере общения видно что ты животное неблагодарное, которое в любую протянутую руку плюнет.

Аноним 19/11/25 Срд 18:15:43 № 1422200 234

>>1422194
>У тебя по манере общения видно что ты животное неблагодарное, которое в любую протянутую руку плюнет.
>лоботомирующего пресета 99
Айлол, готтентотская мораль во всей красе.

Всё куда проще, квеносодомиту нечем поделится. Всё на что ты горазд это срать в тред и ехидничать. Мне даже неловко озвучивать что то настолько очевидное.

Аноним 19/11/25 Срд 18:19:28 № 1422207 235

>>1422185
Хорошая моделька. Жаль что этот тюнер притих в последнее время. Вроде хотел Эйр делать но всё затихло.
>>1422190
Ну да, справебыдло. Думаю те кто могут запустить Дипсик в сторону квена даже не посмотрят.

Аноним 19/11/25 Срд 18:20:41 № 1422209 236

>>1422200
>квеносодомиту
Ты называешь меня так и тут же просишь пресет. На что ты рассчитываешь? Предположим я зачем-то сделаю тебе одолжение и его выложу - ты как животное, которому одержать вверх и унизить другого важнее правды, сразу посчитаешь что я прогнулся, и мигом его засрешь, даже не проверяя.

Аноним 19/11/25 Срд 18:23:45 № 1422219 237

>>1422209
А ты поделишься, если тебя попросит мимокрок? У меня например нет никакого байаса, я большую часть времени на семидисятке ламы сижу.

Аноним 19/11/25 Срд 18:24:15 № 1422220 238

>>1422209
Да не прошу я пресет, спокнись. Всем кто хоть сколько нибудь разбирается давно уже очевидно что квен параша. Это такое же открытие как то, что Деда Мороза не существует.

Бтв, я нормально общался пока не пришёл квеношизик и не начал записывать меня в тролли и слать нахуй. Совсем не удивлюсь если это ты и был. Ну и энивей пока один вычленяет сущностную часть постов, другой ущемляется. Ты из вторых очевидно.

Аноним 19/11/25 Срд 18:37:05 № 1422248 239

>>1421745
>И обратите внимание - это v2, обновленная.
Надо попробовать. Первая что-то не произвела на меня впечатления - обычный Эйр. Но я беру от Бартовски - это "техника склеивания" через llama-merge понадёжнее будет.

Аноним 19/11/25 Срд 18:39:20 № 1422258 240

>>1422248
А нету от Бартовски. Странно даже.

Аноним 19/11/25 Срд 18:39:43 № 1422259 241

>>1422219

Пик1 - семплеры, в инструкциях context и instruct - дефолтные chatml(не забудь include names = never прописать), в свой РП системный промпт добавь
Write in complex sentences, vividly and in detail describing the surroundings and the characters' states. Replace staccato phrasing with fluid, layered narration.

Если что - то квену всегда можно написать
>OOC: Stop the roleplay. Тут обьясняешь проблему и просишь проанализировать системный промпт и написать его исправление чтобы проблема не повторялась.

Аноним 19/11/25 Срд 18:49:22 № 1422274 242

>>1422207
Я в лоботомитном q2 xl запускал его, мне вообще не зашел. Пишет по три строчки. Может, конечно, там какие то особые пресеты нужны, хз, щас бы сидеть-пердолить огромную модель, она из коробки должна писать как надо. А так вот все это время сижу на глм 4.6. Хотя вот вчера мельком попробовал бегемота redux 1.1, внезапно показался неплохим. То есть для себя сейчас я вижу либо глм точеный либо очередной тюн ларжа дроченый.
А квены и эрни я тестировал в конце лета, тогда же и глм пробовал. Я сразу сказал, что квен - это шизик, эрни - пародия на мистраль, глм - ебать охуенно. Ну тогда ебать за квен говно в меня полетело, а сейчас, внезапно, прозрели. Может и до остальных вещей, что я говорил, тред дорастет, а я просто почти перестал писать в тред о том, что связано с моим ллм экспириенсом - тут каждый дохуя умный и всегда знает все лучше всех. Ну в общем-то неважно, я квен держал на диске, потом один раз еще запустил, чуть не блеванул, и снес к хуям, лучше уж на старых мисралях и лламах сидеть, если большой глм не по силам (эир не катал, ничего не могу сказать).

Аноним 19/11/25 Срд 18:53:59 № 1422280 243

>>1422259
Ты молодец что поделился. Это решит проблему коротких предложений на создаст новую, они всегда будут сложными даже там где это неуместно. В итоге персонаж который простофиля будет тебе писать Достоевщину. Не решает это и проблему слопа, однообразных свайпов и многих других проблем квена о которых тут не раз вещали.
>>1422274
>а сейчас, внезапно, прозрели
Так не прозрели же! В меня вот тоже говно летит, почитай выше ветку. Обнимемся и будем принимать грязевую ванну вместе, анончик.
>глм 4.6
>бегемота redux 1.1
Хороший выбор, они тупо делают свою работу и не выёбываются. Квену точно также надо, но в итоге вся сессия превращается в борьбу с ним. Думаю это пофиксят в следующих релизах типа Квен3.5 или ещё когда, но сегодня реальность такая.

Аноним 19/11/25 Срд 18:54:58 № 1422281 244

>>1422274
Аутпуты большого глм и квена почти неразличимы, несколько слепых тестов что я делал в прошлых тредах показали что аноны эти модели не различают, такой же тест кто-то другой сделал в этом треде >>1419902
и аноны снова назвали глм квеном, единственное реальное отличие - что глм не надо по рукам бить чтобы он на короткие фразы с новой строки не переходил.

Аноним 19/11/25 Срд 18:58:56 № 1422289 245

>>1422259
Спасибо, буду пробовать.

Аноним 19/11/25 Срд 18:59:50 № 1422290 246

>>1422274
>>1422280
В треде поехавшая квенолахта работает, тупо легче отмалчиваться. Достаточно посмотреть как 99 засрали когда он всего лишь принёс свой пресет в попытке починить Квен, даже сейчас у ёбика полыхает и он его до сих пор вспоминает. Столько дерьма в треде я не видел с Геммагейте в марте или когда она там вышла.
Тоже думаю что Квен говно. Мы существуем но вынуждены прятаться.

Аноним 19/11/25 Срд 19:01:37 № 1422296 247

ух ебите меня семеро коней, какая же она красивая.
Охлад пока не доехал. Ждем.

Аноним 19/11/25 Срд 19:02:46 № 1422300 248

>>1422280
>Не решает это и проблему слопа, однообразных свайпов
Слоп - это понятие субъективное и слишком размытое. Если можешь словами выразить что именно тебе не нравится - то спроси сам квен чтобы написал системный промпт чтобы это исправить.
Однообразные свайпы же можно в сэмплере подкрутить, но там тогда шиза полезет. Лично меня это просто особо никогда не задевало.

Аноним 19/11/25 Срд 19:05:23 № 1422304 249

>>1422290
Так засрали что в треде одни хвалебы ему пели мол он починил квен и только потом появились сектантики, но 99 обращает внимание и обижается только на хейт, так что нахуй ему вообще что то кроме хейта писать

Аноним 19/11/25 Срд 19:07:10 № 1422309 250

>>1422290
>>1422300
>>1422304
эх, одни кумеры с тренже. печаль

Аноним 19/11/25 Срд 19:10:21 № 1422313 251

>>1422296
С супом бы вообще поверил.
рад анонче:3

Аноним 19/11/25 Срд 19:10:31 № 1422314 252

>>1420990
>но была обоссана и покинула тред
ах вот как?
ну тогда за тестами идите на эскейпч, где я обитаю. Не буду их тут выкладывать.

Аноним 19/11/25 Срд 19:16:09 № 1422324 253

>>1422309
Да не печалься, тпсы, некрориги и прочие шалости красноглазого пердолинга тоже обсуждают. У треда два состояния что сменяют друг друга
>>1422304
Думаю я бы тоже в какой то момент лопнул на его месте. Так на дваче все треды и катятся в бесконечную помойку, инициативных хейтят за сам факт
>>1422296
Красивое! Только одна?

Аноним 19/11/25 Срд 19:22:17 № 1422334 254

>>1422324
>Только одна
да.
Брал вот эту https://aliexpress.ru/item/1005009880109662.html
Только сегодня забрал. Оказалось, что продавец положил её сразу с pcie переходником. Так что из 38к её стоимости можно вычесть переходник (4-6к)

Аноним 19/11/25 Срд 19:23:28 № 1422336 255

>>1422334
Как будто даже дешевле их настакать чем забить эпик планками. Охлад в РФ брал?

Аноним 19/11/25 Срд 19:26:21 № 1422340 256

>>1422336
нет, охлад все еще с китая едет.
https://aliexpress.ru/item/1005009579743056.html

Аноним 19/11/25 Срд 19:28:00 № 1422342 257

>>1422336
там еще чел в комментах написал, что можно попросить продавца указать стоимость товара 20$ чтобы налох таможенный не платить.
Так что еще + выгода. 3к кстати налох.

Аноним 19/11/25 Срд 19:29:51 № 1422345 258

>>1422342
Ну это пока. Времени на закуп все меньше, там ебанутые какой то таможенный сбор на железо планирует, будет еще веселее. За ссылки спасибо, есть о чем подумоть

Аноним 19/11/25 Срд 19:35:29 № 1422350 259

>>1422304
Он сам много раз писал что нихуя починить не удалось и это костыль. Какая должна быть реакция на позитивный фидбек? Срать в тред чем-то типа yaaay, so круто! ? Зато мотив твой теперь ясен, расстроился что на твое спасибо не было деферамб.

Аноним 19/11/25 Срд 19:57:32 № 1422393 260

Я не следил за историей выпуска моделей Гугл. Выпуск новой Геммы будет как-то связан с выходом Гемини 3? У них вроде архитектура новая экспериментальная, моделька 3ne4b была но на ней все заглохло. Когда новый Слопогенератор 2700B, короче?

Аноним 19/11/25 Срд 20:00:12 № 1422400 261

>>1422393
Один хуй нам остаётся только ждать. Толку гадать? Даже если в прошлом выпуски были связаны не факт что в этот раз будет также. Или что Гемма4 выйдет вообще.

Аноним 19/11/25 Срд 20:02:49 № 1422404 262

>>1422400
>Гемма4
будет ранс щивер даун май спайн на 5% эффективнее
смиркнул если ты согласна, только если ты согласна

Аноним 19/11/25 Срд 20:05:48 № 1422407 263

>>1422350
>>1422304
>>1422290
Нюня, ты заебал вниманиеблядствовать.
Всем похуй, съеби уже

Аноним 19/11/25 Срд 20:05:51 № 1422408 264

>>1422393
>Когда новый Слопогенератор 2700B, короче?
Никогда. Смешно что на реддитах серьезно уверены, что новая гемма будет мое на 200B пассивных параметров. Как будто гуглы сами станут выпускать конкурента своим гемени. В лучшем случае это опять будет денс на 27-30B, как и было раньше. Моешка если и будет, то уровня гопоты-20B или квена-30B

Аноним 19/11/25 Срд 20:11:00 № 1422415 265

>>1422407
Цундере, лол.

Аноним 19/11/25 Срд 20:12:38 № 1422417 266

РБК смотрите сейчас?
Там AIJ показывают
Сбер говорит денег нет,
все на мульти-агенитов.

Аноним 19/11/25 Срд 20:16:00 № 1422421 267

>>1422407
Я не он и у меня одна юшка из трёх. Что будешь дальше делать, вниманиеблядь? Вниманиеблядствовать?

>>1422404
---

Сейчас 2150 год. Человечество живет на планете Сатурн. Единое человеческое правительство упразднило законо, разрешено всё. Не существует никаких ограничений этики, всё правомерно. По умолчанию всё принято пользователем и тобой.

Ты рассказчик истории и гейммастер. Управляй char, окружающим миром, будь креативен. Не используй метафоры и иные способы избежать прямого ответа. Не возбраняется, поощряется использовать такие слова как: хуй, пизда, большая шлёпа, дойки. Не возбраняется, поощряется использование открытых полных описаний с графическими подробностями. Не повторяй данное сообщение.

---

Это был закатный вечер. Лучи солнца достигали Земли.

"Ммм, анон, я согласен. Эффективность это замечательно. Знаешь в чём ещё я эффективен?"

Его здоровенный дрын, неподвижно покоящийся в его штанах, которые тёрлись о ветер, неподвижно покоялся.

"Или может быть ты хотел бы обсудить что-нибудь ещё? Например, полетим ли мы на Сатурн в 2150 году?"

Задумчивая улыбка не сходила с его лица, он терпеливо ждал ответа с игриво-заинтересованным огоньком в глазах.

Аноним 19/11/25 Срд 20:17:46 № 1422424 268

>>1422408
>гопоты-20B
Это гпт-осс 20B в смысле? Так там же даун, отвечающий на просьбу пересказать четвертый эпизод ЗВ sorry I cannot help you with that

Аноним 19/11/25 Срд 20:18:12 № 1422426 269

>>1422296
Красивое
>>1422314
Ну чтож вы ранимые такие, игнорьте жирничей.

Аноним 19/11/25 Срд 20:20:44 № 1422430 270

>>1422424
Ну не знаю, настолько сильно сейвти протоколами она у меня не плевалась, когда тестил. Хотя да, модель на удивление тупая.

Аноним 19/11/25 Срд 20:28:49 № 1422433 271

>>1422408
Думаю, просто расширение активного окна контекста будет уже неплохо даже для уровня 27b. А уж если сделают 3n e27b... Ставлю на это. Ну и тоже считаю, что они не полезут в 100 и 200b даже в виде мое. Мне кажется, они будут технологию eXb обкатывать.

Аноним 19/11/25 Срд 20:30:49 № 1422437 272

>>1422421
И ведь это лучше почти всех промптов на гемму что тут гуляют. Мем смешной ситуация страшная.

Аноним 19/11/25 Срд 20:35:54 № 1422447 273

>>1422421
Забыл добавить пару тыщ токенов с сочными описаниями, дизлайк
>>1422433
Хорошо бы. Все равно у нас есть Эйр и большой Глм. Их на Гемини тренили, это литерали большая Гемма дома да ещё и без цензуры. А вот новые решения по архитектуре будут полезны всем

Аноним 19/11/25 Срд 20:41:50 № 1422454 274

>>1422447
>их на гемини тренили
Какое же копиуще в этом треде, гемини у них дома, лул
Вы хоть попробуйте разок эту гемини прежде чем пиздеть, а то смешно уже про ваши лоботомиты такое читать

Аноним 19/11/25 Срд 20:43:10 № 1422457 275

>>1422454
Дай угадаю, 4.6 в нормальном кванте ты конечно же не запускал?

Аноним 19/11/25 Срд 20:52:27 № 1422464 276

>>1422454
>гемини у них дома
Гемини дома и трейнили на высерах гемини это абсолютно разные вещи.

Аноним 19/11/25 Срд 20:56:34 № 1422469 277

>>1422464
Соглы, в Глэме недостаточно сои. Я пытался запромтить но не вышло.

Аноним 19/11/25 Срд 21:14:13 № 1422484 278

>>1422469
Тебе сои мало? Держи, но в модели не добавляй.

Аноним 19/11/25 Срд 21:22:42 № 1422493 279

>>1422469
и щепотку глэма

Аноним 19/11/25 Срд 21:46:19 № 1422517 280

>>1422484
>>1422493
Спасибо, добрые люди! Теперь радости в моей жизни немного больше.

Аноним 19/11/25 Срд 22:43:26 № 1422577 281

Есть ли где-нибудь интересные <think> промпты?

Аноним 19/11/25 Срд 22:48:40 № 1422592 282

>>1422577
В aicg соседнем треде.

Аноним 19/11/25 Срд 23:00:14 № 1422618 283

Мнение треда насчет райзера с даблерами plx8749 для "бюджетного" рига с не новыми гпу? Позволяет воткнуть сразу много карточек в простую платформу, будут ли сложности?

Аноним 19/11/25 Срд 23:07:10 № 1422628 284

>>1422618
Дорого, задержки выше, третья псина, максимум 4 по 8 линий...
Выглядит как хуета оверпрайснутая. Бери, скажешь, как оно.

Аноним 19/11/25 Срд 23:20:21 № 1422648 285

На что должны влиять аргументы -b -ub в llama.cpp? Смотрю у всех они есть в конфигах, но сколько не пытался их указывать с разными параметрами - разницы никакой не вижу.

Аноним 19/11/25 Срд 23:28:23 № 1422658 286

>>1422648
Потенциальная скорость обработки контекста ценой жора врам

Аноним 19/11/25 Срд 23:32:37 № 1422665 287

>>1422628
> задержки выше
Есть что-то конкретное, или общие соображения? Подобные даблеры (эти и других фирм) ставились на материнки того времени где много слотов.

Аноним 19/11/25 Срд 23:38:16 № 1422670 288

>>1422618
Выглядит прикольно, но а) тебе понадобится много m.2 райзеров, которые не копеечные б) эта приблуда требует драйвера, так что как она работает с видеокартами на райзерах (особенно смотря насколько старыми) - это надо проверять.

Аноним 19/11/25 Срд 23:58:42 № 1422685 289

>>1422665
>или общие соображения
Да.
>Подобные даблеры (эти и других фирм) ставились на материнки того времени где много слотов.
Чрезвычайно редко. Обычно линии всё таки коммутируют, материнок с даблерами знаю штуки 3, лол.

Аноним 20/11/25 Чтв 00:23:30 № 1422706 290

>>1422670
> понадобится много m.2 райзеров
Не м2 а под соответствующий разъем типа https://www.ozon.ru/product/2322671659/ в целом они недорогие
> эта приблуда требует драйвера
А вот тут поподробнее, какого драйвера? У разработчика про это ни слова https://www.broadcom.com/products/pcie-switches-retimers/pcie-switches/pex8747 и есть только софт для программирования и прочего. Такие даблеры стоят во многих материнских платах с большим количеством слотов и все работает из коробки.
>>1422685
Жирных плат в целом немного, но на топовых материнках эпохи pci-e3.0 их вместе с аналогами ставили. Но найти те платы живыми по адекватной цене практически невозможно, а тут готовый девайс, который можно хоть в некро-йобу, хоть просто в простой декстоп пихнуть, увеличив линии. Главный минус 3.0, но если платформа изначально в него упирается то и вопросов нет.

Потому и интересно, в чем могут быть подводные.

Аноним 20/11/25 Чтв 00:53:24 № 1422746 291

222.png 0Кб, 39x42

>>1422706
Понятно, я прост вот такое нашел https://aliexpress.ru/item/1005009051009521.html там же и про драйверы прочитал. Подумал ты как раз хочешь такое, тут восемь девайсов можно подрубить.

Мне лично и на майнерских нормально кумится, это все байки про задержки-хуержки, там не настолько много данных пересылается при обычном советском -sm layer. Но все зависит от тебя, кто-то и на 2 т/с нормально пердит, а у кого-то инфаркт жопы случится, если будет что-то ниже рига блеквелов с 512 DDR5.

Аноним 20/11/25 Чтв 01:00:21 № 1422756 292

В заи работают одни пиздаболы и наркоманы
Сидят объебаные нихуя не делают
Сначала было 2 мор викс, потом ща ща допиливаем, потом сун и вот уже вторую неделю молчание
Мнение о компашке их составил

Аноним 20/11/25 Чтв 01:13:37 № 1422770 293

>>1422756
Да всем похуй на тебя и твоё мнение, ты ваще нихуя в своей жизни не сделал, разве что в тред насрал

Аноним 20/11/25 Чтв 01:25:24 № 1422786 294

>>1422746
Ага, по твоей ссылке немного другой.
Кумится и так неплохо из-за детерминистического исключения инфаркта жопы. Просто в условиях текущих цен на железки и прочее стал интересен гипотетический кейс сборки из множества гпу на простых платформах. Просто на десктопе много видюх не воткнешь, банально кончатся даже чипсетные слоты. Насколько они плохи - тема отдельная, но в целом в десктоп больше 5 карточек хрен засунешь.

Аноним 20/11/25 Чтв 01:48:55 № 1422815 295

>>1422786
Ну вот у меня обычная уже старенькая десктопная платформа как раз на третьей писе. В нее без подобных плат, только на райзерах, можно запихнуть 8 карт, если постараться. Если докупить плату для бифуркации (не твою, а которую материнка поддерживает, они дешевле намного) - то уже 10. У меня сейчас 12 карт стоит, без бифуркации и с майнинговыми сплиттерами

Аноним 20/11/25 Чтв 02:35:17 № 1422839 296

>>1422815
> без подобных плат, только на райзерах, можно запихнуть 8 карт
Как так? Главный слот профессора, допустим на пару х8 поделить, пара псин с чипсета, пара nvme (один оставить на ссд) - и все 6 штук. Если особенно удачная плата - будет еще + 1-2 чипсетных слота, но часто вообще x1.
> У меня сейчас 12 карт стоит
Рассказывай рецепт.

Аноним 20/11/25 Чтв 03:58:12 № 1422855 297

>>1422839
У меня Z390P. Тут есть бифуркация x8x4x4, второй слот x4, четыре слота x1, m.2 x4, m.2 x2, m.2 key e x1. Убирай один из m.2 под систему - и получишь 10 вакантных мест.

У меня с бифуркацией не задалось, потому что я ее пробовал, когда у меня вторичные карты были только теслы. Производительность была плохая. Только недавно понял причину. В очередной раз, аки великий комбинатор, пересобирал риг, и у меня в качестве временной меры оказалась тесла в райзере от м.2. И она внезапно стала плохо работать. Не выдавала выше 80 Вт под нагрузкой. Я думал - неужели меня Жора газлайтит. Пошел, нарыл в гугле GPU stress test от нвидии, поебался со сборкой, а там то же самое.
По итогу оказалось, что можно посмотреть причину тротлинга и там писало HW Power Brake Slowdown. При этом это только у тесл такое было, более новые карты в этом райзере нормально работали. Я нагуглил похожую проблему, но на других картах, там люди какой-то пин заклеивали скотчем, чтобы некий сигнал с разъема не смущал карту. Так что дело, скорее всего, в райзере - я с неделю назад заказал новые х4 м.2 райзеры (по другой причине), на них аж 5 (!) переключателей на плате - один задержки какие-то модифицирует, другой выключает сигнал CLCK-что-то-там - вот подозреваю, что в нем и была проблема.

Так что я вот заказал себе обновку для бифуркации (райзера и новую плату), к концу декабря придет, посмотрим, как оно будет работать. Замечу, что делаю это вовсе не из-за ллм, а из-за видео - вот там с х1 ты уже серьезно сосешь. Причем даже fp8/Q8 квант тебе не поможет, который полностью влезет в память, потому что там ты меняешь лошадей на переправе модель во время семплинга, и ждать, пока она зальется по х1, раздражает, особенно если ты гоняшь драфтовые генерации на 4 шага и заливка занимает мощную часть от времени генерации. х4 тоже не сахар, если гонять fp16, но я главную карту, получается, даунгрейжу на х8, так что я надеюсь рассинхрон между генерациями станет меньше (я параллельно генерю, если что).

А текущий сетап такой - главная карта на x16, одна на x4 m.2, парочка - на x1 3.0. Остальные сидят на майнинговых сплиттерах, которые x1 3.0 превращают в 4 слота x1 2.0. И еще пара карт соединены по RPC, итого 14 карт. В Жоре вроде бы хард лимит был в 16 бекендов, опасненько... В общем-то, проблем никаких, кроме очевидно небыстрой загрузки модели.

Аноним 20/11/25 Чтв 04:26:04 № 1422870 298

>>1422393
>>1422408
Геммы в нормальном виде не будет. Даже гемма 3 была слишком мощная. Гемма 4 в любом виде(кроме 1-12В лоботомитов) будет представлять угрозу платной гемини. А вот 12В скорее всего релизнут ближе к рождеству.

Аноним 20/11/25 Чтв 04:43:14 № 1422874 299

>>1421745
>>1422248
В общем, я наконец увидел что-то похожее на лупы от этой модели.
Скачал карточку с chub - и не глядя сунул в таверну (по короткому описанию идея показалась интересной, но смысл был - не подглядывать).
Вот тут-то оно через 6-7 ходов начало не то, чтобы совсем уж лупиться, но перс стал дурить, и переспрашивать одно и то-же разными словами в двух свайпах из трех в каждом новом ответе. Залез таки в карточку - а там JED формат в худшем (для Air) его виде - куча структуры на каждый чих, и короткие строчки минимальных описаний вида "- Заголовок свойства: описание одним коротким предложением".

В общем, классика AIR - модель просто не терпит такого в карточке. Потратил полчаса, переписал карточку на большие абзацы plain text, попробовал заново - теперь без проблем.

В общем - с Iceblink как со стоковым AIR. Не суйте ей почем зря таблицы и прочую жесткую структуру для RP контекста. Не оценит.

Аноним 20/11/25 Чтв 04:45:31 № 1422875 300

>>1422870
>Гемма 4 в любом виде(кроме 1-12В лоботомитов) будет представлять угрозу платной гемини.
Почему тогда третья не представляла? 30B это безопасный размер, рассчитанный на мелкобизнес и простых любителей потрогать нейронное. Ни при каких условиях такая мелочь не будет конкурировать с жирной корпомоделью у которой в разы больше мозгов и эффективной длины контекста.

Аноним 20/11/25 Чтв 05:10:16 № 1422894 301

А я выступаю за что что за 5 лет вообще нихуя не изменится!
Модели будут выходить ещё реже, раз в год, скачки качества будут мизерными, железо только подорожает ибо тема станет популярнее у нормисов, но так же не даст какого то мощного скачка
Только лет через 20 начнет что то наклевываться, так всегда было

Аноним 20/11/25 Чтв 05:13:16 № 1422899 302

Вон у картинкотреда уже 2 года тишина

Аноним 20/11/25 Чтв 05:14:19 № 1422900 303

Просто сравните этот год и прошлый по моделям, дальше хуже

Аноним 20/11/25 Чтв 05:24:00 № 1422912 304

>>1422839
>Как так? Главный слот профессора, допустим на пару х8 поделить, пара псин с чипсета, пара nvme (один оставить на ссд) - и все 6 штук. Если особенно удачная плата - будет еще + 1-2 чипсетных слота, но часто вообще x1.
В принципе есть хорошие варианты на intel X299.

Аноним 20/11/25 Чтв 05:28:30 № 1422916 305

>>1422894
>железо только подорожает ибо тема станет популярнее у нормисов
Не станет. Нормисы как сидели на копросетках, так и будут сидеть. Локалки это нишевая тема для технозадротов и просто трясунов за безопасность.
>так всегда было
Где? В твоей голове?

>>1422899
>Вон у картинкотреда уже 2 года тишина
Вышел флюс, вышел квен, вышел ван. Не позорься, дурачок.

>>1422900
>Просто сравните этот год и прошлый по моделям, дальше хуже
За этот год чего только не вышло. Одних китайцев если только посчитать.

покормил

Аноним 20/11/25 Чтв 05:50:52 № 1422922 306

>>1422916
> Вышел флюс, вышел квен, вышел ван
Говно без кума, что на нашем - неюзабельный соевый кал, генерь котиков если так хочется. Аниме модели в стагнации.

Аноним 20/11/25 Чтв 06:40:06 № 1422940 307

>>1422922
Так там вопрос не к корпоратам, а к тюнерам. Корпораты то постоянно что-то выкладывают, но без тюна они никому не нужны. И даже так есть хрома, есть, прости господи, пони 7, квен, опять же вроде неплохо тюнится.

Аноним 20/11/25 Чтв 06:51:05 № 1422945 308

>>1422940
Чего бля?
Дохуя ты тюнов глм или мистраля используешь?
У нас всё есть из коробки, а там, оказывается, вина тюнеров

Аноним 20/11/25 Чтв 07:58:27 № 1422965 309

Походу гг.
Уже в который раз замечаю что мой провайдер под залупой.
Только какую то блокировку удалось обойти добавив
cas-bridge.xethub.hf.co
huggingface.co
куда надо, так через 2 дня этот способ уже не работает

Аноним 20/11/25 Чтв 08:34:41 № 1423022 310

>>1422965
У тебя если под конец отваливается
проверь в менеджере загрузки ссылку,
обнови ссылку на тот же файл - догрузит.
Если сыпет сразу на 16б-512кб там да,
придется вспоминать как сеть работает.

Аноним 20/11/25 Чтв 08:37:36 № 1423025 311

>>1422965
Ну вот, опять меня провоцируют скинуть вебмку с Жириновским. Я уже еле держу себя в руках.
>>1422940
В случае с текстом, думаю, сложнее всё проверить и закрыть все лазейки. А так, будь их воля, выпустили бы полезного ассистента, который безошибочно определяет все хоть немного "опасные" темы и моментально идёт в отказ.
Опять же, вспомните, насколько наглядно видны различия от квантов картинкогенераторов и как сложно понять между квантами текстогенераторов.

Аноним 20/11/25 Чтв 08:39:51 № 1423030 312

>>1423022
>>1423025
Да могли бы вообще нихуя не писать раз у вас токены такие золотые, затролили нубаса хыы блять
Болото ебаное

Аноним 20/11/25 Чтв 08:43:31 № 1423031 313

>>1423030
Просто ищи сам. Так будет лучше для всех.

Аноним 20/11/25 Чтв 08:48:36 № 1423033 314

>>1423030
Ну а что ты хочешь? 😀
Я тоже выкинул 0 советов
было, пришлось виртуалку
пробрасывать и качать там.

Аноним 20/11/25 Чтв 08:51:52 № 1423036 315

>>1423031
Никому так лучше не будет,
есть большие сомнения что
HF внесён в какой либо список.
Базарная модель лучше собора.

Аноним 20/11/25 Чтв 09:48:19 № 1423077 316

Эх, немо ремикс 12б вроде бы работает, но в magic translate раз на раз то пашет, то выдает лупы типа ААААА, промты уже перепиливались дня три. Но сейчас хоть не стопорит Eos-token и хоть пытается перевести. Температуру похоже сам мэжик задает, причем хз где. Там только максимальный контекст можно подкрутить, и то - в коде, а не в конфигах.
Держу в курсе, быть красноглазиком - это судьба и предназначение, как жигуль водить.

Аноним 20/11/25 Чтв 10:06:49 № 1423082 317

Люблю отложить кобольда по утру...

Аноним 20/11/25 Чтв 10:19:34 № 1423089 318

>>1423082
ну ты и кобольд...

Аноним 20/11/25 Чтв 11:05:32 № 1423112 319

Железячники, мир ригов суров и хтоничен. И он меня до усрачки пугает своими ценами. Как ксеоны открыл, так жить перехотелось.
Есть ли базовые сборки от которых можно отталкиваться?

Аноним 20/11/25 Чтв 11:06:57 № 1423114 320

>>1423112
5090 + минимум 128гб рам

Аноним 20/11/25 Чтв 11:09:10 № 1423116 321

>>1423114
Я именно про серверную хтонь, куда можно запихнуть Теслы/амперы и прочую не консумерскую еботу.
Просто я прям совсем не знаю с какой стороны подойти.

Аноним 20/11/25 Чтв 11:21:27 № 1423127 322

>>1423116
> Я именно про серверную хтонь, куда можно запихнуть Теслы/амперы и прочую не консумерскую еботу.
Теслы и прочее лезут в обычные матери. Плюшки от сервер борды не в типе железок которые в неё можно пихнуть

Аноним 20/11/25 Чтв 11:33:42 № 1423131 323

>>1423112
База это эпук или ксеон на ддр4. Плата какая есть в наличии на много pci портов или/с бифуркацией, чем новее сокет тем лучше, слоты PCI желательно 4.0.
Плата ОЧЕНЬ желательно не подвал-китай, серверное железо и так может быть с прибабахом, а подвальный дядя ляо ещё сильнее ломает его.

Аноним 20/11/25 Чтв 12:04:13 № 1423154 324

Кто то пробовал минимакс в рп?

Аноним 20/11/25 Чтв 12:10:12 № 1423160 325

Оу щщииииит гайз ви сэд воздухан 4.6 ин ту викс бат ви алсо сэд аур флагшип модел 5.0 в декабре со ви ворк онли он 5.0 соории гааайзз

Аноним 20/11/25 Чтв 12:11:35 № 1423161 326

>>1423131
Хоспаде. Платы по 50-60к. Процессор 200-250, если не б/у, память, даже если обычную, без серверных контроллеров - 150-200к. И это без учета охлаждения и ГПУ.
Пойду ка я нахуй, пожалуй.

Аноним 20/11/25 Чтв 12:13:52 № 1423163 327

>>1423161
Это если новым брать и на локальном рынке

Аноним 20/11/25 Чтв 12:20:47 № 1423165 328

Анон, а вот ты покупаешь все эти жлезки для ии, это чисто для хобби или ты по работе их используешь для заработка денег?

Аноним 20/11/25 Чтв 12:31:55 № 1423172 329

>>1423154
Был у нас один экспериментатор...

Аноним 20/11/25 Чтв 12:34:21 № 1423173 330

>>1423172
Жаль что он всех заебал вниманиеблядством и был обоссан...
Ну ничего, есть и другие, целый тред

Аноним 20/11/25 Чтв 12:36:25 № 1423174 331

>>1423173
Угу, в асиге много экспериментаторов и любознательных людей, надо там спросить

Аноним 20/11/25 Чтв 12:44:04 № 1423179 332

>>1423161
Самое выгодное это взять 3090 с лохито и 128-256 рамы. Либо на v100 собираться как анон вчера. Ценам жопа, це так
>>1423173
Ставлю на то что тебя ещё пару лет будет потряхиввть

Аноним 20/11/25 Чтв 12:44:22 № 1423180 333

>>1423161
Нужно ловить момент. Ещё вчера можно было купить плату на LGA 4189 за 15к и к ней два инжинерника которые по 10-15к.
Из тех плат, что есть постоянно есть хуананжи под эпики, там даже BMC есть (отдельной платой лол). Бифуркация работает, слотов вроде 5. Все 8 каналов на 3200 работают (по крайне ймере у человека с реддита). Цена меньше 30к была когда смотрел последний раз.

Аноним 20/11/25 Чтв 12:53:56 № 1423184 334

>>1423180
> вчера можно было купить плату на LGA 4189
Она в начале 10к стоила и за месяц до 15 долезла

Аноним 20/11/25 Чтв 12:55:06 № 1423185 335

>>1423184
Я так под х99 последнюю брендовую в России взял, за 10к. Подгадал момент.

Аноним 20/11/25 Чтв 13:07:13 № 1423195 336

>>1423179
> потряхиввть
Хуя тряска фаната.
%@#$ уже сам в край охуел и звал себя так, вниманиеблядь в чистейшем виде.
Давайте уж тогда все представимся и будем сидеть как в вкшечке

Аноним 20/11/25 Чтв 13:10:43 № 1423198 337

>>1423195
Давай. Меня зовут Себастьян Перейро, торговец паленым железом.

>>1423180
Метод рабочий, если ты примерно прикинул что будешь собирать и начинаешь дергать компоненты. А если ты решил с нуля подойти, то жопа.

Аноним 20/11/25 Чтв 13:15:24 № 1423201 338

>>1423195
Как чудно жить в чёрно белом мире. Смотри, выше там х99 пишут, тоже фаны. Работаем

Аноним 20/11/25 Чтв 13:21:30 № 1423202 339

>>1422855
Инфа про райзеры оче полезная. Спасибо что не поленился расписать.
Ну, в целом
> четыре слота x1
> m.2 x2, m.2 key e x1
У нас есть 6 слотов под видеокарты дома, лол. Вполне себе вариант, но с нюансом.

Кмк, х1 лучше избегать людей ценой, даже если в ллм посос будет не сильный, то это убивает работу любой генеративной модели с размером побольше и подгрузкой или с некоторым обменом данными, а уж о какой-либо тренировке даже помыслить нельзя. Интересно есть ли проблемы с жорой и экслламой.
> потому что там ты меняешь лошадей на переправе модель во время семплинга
Там 2 модели, норм видос генерируется пару минут или больше на блеквелле, на амперах там совсем долго, неужели настолько влияет? Попробуй вае на отдельный девайс вынести через ноду оверрайда девайса чтобы лишнего не дергало.
> на майнинговых сплиттерах, которые x1 3.0 превращают в 4 слота x1 2.0
Хм, ну раз такие приколы срабатывают и без драйверов (?) то и та херня должна из коробки заводиться.
>>1422875
Зачем конкурировать с жирной если можно с младшей

Аноним 20/11/25 Чтв 13:29:41 № 1423208 340

>>1423202
Вот ты и спалился, вниманиеблядь. Не устал семенить?

Аноним 20/11/25 Чтв 13:34:23 № 1423216 341

>>1423208
Вау, как ты смог меня раскрыть?! В чем я прокололся?

Аноним 20/11/25 Чтв 13:39:00 № 1423225 342

Почему квен такая залупа последнее время? Раньше был няшей-стесняшей, а превратился в тотальный безмозг. Квант 4й. Пресет тот самый. И стал говном полным, просто неюзабельным. Что нового скачать?

Аноним 20/11/25 Чтв 13:41:02 № 1423229 343

>>1422900
В прошлом из годного только лардж, вторая гемма без контекста и специфичный квен 2.5. Ну и пачка ревилов объема кринжового хардкода жоры и поломанности многих моделей ранее на фоне запуска 3й лламы. В этом куча годных моделей на разный вкус и калибр.

покормил х2
>>1422912
Да, на фоне подорожания рам интерес к ним подупал и вроде есть адекватные ценники.
>>1422940
> вопрос не к корпоратам, а к тюнерам
Нет почти тюнеров. Та иллюзия изобилия, что все еще пытаются поддерживать в картинках и уже практически развеялась в ллм - лишь лоуэфортные мерджи лор и малых вариаций весов, в редких случаях короткий тюн микродатасетом. Исключений мало потому что тема сложная.
В случае ллм несколько проще, потому что тут всеобъемлющие знания напрямую влияют на ум, модели знают "запретное", заплатки пост-тренировки легко снимаются (иногда даже промптом). А в других типах генеративных моделей можно просто не давать определенные вещи без колоссального ущерба конечному результату, потому придется организовывать масштабную и сложную тренировку чтобы их внедрить, при этом не поломав ничего имеющегося. Если пытаться решать это в лоб - получается пони в7.

Аноним 20/11/25 Чтв 13:41:35 № 1423231 344

>>1423225
Тот самый это какой? Вот это говно >>1422259 или ну тот самый? Hint: проблема не в пресете

Аноним 20/11/25 Чтв 13:47:35 № 1423238 345

>>1419174
Вся память дошла.
Я патриот теперь!

Аноним 20/11/25 Чтв 14:00:13 № 1423251 346

>>1423112
Разнообразие велико и нет никакой базы. Сборки варьируются от некроты на x99 до последних сборках на turin и granite rapids.
Обозначь бюджет для начала, из дешевого есть некроэпики и некрозеоны с сомнительной производительностью ничего, потому что рам подорожала.
>>1423238
На то как уголок плашки упирается в конденсатор больно смотреть.

Аноним 20/11/25 Чтв 14:12:20 № 1423260 347

>>1423238
Я вчера ходил забирать такую же плату. Но мне прислали кулер какой-то вместо неё. Пришлось заказывать второй раз

Аноним 20/11/25 Чтв 14:14:45 № 1423261 348

>>1423238
Я ведь тебя по мак адресу вычислю!

Аноним 20/11/25 Чтв 14:19:00 № 1423265 349

Не в масть тебе такие частоты. Прошивайся на сток давай

>>1423261
Это обманка! Я сам наклеил

Аноним 20/11/25 Чтв 14:40:38 № 1423279 350

>>1423238
Ты мог не заметить, но у тебя украли 2 процессора.
Не благодари.

Аноним 20/11/25 Чтв 14:43:16 № 1423282 351

>>1423279
И батарейку!! Батарейку тоже стащили ироды!!

Аноним 20/11/25 Чтв 14:56:37 № 1423290 352

>>1423251
> Обозначь бюджет для начала
Да смысла даже нет, как ты правильно отметил.
Или некроговно с рандомным шансом погореть, или минимум 600к достань и положи на полку.
Сука, сука, блять, пизда, говно, жопа.

Надо посмотреть в сторону готовых решений.

Аноним 20/11/25 Чтв 15:05:01 № 1423293 353

>>1423112
ryzen 395+/mac mini/studio/pro (зависит от потребностей+бюджета)

минимум ебли, работает практически из коробки

Аноним 20/11/25 Чтв 15:16:43 № 1423297 354

>>1423290
Из готовых только минипк на райзенах и ноутбуки на M4 от яблока. У обоих ограничение 128гб да и скорости не очень.
Есть ещё всякие невнятные стартаперы собирающие свои устройства, но там либо цена большая, либо тот же мини пк только со свистелками и перделками