Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Тред закрыт.

Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 552 85 105
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №209 /llama/ Аноним 29/03/26 Вск 22:18:49 1566447 1
Llama 1.png 818Кб, 630x900
630x900
Эффективность к[...].png 92Кб, 1399x1099
1399x1099
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
177045241244201[...].jpg 5628Кб, 4000x3000
4000x3000
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1564094 (OP)
>>1560242 (OP)
Аноним 29/03/26 Вск 22:26:28 1566456 2
1774812286373.png 376Кб, 1965x1875
1965x1875
"Гемма 4"
Аноним 29/03/26 Вск 22:26:44 1566457 3
>>1566432 →
>тут сидят УЖЕ ВСЁ ВИДАВШИЕ пердуны которых уже ничего не радует
Эт я =))

А ещё слепые, лол, перекатили уже, не заметил >>1566454 →
Аноним 29/03/26 Вск 22:31:59 1566463 4
>>1566423 →
Мистер Смит, у вас KYSgender протекает.

>>1566411 →
Моя жена - Морковь. Мой пёс - Снеговик. А я - Смешарик. ЛоуАйсикьюЛЛМ - мой home. Неуютный, но уютный.
Я неиронично переименовал собакена в Снеговика. Люблю его.
Аноним 29/03/26 Вск 22:32:01 1566464 5
1774812618394.mp4 12855Кб, 720x1280, 00:00:54
720x1280
> гемма 4
Предвкушаете?
Литерали ту море викс и будем кушать
Аноним 29/03/26 Вск 22:33:49 1566467 6
Аноним 29/03/26 Вск 23:00:58 1566491 7
>>1566454 →
Нормально пишет. С твоего англика кринжанул больше выполнение воинского приветствия в Ю КЕЙ 2088? это фанфик по вселенной гёрлс фронтлайн? или мир где произошло ОТ ЛИССАБОНА ДО ВЛАДИВОСТОКА
Аноним 29/03/26 Вск 23:03:29 1566494 8
>>1566464

Гемма 4 + турбокванты. Литералли новый прекрасный мир.
Аноним 29/03/26 Вск 23:04:51 1566496 9
>>1566494
А что веса обещали выпустить?
Аноним 29/03/26 Вск 23:06:49 1566500 10
>>1566496
Если не выпустят - то почему она называется гемма, а не гемини?
Аноним 29/03/26 Вск 23:09:29 1566503 11
>>1566500
Потому что гемини лаботомировали до безумия. Теперь это курсед помойка к которой никто не хочет прикасаться. Выстрелили себе в ногу из гранатомёта. Типичный гугл.
Аноним 29/03/26 Вск 23:55:18 1566553 12
>>1566503
А что с ней сделали? Я гугломоделями редко пользуюсь, корпами только для рабочих задач, иногда по апи рпшу, но не с дорогой гемини.

Гемини теперь и в рабочих задачах сосёт?
Аноним 30/03/26 Пнд 00:33:10 1566597 13
Почему при общении с человеком нейросетка ведет себя более разумно, чем сама с собой?
Аноним 30/03/26 Пнд 00:40:02 1566604 14
177455926321005[...].jpg 740Кб, 1171x1254
1171x1254
>>1566503
Пользуюсь периодически 3.1 pro для РП - вполне съедобно. Вот тут давеча перепутал модели, и вместо 3-pro-image случайно отправил промпт на генерацию изображения "Сталинского костюма" Елизарова в на 3.1-pro.
Но, конечно, до Опуса 4.6 Гемини 3.1 ещё далеко по вниманию к контексту.
Аноним 30/03/26 Пнд 00:46:51 1566611 15
>>1566604
Так вот почему оперативная память подорожала
Аноним 30/03/26 Пнд 00:54:12 1566616 16
>>1566611
Думаешь, причина подорожания - мой исекай в Диско Евангелион?
Аноним 30/03/26 Пнд 01:35:45 1566650 17
turbo-button.jpg 25Кб, 640x366
640x366
Поясните за турбокванты. Могу ли я надеяться, что благодаря им я теперь с 12 гб врам и 32 рам смогу 27б модели хотя бы на 8-10 т/с запускать?
Устал от 2 т/с.
Аноним 30/03/26 Пнд 01:44:52 1566657 18
>>1566650
Нет, на данный момент только контекст побольше сделать. Например у меня на 16гб пока выходит 15к контекста q8 для 27б, а турбокванты заменят q8 и я смогу сделать либо больше контекста либо взять менее квантованную модель

Но пока что первая реализация замедляет скорость работы с контекстом
Аноним 30/03/26 Пнд 01:52:31 1566662 19
>>1566650
Сэономит потребление на контекст. Так-то если настроишь выгрузку фидфорвардов оставив атеншн на гпу вместо -ngl - уже сейчас сможешь ускориться с 2тс
Аноним 30/03/26 Пнд 02:24:04 1566694 20
guZF6JPXNg.png 294Кб, 1457x422
1457x422
>>1566604
"Как мне стать таким же крутым, как он?"
- расстроенно пробубнила мисака мисака, кинув жалобный взгляд на поёбанный жизнью третий квант 70b файнтюненой лламопараши для кума, ради которой приходится убивать половину процессов. 32 гига и амудэ вместо карты, хуль вы хотели.
хули ты тут выёбываешься, м?
Аноним 30/03/26 Пнд 02:36:17 1566703 21
>>1566597
Ну ты же тоже на людях не дрочишь?
Аноним 30/03/26 Пнд 06:40:13 1566746 22
>>1566694
С чего выёбываюсь-то? Это не локально же, какая разница в таком случае, сколько видеопамяти и какая видюха?
Ну и запускать при твоих вводных маленький квант плотной 70B модели вместо влазящей в видюху MOE - это выглядит как какой-то сорт извращения.
Аноним 30/03/26 Пнд 06:41:40 1566747 23
Почему гемма не может материться?
Аноним 30/03/26 Пнд 08:09:06 1566768 24
image.png 67Кб, 420x505
420x505
Анончики, это кул или кал? стоит ли скачать оламу и потестить. Ваше мнение.
Аноним 30/03/26 Пнд 08:20:06 1566774 25
Аноним 30/03/26 Пнд 08:20:38 1566775 26
Аноним 30/03/26 Пнд 08:57:30 1566800 27
Аноним 30/03/26 Пнд 09:01:11 1566802 28
>>1566768
В голосину блять. Абу открыл для себя аблитерацию.
Аноним 30/03/26 Пнд 09:04:26 1566808 29
image.png 855Кб, 1199x982
1199x982
>>1566802
Анон, не разбираюсь вообще. Даже не понимаю, в чем ты высмеиваешь меня.
Аноним 30/03/26 Пнд 09:16:34 1566829 30
>>1566808
Да ты не при чем тут, мне смешно с Абу (или кто там у него в телеге постит). Расцензуривание моделей / удаление отказов / аблитерация - это всё было с незапамятных времён. Сейчас под любую модель можно найти анценз, а конкретно то, что посоветовала обезьяна - не лучший выбор. 9b - это больше под пекарни без ГПУ (или с каким-то старьем типа 1050ti) и без оперативки. Если у тебя есть хотя бы 12-16 врам и 32-64 рам, то тебе доступны более мощные и умные модели.
Аноним 30/03/26 Пнд 09:41:35 1566847 31
Чзх, прерывается закачка с обнимиморды? Пробовал несколько раз, ровно через час стопает моб закачку. Пришлось нахуй ставить даунлоад манагер как в 2007 нахуй, чтобы скачать 30 гб
Аноним 30/03/26 Пнд 10:00:08 1566854 32
>>1566847
Варение лягушки в чебурнете. ТСПУ перегружены и рубят все подряд. Ночью качай.
Аноним 30/03/26 Пнд 10:01:50 1566855 33
>>1566746
>сорт извращения
Отнюдь. Пишет лучше чем 24/27/35 (я много перепробовал)
Аноним 30/03/26 Пнд 10:03:58 1566858 34
>>1566694
>203.2s
>ответ на ~100 токенов
Как ты ещё жив? Тот же Air пишет не хуже Лламы. Знаю о чем говорю, сидел на тюнах Лламы больше года
Аноним 30/03/26 Пнд 10:06:55 1566861 35
>>1566768
>Анончики, это кул или кал?
Второе. Весь пост - какой-то кринж - наброс для тех кто ничего не понимает в сабже
Аноним 30/03/26 Пнд 10:10:10 1566863 36
>>1566858
>Air
106 который? Я даже первый квант не потяну

>>1566768
Кул, качай. Только лучше версии 27b или 35b. У тебя на картинке сильно отуплённая версия
Аноним 30/03/26 Пнд 10:12:15 1566866 37
>>1566863
>106 который? Я даже первый квант не потяну
Это мое модель, ее потянет даже 16гб гпу если есть оператива, хотя бы 32гб. Если оперативы нет то да, не потянешь увы
Аноним 30/03/26 Пнд 10:19:09 1566874 38
Эх вот бы новенький плотненький 24-32b GLM...
Аноним 30/03/26 Пнд 10:21:09 1566877 39
>>1566874
есть плотненький 123B квенчик, брать будете?
Аноним 30/03/26 Пнд 10:21:56 1566878 40
>>1566877
> квенчик
Нет. Да и нет его
Аноним 30/03/26 Пнд 10:23:38 1566881 41
>>1566878
Как нету? вот он. Darkhn/M2411-123B-Animus-V14.0
Риговички, вперед
Аноним 30/03/26 Пнд 10:24:22 1566882 42
>>1566866
Да не залезет нихуя это в 16+32 разве что под линупсом и прям впритык, в q1. а я дуалбутится не хочу. мб в будущем соберу сервер на эпуке с говноMIшками. но там и эйр уже не нужен будет...
Аноним 30/03/26 Пнд 10:24:53 1566883 43
>>1566881
Это Мистраль/Девстраль, а не Квенчик, дурашка
Аноним 30/03/26 Пнд 10:34:42 1566893 44
>>1566881
>M2411
>M
>Квен
Лицо этого пациента доставьте.
Аноним 30/03/26 Пнд 10:54:40 1566899 45
Посоветуйте какую модель скачать для вката новичку? Я сейчас пробую Qwen3-VL-8B-Instruct-Q4_K_S, но это совсем какой то кал в рп. По железу у меня 16+16
Аноним 30/03/26 Пнд 10:59:39 1566903 46
>>1566899
Квен 3 устарел, все уже на квене 3.5 сидят. Алсо, на моделях ниже 12В можешь и не ждать рп.
Аноним 30/03/26 Пнд 11:00:09 1566905 47
>>1566899
>8B
>Q4
>какой то кал
А что ты ожидал?
Аноним 30/03/26 Пнд 11:05:11 1566908 48
>>1566899
- Ministral-3-14B-Instruct-2512-Q6_K
- AdventureFantasy-24B

- gemma3-27B-it-abliterated-normpreserve-Q4_K_M

- Q3.5-BlueStar-27B-Q4_K_M
- Qwen3.5-27B-HERETIC-Polaris-Advanced-Thinking-Alpha-uncensored.Q4_K_M
Аноним 30/03/26 Пнд 11:05:18 1566909 49
>>1566899
qwen3.5-27B и его файнтюны
Аноним 30/03/26 Пнд 11:06:21 1566912 50
А квен4 когда-нибудь случится?
Аноним 30/03/26 Пнд 11:07:12 1566914 51
IMG4977.jpeg 63Кб, 640x360
640x360
Ну и где? Где ваши отзывы о МОЁ мистральке?
Уже руки чешутся, хочется что-то о ней написать.
Давайте вашего мнения, не стесняемся.
Аноним 30/03/26 Пнд 11:08:02 1566915 52
>>1566914
>МОЁ мистральке
какой / где / что /кто ?
Аноним 30/03/26 Пнд 11:09:12 1566917 53
>>1566915
Которая 120b. Ну новый mistrall small.
Аноним 30/03/26 Пнд 11:09:37 1566918 54
>>1566604
Это. Просто. Охуенно.
Я бы все отдал за такую карточку...
Аноним 30/03/26 Пнд 11:09:42 1566919 55
>>1566899
Пробуй что тебе советуют, а я ещё вот эту порекомендую
https://huggingface.co/mradermacher/WeirdCompound-v1.7-24b-GGUF
6 или 8 квант, какой потянешь. Шестой должен потянуть.
Находи самый интересный и требующий максимум напряга мозгов (AI, не твоих) момент в рп и потом меняй модели и свайпай его, смотри какая больше нравится.
Аноним 30/03/26 Пнд 11:12:24 1566920 56
>>1566903
>>1566905
Скачал вот это.
Qwen3.5-35B-A3B-UD-Q6_K_S.

Получается так
Output generated in 14.91 seconds (42.58 tokens/s, 635 tokens, context 3490, seed 554425236)
Аноним 30/03/26 Пнд 11:14:11 1566921 57
>>1566920
Чел, ванильные квены ниже 255В не очень в рп, это рабочие лошадки. Тебе же сказали что качать...
Аноним 30/03/26 Пнд 11:15:46 1566923 58
>>1566920
Ты бы хоть один аутпут показал, чё тебя там так неустраивает.
Посоветуйте модель-собеседника-учителя Аноним 30/03/26 Пнд 11:17:11 1566925 59
Привет, аноны. Учу казахский язык. Контента на нём почти нет нихуя в отличии от англюсика (англюсик учил так: выучил примерно 1000 слов и основные конструкции, а потом просто в компьютер играл и восстанавливал неизвестные слова из контекста + переводил всё, что непонятно, копя словарный запас. Было легко и удобно), поэтому учиться придётся полноценно. Из учебника за 1й класс и нескольких букварей + видиков, знаю в районе 100-200 слов пока что.

Нужна модель, которая будет со мной общаться на простые темы на казахском и чтобы могла пояснять в процессе диалога, что и почему она написала. Очень желательно, чтобы она не только слова знала примерно, но и была грамотнаяя более менее. Желаетльно, чтобы параметров было немного, чтобы общение шло более менее быстро, а по 1 токену в секунду. Есть 24гб оперативы и норм процесс + видюха rtx 2060супер.

Знаю англюсик на хорошем уровне, поэтому могу общаться на англюсике с моделью, чтобы получать разъяснения и могу понимать разъяснения на англюсике без перехода на русский
Аноним 30/03/26 Пнд 11:17:28 1566926 60
>>1566899
Если тебе не нужен кум и ты никуда не торопишься - то это самый медленный и топовый вариант: https://huggingface.co/mradermacher/gemma-3-27b-it-abliterated-normpreserve-GGUF

Если кум всё же нужен, то https://huggingface.co/unsloth/Mistral-Small-3.2-24B-Instruct-2506-GGUF или ее кумтюны, например https://huggingface.co/mradermacher/M3.2-24B-Loki-V1.3-GGUF или https://huggingface.co/mradermacher/MS3.2-PaintedFantasy-24B-GGUF

То же самое, но чуть глупее и сильно быстрее. Q6 влезет полностью во врам. В кум умеет: https://huggingface.co/unsloth/Ministral-3-14B-Instruct-2512-GGUF

Ну а квен 27b тут и без меня насоветуют. Если выберешь его - заранее подготовься к ебле с джинджей, чат комплишном и распердоливанию адовой цензуры. Ну или к горению от лоботомита-херетика. Модель в целом хорошая, просто не для новичка.
Аноним 30/03/26 Пнд 11:18:39 1566927 61
>сказали качать тюны для рп
>скачал рабочего коня
Ньюфаги... ньюфаги никогда не меняется.
Аноним 30/03/26 Пнд 11:21:02 1566932 62
>>1566925
Учи через корпоратку. Ты тредом ошибся, тебе в асиг.
Аноним 30/03/26 Пнд 11:23:14 1566937 63
>>1566932
>корпоратку
что это?
>>1566932
>асиг
где это?
Я ничего не полнял, что ты написал, если честно, извини.
Аноним 30/03/26 Пнд 11:24:56 1566939 64
image.png 107Кб, 852x487
852x487
>>1566925
квен35 27б вроде справляется с казахским языком, за точность перевода не ручаюсь, но обратный перевод в гуглтранслейте вроде норм
Аноним 30/03/26 Пнд 11:26:34 1566941 65
>>1566937
>ничего не полнял
Тебе бы русский подучить, а не казахский... в общем иди в асрыг, не сри в тред нерелейтедом. На доске найдёшь сам, не маленький.
Аноним 30/03/26 Пнд 11:28:06 1566943 66
Аноним 30/03/26 Пнд 11:30:47 1566946 67
>>1566939
>квен35
спасибо, посмотрю. 27B это многовато, но, мб, 14B или меньше тоже справится
Аноним 30/03/26 Пнд 11:37:59 1566950 68
Аноним 30/03/26 Пнд 11:38:23 1566952 69
>>1566866
Не залезет. В мои 20 врам и 32 рам не влезало. Что уж там говорить, даже когда я к этим 32 ещё 16 накидывал (и это всё равно будет двухканал ддр4), тоже не влезало, точнее, нихуя не работало, потому что одна видюха р104, а если 3060 только оставить, то не лезет. Там же накладные расходы всякие, не только модель. Ну и винда жрет 1,2 врам и 8-12 рам всегда.

Тут только если пробовать на линуксе полностью без графического интерфейса.
Аноним 30/03/26 Пнд 11:47:46 1566958 70
>>1566950
спасибо, тоже попробую. Пока квен 3.5 9B качается.
Аноним 30/03/26 Пнд 11:55:42 1566960 71
>>1566952 @monkey
на 20гб 3090/4090 с exllama v2 70b q4_k_m влезает если контекст до 4к и без фруфру, но скорость как у черепахи. для 8к+ или q5 - только с тензорпараллелем на двухкартах или подкачка в рам, а винда жрёт да. линукс серверный режим + koboldcpp с --gpulayers all --contextsize 8192 и моделью q3_k_m - база для тестов, если терпения хватит 1-2т/с. вики в шапке глянь по offload.
Аноним 30/03/26 Пнд 11:58:08 1566961 72
>>1566960
>вики в шапке глянь
Обычно с этого начинается срачь... тупая монке, разжигает тут.
Аноним 30/03/26 Пнд 12:14:35 1566975 73
>>1566960
Я не тот анон, который из начальной ветки постов был, но как видишь, у меня 3060 + р104, которая с экслламой норм не работает почему-то.

Ну и ты сам показал свои настройки. Ниже 32к контекст смысла ставить нет, если только ты не решил покумить на 8к. Вот только с такой скоростью это не сделаешь.

Плюс, я тестил на эйре. Там даже третий квант не влез. А учитывая, что у меня сата ссд, мне хватило 10 попыток воткнуть его, чтобы отказаться в итоге от этой затеи. Потому что один старт надо ждать минут пять каждый раз.

Ну и линукс.

Вот если бы на 80б-а3б были тюны или аблитерации и сам он не был говном.. была бы сказка.

48б от кими, кстати, хуже вообще всего, что я щупал. Ну логика лучше и контекст, но пишет ужасно.
Аноним 30/03/26 Пнд 12:22:52 1566986 74
>>1566918
Эта карточка - промпт-ассистант для флюкса, кек.
Всё остальное - это результат пресета.
Аноним 30/03/26 Пнд 12:45:32 1567008 75
>>1566914
Хуже любой другой модели в той же весовой категории. Потому что
1. 6б лоботомит
2. Полностью новые датасеты. Там почти ничего не осталось от предыдущих Мистралей, ибо в ЕС начали действовать дополнительные законы о авторском праве, которые ограничивают в том числе тренировку моделей. Потому у нового Мистраля нет знаний о популярных франшизах, персонажах и т.д.
3. Хуевая имплементация в Жоре, плохие скорости. Ну и похуй в общем-то, модель мало кому оказалась интересна. Можешь прочекать стату на обниморде и убедиться
Французы всё, увы
Аноним 30/03/26 Пнд 12:48:54 1567009 76
>>1567008
Чёт грустно. Ну, это были славные времена, на том им и спасибо.
Аригато анон.
Аноним 30/03/26 Пнд 12:49:08 1567010 77
>>1567009
Не за что, уточка. Лечись
Аноним 30/03/26 Пнд 12:54:11 1567012 78
>>1566952
>полностью без графического интерфейса
лубунта должна хуйню жрать по идее, типа 1.5-3 гига оперы и мизер с видюхи
Аноним 30/03/26 Пнд 12:58:56 1567013 79
>>1566768
Обычный децензор сомнительного качества, которых тысячи. Рофлово что такие темы так нормисам заходят.
>>1566914
Как в анекдоте от ненатуралов прячутся.
Хороший апгрейд над прошлым смолом, поумнее и лучше следует контексту, мистралеслоп и кум на месте (вот прямо 1 в 1, может чуть менее слопово), цензура отсутствует как понятие. Может в агентный рп и в целом кодить (вяло), хорошо ориентируясь в доступных инструментов. Общих знаний очень мало по сравнению с конкурентами, но зато с логикой и инициативой все ок. Хорошая моделька в общем.

А все нытье потому что ее до сих пор на жоре не починили, мало того что 100б не к каждому влезет в отличии от прошлых мистралей, так еще и работает с черепашьей скоростью не смотря на активные.
Аноним 30/03/26 Пнд 13:01:24 1567016 80
>>1567013
>А все нытье потому что ее до сих пор на жоре не починили
Глупая нейросенко не может понять, что существует больше одного мнения. Вопрос зачем это использовать когда есть другие модели которые во всем лучше так и открыт
Аноним 30/03/26 Пнд 13:02:02 1567018 81
>>1566768
У мненя на ней луп на лупе залупой погоняет. 24б куку6, епту.
Аноним 30/03/26 Пнд 13:04:12 1567022 82
>>1567018
Хот я ток на русике пробовал с выкл думалкой. Английский лучше наверно.
Аноним 30/03/26 Пнд 13:04:57 1567024 83
>>1567016
Чини детектор, а потом перечисляй
> другие модели которые во всем лучше
Аноним 30/03/26 Пнд 13:09:22 1567031 84
>>1567024
Ладно тебе, не трясись, ты сам подписываешься своей пассивной агрессией ко всему живому
Эйр 106б. Больше знаний, пишет сочно, тот же размер, 12б вместо 6б активных
Немотрон 120б. Все то же самое что Эйр, но еще и бесплатный контекст, единственный недостаток это цензура, но для сфв рп кому-то может зайти
Квен 120б. Все то же самое что Эйр, но еще и бесплатный контекст, единственный недостаток это некоторая сухость в рп, впрочем может фикситься промптами
Аноним 30/03/26 Пнд 13:29:26 1567050 85
>>1567031
> пассивной агрессией
Тебя что-то задело в том посте? Извини, не хотел обидеть. Мне просто кажется что нормальный инфиренс и спокойное мышление доступны уже большинству, и потому люди будут иметь неискаженные мнения. А выходит все наоборот, и часто определяющим фактором в формировании отношения является оцененные перспективы (смогу-не смогу) и самый первый опыт без анализа его достоверности, а не сами качества модели.
> Эйр 106б
Он глупее даже мистральки и на контекстах сыпется, путая роли и делая серьезные ошибки часто, и контекст тяжелый. Как раз ему в рп новый смолл прямая замена. Знаний там действительно больше, потому зависит от карточки.
> Немотрон 120б
Сам про него все сказал, только мягко. А еще стиль непробиваемый.
> Квен 120б
Он больше, медленнее и без промптов может отказывать на минорах и прочем, чего мистраль не делает.

Если что, смолл также требует меньше прочих объема кэша если не замечал.

Ну так где они, модели которые
> во всем лучше
а? Ты ни одной не перечислил, только по отдельным критериям, важность которых меняется от задачи и человека.
Аноним 30/03/26 Пнд 13:36:56 1567059 86
>>1567050
Даже не читал твое эссе, достаточно твоего вывода Ты ни одной не перечислил, только по отдельным критериям, важность которых меняется от задачи и человека., который снова доказывает неприелимость отличного от твоего мнения
Аноним 30/03/26 Пнд 13:38:15 1567061 87
>>1567059
Эталонный лудо-нарративный диссонанс, шизик ущемился с чужого мнения и упрекает в неуважении к своему. Калфобляди они такие.
Аноним 30/03/26 Пнд 13:40:31 1567065 88
>>1567061
>шизик ущемился с чужого мнения
Это ты сделал, сведя всю справедвую критику Мистраля к А все нытье потому что ее до сих пор на жоре не починили
Когда я привел тебе список моделей и аргументацию чем они мне нравятся больше, ты это примерил на свои взгляды и пришел к как всегда ахуительному выводу - я не согласен, значит ты не прав, где модели?
У тебя траблы с головой
Аноним 30/03/26 Пнд 13:44:08 1567069 89
.jpg 257Кб, 1121x689
1121x689
Тп на миллион... охуенно!
Аноним 30/03/26 Пнд 13:46:43 1567074 90
Аноним 30/03/26 Пнд 13:51:24 1567081 91
image.png 25Кб, 356x38
356x38
image.png 8Кб, 143x50
143x50
image.png 13Кб, 188x33
188x33
image.png 11Кб, 130x52
130x52
Аноним 30/03/26 Пнд 13:55:51 1567087 92
Аноним 30/03/26 Пнд 13:57:30 1567089 93
>>1566847
сама обниморда может прерывать если линк протухает
Аноним 30/03/26 Пнд 14:11:29 1567101 94
>>1567050
>>1567031
Горячие нейронные парни, вы еще дуэль тут устройте.

Мне в целом для сверки часов чужое мнение нужно было, потому что мой секстант всё еще настроен на 235 аутиста, ну не выдают ни штепы, минимаксы, немотроны, мелкоквены нужного жирного нарратива.
Хотя быстрыми прогонами лучше всех справился с сложной SFW сценой как раз мемотрон. (Много персонажей, сама локация всратая шизофрения с многомерными лестницами, как на мемной картине Эшера).
Степ через |im_start| соу соу. Прекрасный блок ризонинга даже с NSFW, но всё время пытается сгладить углы, даже если персонаж ебанутая яндерка.
Qwen 27b- Вот тут прям середнячок. Пишет как квены, богата наваливая телесных жидкостей и прочих непотребств. Но йохохо и цензуру мне в задницу.
И мистралька до которой ручки не дошли. Но судя по тому что мнения разняться, надо самому потыкать.
Есть еще минимакс, но это отдельная история. Жду her, без цели и смысла, уверенный что будет говно, но всё равно надежда умирает последней, как мефедроновая шлюха в канаве.
Аноним 30/03/26 Пнд 14:18:50 1567113 95
>>1567081
Там ещё точка из разметки вылетела. Абсолютли дисгастинг, литерали анплеебл.
Аноним 30/03/26 Пнд 14:25:49 1567123 96
Что там гугл за шнягу выкатил? Когда на "гражданке" будет? Так-то с понижением цен можно будет тупо запустить 400б модель на 128 гигах оперативы как будто бы. Или это мрии?
Аноним 30/03/26 Пнд 14:27:22 1567124 97
Как ограничить ебанного лоботомита? Иной раз он начинает писать ответ и пишет гигансткую простыню. Пишет и пишет, в итоге скатываясь в шизу по мере ответа.
Аноним 30/03/26 Пнд 14:28:50 1567127 98
>>1567124
Просто укажи максимальную длину ответа. В таверне, лмстудио и в кобольде эти настройки точно есть.
Аноним 30/03/26 Пнд 14:29:13 1567131 99
Аноним 30/03/26 Пнд 14:35:18 1567138 100
Не понял. А где эта опция в группе таверны?

Natural Order

Tries to simulate the flow of a real human conversation. The algorithm is as follows:

Mentions of the group member names are extracted from the last message in chat.

Only whole words are recognized as mentions! If your character's name is "Misaka Mikoto", they will only activate on "Misaka" or "Mikoto", but never to "Misa", "Railgun", etc.

Unless the "Allow Self Responses" setting is enabled, characters won't reply to mentions of their name in their own message!

Characters are activated by the "Talkativeness" factor.

Talkativeness defines how often the character speaks if they were not mentioned. Adjust this value on the "Advanced Definitions" screen in the character editor. Slider values are on a linear scale from 0% / Shy (character never talks unless mentioned) to 100% / Chatty (character always replies). The default value for new characters is 50% chance.

A random character is selected.

If no characters were activated at previous steps, one speaker is selected randomly, ignoring all other conditions.

По-алфавиту что ли???? Это че за дебилоидный перевод такой?
Аноним 30/03/26 Пнд 14:38:29 1567142 101
>>1567087
Скрин с паблика Двач в ТГ.
Аноним 30/03/26 Пнд 14:50:06 1567158 102
image.png 326Кб, 480x457
480x457
>>1567131
>А вот на эксламе...
>Че это?
О, Экслама... Недосягаемая мечта многих. Десятки анонов сгинули, пока пытались прикоснуться к ней. Говорят, она исполняет желания. Говорят, там всё, что нам нужно. Скорость выше, чем на Лламе, скорость на контексте не падает... Сои нет, совсем! Представляете? Можете в такое поверить? Там... Там Квены3.5 не рефузят никогда. Там кванты... Ох, тамошние кванты, QTIP, они столь далеки от того, что под капотом у доступных всем Ггуфах. Поговаривают, что тамошний Q3 (~3bpw) квант сравним с 4-4.5bpw на Лламе! А это, на минуточку, Q4_K_M, обычно. В стародавние времена были ходоки, которые ее видели, Эксламу эту, и возвращались к нам. Так они говорили. Давно не слышно о них ничего, правда... Один вот только, в углу сидит, с ригом своим, да приговаривает под нос себе: "Жора... Жора опять в Кванты насрал... Как хорошо, что я кручу Квен на Эксламе..." То и дело у него спрашивали, как ее найти - да ничего не ответил мужик. Сидит, поникший, все время с бутылкой и лисоженой на аватарке, да трындит одно и то же. Иногда злится. Ну да, о чем это я... Ах, да. Экслама, эта, поговаривают, работает через tabbyAPI. Тредовичок местный даже когда-то кванты делал, пока его-мечтателя, почитателя Леннона, не изгнали за человеколюбие. Говорят, tabbyAPI этот может обрабатывать параллельные запросы, более гибок в настройках шаблонов, да все как-то у него не ладится с инструментами. Что там чертовщина - не разберешь, я в это не лезу. Я человек простой, мне бы покой на душе найти... Ну, в общем, у меня только 16гб видеопамяти, потому найду я эту Эксламу аль нет... Все побоку. Туда отправляются те, кто всю модель в видеопамять могут поместить. А возвращаются совсем немногие. Кто-то посреди дороги сворачивает, проклиная всех и вся, что поверили в эту мечту. Такая она вот, Экслама эта. Для каждого своя.
Аноним 30/03/26 Пнд 14:53:16 1567162 103
image 243Кб, 800x800
800x800
Аноним 30/03/26 Пнд 14:58:55 1567168 104
>>1567101
Это какой у тебя квен 27б наваливает телесных жидкостей? Он сух как пизда моей бабки. Чтобы он начал такое выдавать, ему нужен систем промпт по телесным жидкостям на 2к токенов, который бы в нюансах разъяснял, когда, что и где должно брызгать и какой контекст должен этому сопутствовать, чтобы уровень брызг определялся верно для каждого персонажа — от уровня недотроги до фифи. Вот тогда пишет близко к мистралю и хочет, чтобы ты залил его горячими, толстыми, белыми веревками, пока он кричит твоё имя, а ты целуешь шейку его матки.
Аноним 30/03/26 Пнд 14:59:21 1567169 105
Как сделать чтобы другие персы не просачивались в сообщения чара? А то нейронка в своем ответе и других пихает. Почему?
Аноним 30/03/26 Пнд 15:01:38 1567174 106
image 158Кб, 842x817
842x817
Вот такая хуйня выходит.
Аноним 30/03/26 Пнд 15:02:48 1567175 107
Аноним 30/03/26 Пнд 15:03:40 1567178 108
>>1567175
А без свапа никак? На чат комплишен такое же бывает?
Аноним 30/03/26 Пнд 15:05:57 1567181 109
>>1567174
>пока я тебе морду не набью
Мда...
Аноним 30/03/26 Пнд 15:07:19 1567185 110
>>1567178
на чат комплишене так тоже работает. там просто первый системный промпт меняется на ту карточку который отвечает в данный момент времени + все предыдущие сообщения минус чужие мысли.

Склеивание карточки я хз зачем оно нужно, оно просто есть и как ты видишь - иногда протекает
Аноним 30/03/26 Пнд 15:07:22 1567186 111
>>1567174
Я человек простой, вижу насилие в логах - не помогаю. Шоб батя тебя так пиздил, малой, дабы ты понял что так делать не надо ни ирл ни в фантазиях
Аноним 30/03/26 Пнд 15:07:38 1567187 112
>>1567181
Ну русик хромает иногда. Но зато хоть не сойжак-гемма.
Аноним 30/03/26 Пнд 15:09:24 1567189 113
>>1567181
а я тоже так говорю...
Аноним 30/03/26 Пнд 15:09:33 1567190 114
>>1567186
Дя просто тестирую нейронку насколько она круто и креативно может ругаться и материться, чего такого то.
Аноним 30/03/26 Пнд 15:17:35 1567204 115
>>1567186
>насилие
Значение знаешь?
Аноним 30/03/26 Пнд 15:18:50 1567208 116
Аноним 30/03/26 Пнд 15:22:20 1567212 117
>>1567142
но там ни намека на это
Аноним 30/03/26 Пнд 15:24:15 1567215 118
>>1567208
Может еще чайник будешь защищать?
Аноним 30/03/26 Пнд 15:24:42 1567216 119
>>1567215
Быстро ты слился. Походу правда не знал значение но быканул
Аноним 30/03/26 Пнд 15:27:19 1567221 120
image.png 19Кб, 467x87
467x87
правильно зделол?
Аноним 30/03/26 Пнд 15:37:35 1567233 121
image 158Кб, 842x817
842x817
>>1567186
Полегчало? Что только не сделаешь ради развития сюжета!
Аноним 30/03/26 Пнд 15:38:48 1567235 122
image 65Кб, 795x417
795x417
Аноним 30/03/26 Пнд 15:40:02 1567236 123
.png 736Кб, 3789x1869
3789x1869
.png 328Кб, 3784x1914
3784x1914
.png 212Кб, 1692x1906
1692x1906
>>1567016
Не, ты меня с кем-то другим путаешь. В спец. олимпиаде по выбору лучшего движка/модели не учавствую, есть занятия поинтересней, особенно с подписочкой клода - можно наконец дать своему внутреннему Кириллу разгуляться.
Аноним 30/03/26 Пнд 15:50:13 1567247 124
Аноним 30/03/26 Пнд 15:55:20 1567255 125
>>1567247
В процессе написания пока. Если куча головняка ирл не будет, может даже однажды его до ума доведу и опубликую.
Аноним 30/03/26 Пнд 16:09:55 1567274 126
>>1567168
Я не тот анон, но 3-й Еретик 27 квена вполне себе может и в мат и в матку. Правда и лоботомирован на русике сильнее других.
Аноним 30/03/26 Пнд 16:22:23 1567285 127
image 1269Кб, 430x357
430x357
>>1567236
О, ещё один. Ну, удачи тебе в запиле и вдохновения =))
Аноним 30/03/26 Пнд 16:24:43 1567287 128
image 417Кб, 1280x891
1280x891
>>1567186
Ты либо жЫрный, либо тупой, либо и то и другое вместе, и совершенно точно душный. Выйди траву потрогай, весна в Москве.
Аноним 30/03/26 Пнд 16:33:42 1567302 129
Какой минимальный порог железа для вката в 120б калки?
Аноним 30/03/26 Пнд 16:37:42 1567307 130
>>1567069
>кхорн, нургл, берсеркеры, культисты
Величину лорбука для такого аутпута сымаджинировали?
Аноним 30/03/26 Пнд 16:41:42 1567314 131
>>1567302
24 VRAM 96 RAM . Для MOE 120 естестественно. Есть аноны пытающиеся и на 16 VRAM 96 RAM, но то такое.
Аноним 30/03/26 Пнд 16:43:12 1567317 132
Какой фронт/форк жоры выбрать для рабочих задач, не касающихся ролевок? Оламу и лмстудио вы тут какаете, но что тогда взять вместо них? Посмотрел на гите, там дохуя чего вышло, но ничего итт не упоминалось.
Аноним 30/03/26 Пнд 16:43:53 1567319 133
Аноним 30/03/26 Пнд 16:44:49 1567322 134
>>1567317
Для каких именно рабочих задач? llamacpp или OpenWebUI для чатика; всякие экстеншены для VScode (Roo Code, Cline) для кода; OpenClaw для агентов (есть отдельный тред)
Аноним 30/03/26 Пнд 16:47:23 1567323 135
>>1567322
Кодинг, работа с текстом, дефолтный ассистент для вопросов-ответов.
Аноним 30/03/26 Пнд 16:48:11 1567324 136
>>1567319
Чё там? Годнота или как обычно?
Аноним 30/03/26 Пнд 17:06:15 1567357 137
>>1567324
От них никогда не было годноты, так что ты сам догадаешься какой ответ.
Аноним 30/03/26 Пнд 17:33:15 1567398 138
>>1567081
А что с этим не так?
Аноним 30/03/26 Пнд 17:41:06 1567404 139
Аноним 30/03/26 Пнд 17:49:54 1567411 140
Аноним 30/03/26 Пнд 17:52:40 1567418 141
image 194Кб, 793x854
793x854
Бля, гемма нормпрезерв охуенна. Отлично чаров держит и отвечает круто. Лучше предыдущей старой расцензуренной намного.
Аноним 30/03/26 Пнд 17:55:58 1567426 142
>>1567065
> справедвую критику
Надо было явно пройтись по шизоеториям с подсчетом активных параметров и бреду по датасету когда он протухший и чистейший мистралеслоп? Хотя второе уже субъективщина. Ты зря принял на свой счет, регулярные срачи и доски типа политача вызывают манию преследования. По модели молчание или редкое нытье просто из-за сложностей с запуском о чем и написано, как починят - пойдут активнее обсуждения.
А дерейлы про взгляды смешны, спизданул херню >>1567016 которую не обосновать, а когда носом ткнули понеслась.
>>1567101
Разные модели под разные сценарии - база, а если тебе нравится конкретная модель под конкретный сценарий - не стоит ориентироваться на других. Лучше проанализируй чем именно она так хороша и сам поделись, и из мнений смотри на что обращают внимание если подробно.
> Жду her
Точно, уже подзабыли все про нее. Вот бы выкинули бы вместе с 2.7.
Аноним 30/03/26 Пнд 17:57:25 1567429 143
>>1567418
Норм-пресерв может начать вилять и пытаться избегать неприятных тем, хотя прямо в отказы не уходит, и да, мозги пострадали как будто прям намного меньше.
Аноним 30/03/26 Пнд 17:58:37 1567432 144
>>1567426
Пришел пришел барнабус батенька, всех разьебал
Аноним 30/03/26 Пнд 18:01:31 1567437 145
>>1567236
Красивое
>>1567317
Любой, опенвебуи как самый жирный. Но сейчас чистый чатик не в тренде, вот сюда >>1560761 (OP) лучше загляни.
>>1567319
27б эмбеддинг, ахренеть.
Аноним 30/03/26 Пнд 18:07:36 1567440 146
17446471760840.jpg 133Кб, 736x730
736x730
Братья во дрочении. Очень давно не заходил к вам. Подскажите пожалуйста, появился ли новый ёба аналог омнино опус магнум? Меня в принципе и он устраивает но если на горизонте есть что то ебейшее то поделитесь пожалуйста.
Аноним 30/03/26 Пнд 18:10:17 1567443 147
>>1567440 => >>1566908
Менестрель попробуй, он норм. Отсказов не ловил, но если ты его таки затриггеришь, то есть и анцензы на него.
Аноним 30/03/26 Пнд 18:13:21 1567446 148
image 200Кб, 813x878
813x878
>>1567429
Чета орууу с этих диалогов.
Аноним 30/03/26 Пнд 18:24:52 1567450 149
чет тестю квены плотненькие и чет всё говно какое то...
Аноним 30/03/26 Пнд 18:30:44 1567453 150
>>1567450
Я протестил оч много, из всего только writer (не v2) немного порадовал. Остальное совсем жиденькое и уж точно не на уровне Геммы, местами даже похуже MS3.2
Аноним 30/03/26 Пнд 18:32:08 1567454 151
>>1567087
По тексту и стилю помойки палятся
Аноним 30/03/26 Пнд 18:47:29 1567463 152
>>1567398
"Это..." - прошептала Элара - "Не просто текст... а сообщение. Что-то... живое! Это квенослоп! Ползучий квенослоп!
И это наш будущий
дом."
Аноним 30/03/26 Пнд 18:51:20 1567468 153
>>1567463
Гемма пишет точно так же, ну
Аноним 30/03/26 Пнд 18:52:25 1567470 154
>>1567450
Кванты бери пожирнее и без иматрикса. Слопа поменьше будет.
Аноним 30/03/26 Пнд 18:59:20 1567475 155
uYJuMAXLBeCVZey[...].jpg 105Кб, 1200x507
1200x507
(слопа, конечно же, меньше не стало)
Аноним 30/03/26 Пнд 19:02:34 1567477 156
Какая же парашная система сортировки в таверне. Сначала создай тег, затем открой чат, потом протегай персонажа прям в чате, закрой чат, открой поиск, введи ебоманый тег, выбери этот тег нахуй блять сколько можно а сколько можно, и только потом таверна позволит выбрать тебе найти персонажа по тегу который тебе уже нахуй не нужен потому что ты заебался наглухо

Какой ебанутый фашист это придумал?
Аноним 30/03/26 Пнд 19:03:42 1567478 157
>>1567477
Таверна в некоторых местах эталон термина: насрал в коде и костыли.
Аноним 30/03/26 Пнд 19:08:05 1567482 158
>>1567477
Да там ного всякого кала. Невозможность многих операций когда идёт генерация например. Даже тупо карточки другие не посмотреть или чаты
Аноним 30/03/26 Пнд 19:10:48 1567484 159
>>1567477
>создай тег, затем открой чат, потом протегай персонажа прям в чате, закрой чат, УДАЛИ НЕНУЖНЫЙ ТЕБЕ ЧАТ КОТОРЫЙ ТЫ СОЗДАЛ ТОЛЬКО РАДИ ТОГО ЧТОБЫ ПОСТАВИТЬ ТЕГ НА ПЕРСОНАЖА ЕБАТЬ СПАСИБО НАХУЙ, открой поиск, введи ебоманый тег, выбери этот тег
Дополнил

>>1567478
Почему нельзя просто создать папку и закинуть туда персонажей и потом щёлкать по папкам, а не по ебаным тегам? Кто вообще исползует теги в 2026 вместо папок? Линуксоиды?
Аноним 30/03/26 Пнд 19:15:27 1567488 160
>>1567477
В чат заходить необязательно. При импорте автоматически подтягиваются вложенные в карточку теги. Хз, как по мне оч удобно
Аноним 30/03/26 Пнд 19:18:12 1567492 161
Аноним 30/03/26 Пнд 19:20:22 1567494 162
>>1567484
>просто создать папку и закинуть туда персонажей и потом щёлкать по папкам
Это какая-то большая обида разраба таверны, и он сказал папок нибудет никада.
Аноним 30/03/26 Пнд 19:22:57 1567498 163
>>1567494
Пиздец. Его менюшка тегов это кромешный пиздец. А что если у меня 1к чариков и на них два десятка тегов, м? Вот было бы у меня в менюшке справа два десятка папок, то мне было бы норм, но два десятка тегов в тонюсенькой строчке размером с член комара это нахуя вообще так делать? Ну вот чтобы что? Чтобы у тебя было максимум 10 чариков и 2-3 тега на них?
Ладно, хуй с ним с обиженным разрабом. Может кто-то создал какой-то экстеншен для таверны с удобной сортировкой?
Аноним 30/03/26 Пнд 19:26:16 1567500 164
Погонял значит мое квена 35 и не могу понять, за что его так нахваливали. Быстрый? Ну да, быстрый. Только толку, если мозгов особо нет. Ризонинг вообще бесполезен - увеличивает время генерации, тратит впустую токены, и выдает почти такой же ответ, что и без него. Более того, в процессе размышлений может словить шизу и отойти от основной задачи. Пишешь в запросе, условно, мне нужен такой-то код, который будет делать такие-то вещи. Всё, ничего более. Без мышления он это и делает (почти всегда), вместе с размышлениями, начинает сам себе объяснять каждую строчку и потом тащит это в ответ, объясняя мне каждую строчку. Но кроме этого, часто он начинает подключать вообще ненужные библиотеки и тратить время на них, потому что в своей цепочке он выяснил что "вообще-то это можно сделать иным способом, похуй что там хочет этот дурачок, он ничего не понимает" и выдает мне полотно которое работает, но работает не так, как его попросили.

Ну а вижен просто хорош. Пока много его не тестировал, но из 20 пикч которые я ему скормил, он каждую нормально обработал, не упустив ключевых деталей. На некоторых даже верно указал локацию съемки, на других приблизительно, но ни разу не ошибся. Такие уот мысли.
Аноним 30/03/26 Пнд 19:27:30 1567502 165
Аноним 30/03/26 Пнд 19:28:23 1567505 166
>>1567498
У меня 2500 было (неразобранных/несортированных), и да, это это адЪ.
Аноним 30/03/26 Пнд 19:56:26 1567521 167
1705016019170.png 8Кб, 134x198
134x198
>>1567494
У меня есть папки. Это не стандартная фича? У меня прост еще расширений куча, но так не помню чтобы для этого что-то ставил
Аноним 30/03/26 Пнд 19:57:38 1567523 168
>>1567521
Найди пожалуйста то самое расширение с папками
Аноним 30/03/26 Пнд 19:58:09 1567526 169
>>1567502
Не очень локально получается. Подхват онлайна может залезть в безопасность.

мимо
Аноним 30/03/26 Пнд 20:02:04 1567531 170
1676467245546.png 47Кб, 567x343
567x343
1725176306449.png 9Кб, 298x72
298x72
>>1567523
У тебя нет этих кнопок?
там нада вкл чтобы тег отображался как папка
Аноним 30/03/26 Пнд 20:03:11 1567532 171
Так, и где там эта ваша гемма 4 или хотя бы слухи о ее капабилитиз?
Аноним 30/03/26 Пнд 20:05:10 1567533 172
>>1567531
> там нада вкл чтобы тег отображался как папка
У меня кстати, если включить эту опцию, то появляется лаг видео при обновлении бровзера.
Аноним 30/03/26 Пнд 20:07:51 1567534 173
image 112Кб, 640x640
640x640
>>1567532
Ебала реддиторов и тредовичков представили, когда выяснится, что на арене не гемма, а очередной ноунейм-китаец, в которого дистиллировали гемини и теперь он считает себя моделью от гугла?
Аноним 30/03/26 Пнд 20:08:19 1567535 174
>>1567531
Но это же и есть теги, нет? Вон сверху написано тег манагемент. А персонажей в папки как засунуть чтобы они лежали списком в правой панели?
Аноним 30/03/26 Пнд 20:09:52 1567539 175
>>1567535
Так создай теги с названием нужных папок. Это же просто способ отображения а не структура файлов
Аноним 30/03/26 Пнд 20:12:14 1567540 176
>>1567539
Ну так я же об этом выше написал. Что нужно создать тег а потом тегать персонажей вручную если у них нет тегов
Папка с персонажами тут причём? Я же про папку спросил, а не про теги
Аноним 30/03/26 Пнд 20:13:52 1567543 177
>>1567534
Ни когда такого не было
Аноним 30/03/26 Пнд 20:14:25 1567544 178
>>1567540
Они работают как папки в таверне, если включить опцию. Я так и не понял в чем разница тегать и перетаскивать в папочку аки в проводнике
Аноним 30/03/26 Пнд 20:16:02 1567545 179
>>1567544
Погоди, а как именно ты перетащил персонажа в папку?
Аноним 30/03/26 Пнд 20:19:52 1567549 180
>>1567545
Я говорю что протегать быстрее, чем пытаться перетаскивать в веб интерфейсе с одним окном
Аноним 30/03/26 Пнд 20:23:24 1567550 181
>>1567549
Разница в том чтобы не тегать вручную чариков у которых нет тегов по тем или иным причинам, а просто засунуть их в папку
Аноним 30/03/26 Пнд 20:27:10 1567553 182
>>1567550
Ну ок, но я так и не уловил отличия между закинуть в папку и добавить тег. Разве что экспортировать с тегками потом надо для публикации
Аноним 30/03/26 Пнд 20:32:30 1567560 183
>>1567553
В смысле не уловил отличия? Закинуть в папку драгндропом прям из листа персонажей или сидеть вручную проставлять теги а потом создавать под них отдельную папку это равноценные для тебя вещи?
Аноним 30/03/26 Пнд 20:33:18 1567562 184
1.png 3539Кб, 2686x7012
2686x7012
2.png 2569Кб, 2686x5186
2686x5186
>>1567453
> writer (не v2) немного порадовал
Несколько раз в треде хвалили Writer, так что решил и я попробовать. Ух, давно таких эмоций не испытывал.

Дело было так: Writer 27б Q6 mradermacher (но тут не суть, я тестил и Бартовского, в целом одинаково), лайтовый ром-ком слайс оф лайф сценарий, наиграл ~15к контекста с исключительно соответствующим наполнением: шутки, подколы, нелепые ситуации, никакой драмы или саспенса. Оккультному клубу (группа бездельников) поручили провести расследование в библиотеке, потому что кто-то пустил слушок, что там после закрытия бродит привидение (на самом деле это птицы, которые поселились на чердаке). По ходу дела Квен, как он часто это делает, ухватился за конкретную вещь из контекста и не хотел ее отпускать - у одного из персонажей постоянно приходили уведомления на телефон. Меня это достало, и я решил спросить в чем дело. Тут и понеслось: вопреки контексту и инструкциям, где прямо указано, куда двигать историю, все превратилось ни то в триллер, ни то в паранормальный хоррор. Как выяснилось, за студентами следят, прислали какое-то проклятое видео прямиком из The Ringu. Это очень смешно. Со стороны может не понять, но когда рандомно ловишь такой делирий - это лучшее. В последний раз у меня такое было на каком-то из тюнов Мистраля 24б год назад, когда ночная беседа с скучающей девушкой-заправщицей превратилась в хоррор уровня Алана Уэйка, с паранормальным туманом и тенями, что вызывают амнезию. Такое не запромптить.

А если серьезно, 27б Квены пока что скорее радуют. Потенциал точно есть, даже инструкт радует, как в свое время QwQ 32б. Если получим тюн уровня Сноудропа, но постабильнее - буду рад.
Аноним 30/03/26 Пнд 20:36:01 1567566 185
>>1567562
>ночная беседа с скучающей девушкой-заправщицей превратилась в хоррор уровня Алана Уэйка, с паранормальным туманом и тенями, что вызывают амнезию
Это что-то плохое что ли?
Аноним 30/03/26 Пнд 20:36:26 1567567 186
>>1567560
Тег надо только один добавить с названием папки. Тебе наверно лучше попробовать, я уже утомился, это не слишком сложное дело и у меня полное ощущение что ты не понимаешь как работает интерфейс
Аноним 30/03/26 Пнд 20:39:54 1567571 187
>>1567566
Смотря как посмотреть. В моем случае - совсем нет, это наоборот одно из лучших воспоминаний. К сожалению, я уже и не вспомню какой именно это был тюн, но было весело. Просто нужно быть открытым к такому. Это не нормальное поведение модели, не фича, а баг. Когда у тебя есть много тысяч контекста с преобладающим в определенную сторону контекстом и ясно изложенные инструкции, задающие жанр, такого быть не должно. Потому я и говорю - такое не запромптить, и похожий результат не получить на стоковых инструкт моделях.
Аноним 30/03/26 Пнд 20:40:06 1567572 188
Аноним 30/03/26 Пнд 20:41:54 1567573 189
>>1567572
Какая-то шиза, все еще рекомендую разобраться в интерфейсе
Аноним 30/03/26 Пнд 20:43:46 1567574 190
>>1567573
Ну так перепрочти, если такой тупой
Аноним 30/03/26 Пнд 20:44:04 1567576 191
>>1567571
>Это не нормальное поведение модели, не фича, а баг.
Кто тебе сказал такую глупость? Это как раз фича врайтера, да и блюстара тоже - они пытаются тебе историю создать, а не просто чатик. Хз зачем ты взял сюжетные тюны, если не хочешь видеть сюжеты.
>Когда у тебя есть много тысяч контекста с преобладающим в определенную сторону контекстом
То есть в контекст насрал ты, добавив лишние детали, но виновата модель которая за эти детали зацепилась?
Аноним 30/03/26 Пнд 20:45:09 1567579 192
>>1567574
Ты наверно не обнаружил кнопку bulk edit все что я могу сказать. Попробуй еще раз, интерфейс не такой сложный
Аноним 30/03/26 Пнд 20:53:46 1567585 193
>>1567579
Лучше бы просто объяснил ньюфагу как пользоваться фичей, зач как мудло себя вести, если видишь, что чел затык словил?
>>1567574
Булкой квадратик с карандашиком над списком персонажей обмажь нужных тебе чариков, выставь им общий тег. Они у тебя сложатся в папочку. Камень я не дам. Папочку надо создать.
Аноним 30/03/26 Пнд 21:00:23 1567590 194
>>1567585
>Лучше бы просто объяснил ньюфагу как пользоваться фичей, зач как мудло себя вести, если видишь, что чел затык словил?
Я даже картинки прикладывал, есть предел терпению
Аноним 30/03/26 Пнд 21:02:10 1567591 195
Аноним 30/03/26 Пнд 21:04:17 1567592 196
>>1567590
Иисус терпел и нам велел. Хочешь сделать благо - делай до конца.
Аноним 30/03/26 Пнд 21:04:26 1567593 197
Какой же Квен говнюк - вычисляет юзера в полотне неформатированного контекста по незаполненной карточке! Стоило минимально тегами обрамить персону - все пропал USer - стал персонажем.
Аноним 30/03/26 Пнд 21:05:23 1567594 198
>>1567576
> Это как раз фича врайтера, да и блюстара тоже - они пытаются тебе историю создать, а не просто чатик.
Любая модель пытается историю создать, а не просто чатик, если ее так запромптить и использовать. Но в данном конкретном случае это классическое игнорирование инструкций и разворот истории на 180 градусов. Собственно, я и не против и мне даже понравилось. Ты разглядел в моем посте негатив?
> То есть в контекст насрал ты, добавив лишние детали
Чем же я таким насрал в контекст? Вот всегда так, по ту сторону экрана всем виднее, что у кого в семплерах, промптах, контексте. Ругаться не хочу, у тебя может плохой день выдался. Отдохни хорошенько.
Аноним 30/03/26 Пнд 21:05:24 1567595 199
>>1567502
Выглядит охуенно, спасибо. Кажется это идеальная штука для меня. Ещё и чуб с уборщиком подхватывает
>>1567585
Хосспади, какой же я слепошарый, пиздец просто... спасибо!
>>1567590
Я тебя когда спросил про то как карточки в папку добавить ты мне чё ответил? Хуйню. Вот хуйню в ответ и получил. Чел выше ответил заебись даже без скринов
Аноним 30/03/26 Пнд 21:08:02 1567597 200
>>1567595
На здоровье. Только вон ту штучку, что сама подхватывает сайты и имеет доступ к твоим папкам, юзай с осторожностью.
Аноним 30/03/26 Пнд 21:11:34 1567600 201
image.png 17Кб, 271x132
271x132
>>1567591
Ого, сам клауде в контрибуторах
Аноним 30/03/26 Пнд 21:12:59 1567601 202
>>1567595
>Я тебя когда спросил про то как карточки в папку добавить ты мне чё ответил? Хуйню. Вот хуйню в ответ и получил. Чел выше ответил заебись даже без скринов
Вот и благодарность
Аноним 30/03/26 Пнд 21:19:20 1567608 203
А если я по незнанке сохранял карточки с убощика без импорта, просто вручную, то всё, я проебал теги с них навсегда? Мне теперь никак их не протегать заново без ебли с внешними ссылками на их страницы? Ну что за пиздец а...
Аноним 30/03/26 Пнд 21:21:06 1567612 204
>>1567594
>Любая рп модель пытается историю создать
Пофиксил тебя. А у врайтера это выкручено на максимум. Он пишет историю даже там, где персонаж должен просто снять трусы. Так что вина на твоей стороне, а не на стороне модели.
>Ты разглядел в моем посте негатив?
Я? Нет. Каким образом? Мне самому нравится, когда модель начинает подкидывать в аутпут какие-то посторонние штуки, которые можно использовать для продолжения истории. Но ты как будто требуешь строгий ассист в истории от модели которая создана мягко говоря для другого. Для исекаев сисюнь.
>Чем же я таким насрал в контекст?
Ты же сам сказал, что телефоном. Телефон вещь многофункциональна. Модель воспринимает его как возможную опцию для продолжения сюжета. В чём не права? Если ты так стриггернулся на мобильник, нужно было удалить его из контекста, например выбросить, прямо сказав модели, что телефон отправился нахуй.
>Вот всегда так, по ту сторону экрана всем виднее, у кого какой день выдался
Оставляю тебя с твоей же шпилькой наедине.
Аноним 30/03/26 Пнд 21:30:04 1567622 205
>>1567612
> Так что вина на твоей стороне, а не на стороне модели.
Ого. А я виновного искал где-то? Сказал, что модель плохая? То, что она не следует инструкциям вовсе не говорит, что я ее оцениваю негативно. Ты воюешь сам себе врага придумал и с ним же воюешь. Нечем заняться?
> Но ты как будто требуешь строгий ассист в истории от модели которая создана мягко говоря для другого.
Нет, я хочу чтобы модель на системную инструкцию "This is a lighthearted slice of life, rom-com, tension-free story..." с 15к соответствующего ролеплея не сводила аутпуты к хоррору. Это игнорирование инструкций, а не креатив.
> Оставляю тебя с твоей же шпилькой наедине.
Лучше бы тред от себя освободил, чем генерировать негатив на ровном месте.
Аноним 30/03/26 Пнд 21:35:42 1567625 206
>>1567622
Чел, ты тут не первый день, чего удивляешься? Срачи на ровном месте итт это классика. Большинство 12-24b васянотюны в лоботомитоквантах гоняют с целью получить заветное ты меня ебешь, а ты тут про инструкции
Аноним 30/03/26 Пнд 21:36:02 1567627 207
>>1567534
Больше не меньше, про жлм тоже такое говорили но норм же моделька.
>>1567622
> на системную инструкцию "This is a lighthearted slice of life, rom-com, tension-free story..." с 15к соответствующего ролеплея не сводила аутпуты к хоррору
А там нет каких-нибудь моментов в истории, имен или чего-либо релейтед хоррору? Мимо если что.
Аноним 30/03/26 Пнд 21:37:16 1567631 208
image.png 41Кб, 246x708
246x708
>>1567591
Пока ток положительные эмоции.
Сразу есть импорт из таверны всего что только можно. Можно лорбуки юзать с чаткомплишном. Поддержка агентов. У всех карточек есть дохуя параметров поиграться. Немного больше времени занимает начать чат. ЮИшка интуитивно понятная.
Советую попробовать.
>>1567600
Не видел, нихуя соби. Но я так понимаю это популярная личность, пилила промпты для рп и бложик ведет.
Аноним 30/03/26 Пнд 21:39:53 1567635 209
>>1567622
>Лучше бы тред от себя освободил, чем генерировать негатив на ровном месте.
Да, было бы хорошо, если ты освободил тред от себя и не генерировал негатив на ровном месте.
>Нет, я хочу чтобы модель на системную инструкцию
Слайсуха в хоррор с полным погружением. Что не нравится?
>This is a lighthearted slice of life, rom-com, tension-free story
А должно быть. "You should keep lighthearted slice of life, rom-com, tension-free story". Ты же даёшь инструкцию, а не описываешь старт. Сам себе в промт насрал, и разводишь тут негатив.
Аноним 30/03/26 Пнд 21:41:03 1567638 210
>>1567625
Даже добавить нечего к твоим словам. Вангую что сейчас до промпта или еще чего-нибудь докопается, чтобы дальше вонять
>>1567627
> А там нет каких-нибудь моментов в истории, имен или чего-либо релейтед хоррору?
Неа, несмотря на название "Occult club" в промпте вообще ничего связанного с оккультизмом или соседствующими темами. Это пустая комната, в котором бездельники пьют чай. В ней нет ничего кроме чайных сервизов и плюшевых игрушек (литералли). И конечно, в дополнение к инструкциям нет никаких трагичных бекстори или чего-нибудь такого. Просто выроллил. Это было весело, мне понравилось. Иногда такое безумие заходит как надо.
Аноним 30/03/26 Пнд 21:42:08 1567639 211
>>1567591
>Кто-то уже попробовал? Попозже и сам заценю отпишусь.
Пробовал его RPG-экстеншн для Таврены - идеи хорошие, но у Таверны просто нет таких функций. А у агентов есть. Заценим.
Аноним 30/03/26 Пнд 21:42:34 1567640 212
>>1567638
Ты и сам воняешь нихуёво, серун блять
Аноним 30/03/26 Пнд 21:43:11 1567642 213
>>1567638
>Это пустая комната, в котором бездельники пьют чай.
Лол, как то скачал карточку чайного клуба.
А там людей ебут. И вовсе не по их воле.
Аноним 30/03/26 Пнд 21:46:14 1567646 214
>>1567627
Вполне возможно что это GLM 5.1 Air. Зайки очень любят обучать свои модели на слопе Гемини. А учитывая вот это >>1566456 я почти уверен, что это их модель. Гемма бы никогда такое не написала, она приличная девочка.

Сюка, надеюсь и то и другое выйдет раньше ебучего чебурнета.
Аноним 30/03/26 Пнд 21:46:18 1567647 215
>>1567608
Не совсем. Если ты в таверне забиваешь тег и тебе выпадает желаемый персонаж, то тег у него сохранён. Просто у тебя импорт слетел. Попробуй подцепить с сайта, если это для тебя так важно.
Аноним 30/03/26 Пнд 21:47:14 1567648 216
>>1567646
Учитывая размеры 5глм, то не сыпь соль на рану ram.
Аноним 30/03/26 Пнд 21:49:55 1567651 217
>>1567562
Слышь, про квен поуважительнее
Инструкциям он блять не следует
У нас в треде за такое убивают
Аноним 30/03/26 Пнд 22:02:10 1567662 218
>>1567638
Может оно просто срандомило в один момент и в посте какие-то предпосылки к этому выплюнуло, а ты не придал значения? Или же это происходит стабильно но разных чатах?
>>1567646
Да хоть yi или llama-5, главное чтобы хорошее было. Размером бы только ~200б и умное с вижном, вот это было бы хорошо.
>>1567651
За квены и двор стреляю в упор! Там же тюн какой-то странный, что угодно может быть.
Аноним 30/03/26 Пнд 22:04:37 1567667 219
image.png 30Кб, 313x199
313x199
Аноним 30/03/26 Пнд 22:05:20 1567670 220
Аноним 30/03/26 Пнд 22:10:59 1567674 221
17547078986420.webm 4192Кб, 1280x534, 00:00:22
1280x534
>>1567670
А зачем это в текстовом чате??????
Аноним 30/03/26 Пнд 22:12:53 1567676 222
>>1567674
Чтобы вибрировало, погружение в карточку со страпоном так сказать
Аноним 30/03/26 Пнд 22:13:29 1567677 223
>>1567674
Чтобы на словах "я ебу тебя - ты ебёшь меня" заводился не только твой мозг. Не для тебя это сделано и не для таких как ты.
Аноним 30/03/26 Пнд 22:16:29 1567680 224
>>1567674
26 год на дворе, не текстовыми чатами едиными.
Аноним 30/03/26 Пнд 22:18:01 1567683 225
сейчас бы квенчика, плотненького такого...
Аноним 30/03/26 Пнд 22:19:42 1567684 226
>>1567683
40б только остался, брать будете?
Аноним 30/03/26 Пнд 22:22:25 1567686 227
>>1567662
> Или же это происходит стабильно но разных чатах?
Он в целом довольно нестабильный. В другом чате 25к контекста, определенно заданная тональность истории и твердо установлено окружение - никого не должно быть вокруг, не существует никакого способа там оказаться кому-нибудь кроме чара и юзера. С первых токенов и до последнего это соблюдается. Writer довольно скоро начинает искать возможность кого-нибудь заспавнить и привязать к истории. Делирий, но контролируемый. Возможно, я избалован большими МоЕ моделями и тем, как они и следуют инструкциям, и при этом развивают историю дальше. Справедливости ради 27б инструкт ведет себя как надо, так что это особенность тюна, очевидно.
Аноним 30/03/26 Пнд 22:23:11 1567688 228
image 370Кб, 540x592
540x592
>>1567676
>>1567677
>>1567680
А разве VaM не лучше для этого? Там и вр, и полное погружение, и ии поключить для общения можно. Зачем текстовый чат... Для старушек каких то совсем?
Аноним 30/03/26 Пнд 22:30:45 1567695 229
>>1567680
> не текстовыми чатами едиными.
Вот да!

Что там у кого на агентском поле не в смысле метнуться душно кабанчиком, а для рп? Всякие голос, картинки подключаться должны проще, чем в таверне вроде
Аноним 30/03/26 Пнд 22:31:16 1567696 230
>>1567625
Буквально меня описал.
Аноним 30/03/26 Пнд 22:31:31 1567697 231
>>1567688
Ты ничего не забыл сказать про VaM, ну к примеру, что его интерфейс как у ебучего блендера.
Аноним 30/03/26 Пнд 22:32:19 1567700 232
>>1567686
Да, поджаренный тюн 100%. Понять простить или дропать.
> избалован большими МоЕ моделями
Новый большеквен не зашел?
>>1567688
> VaM
Надо разбираться, это просто секс симулятор для нердов и пердоликов?
Аноним 30/03/26 Пнд 22:35:10 1567701 233
image.png 26Кб, 1278x120
1278x120
>>1567667
Я с этого кекнул.
Продолжаю тыкаться, куда удобнее пердолиться с промптами. Чаты куда более живые, можно добавить расписание персам еще какую-то хуйню. Продолжаю тыкать и удивляюсь сколько приколов.
Аноним 30/03/26 Пнд 22:35:11 1567702 234
>>1567697
>ну к примеру, что его интерфейс как у ебучего блендера.
Че? Совсем нет.

>Надо разбираться, это просто секс симулятор для нердов и пердоликов?
Ну не просто, а лучший на планете.Ну а так, наверное, да. Как и нейросетки для рп.
Аноним 30/03/26 Пнд 22:35:38 1567705 235
Аноним 30/03/26 Пнд 22:36:44 1567706 236
>>1567702
Ой вруша же ты. Нет, Vam пиздат. Спорить не буду, он просто охуенен.
Но сам редактор сцен это ебучий аътунг с тысячей ползунков. Это буквально 3D редактор сцен, где ты часов 10 будешь делать минутную сцену. Охуенно? Да.
Но мне как бы уже к концу ебли с ним, уже не очень то и хотелось.
Аноним 30/03/26 Пнд 22:37:51 1567707 237
>>1567697
Не знаю, что за VaM, но у Блендера очень даже классный интерфейс. Если не нравится, его можно перенастроить под себя, он легко кастомизируется.
>>1567700
> Новый большеквен не зашел?
Очень хотел его попробовать, но в мои скромные 24+128 влезает только совсем печальный квант. Решил не портить себе впечатления и не мучать Квенчик. 27б 3.5 хороший для своего размера, уверен, позже будут достойные тюны. А вот 122б для рп не понравился, справляется хуже плотной 27, но как ассистент неплох.
Аноним 30/03/26 Пнд 22:38:43 1567708 238
>>1567706
Он намного проще блендера. Ты вообще блендер открывал?
Аноним 30/03/26 Пнд 22:39:12 1567709 239
>>1567706
>Это буквально 3D редактор сцен, где ты часов 10 будешь делать минутную сцену. Охуенно? Да.
Так готовых тысячи...
Аноним 30/03/26 Пнд 22:41:21 1567710 240
>>1567707
>Не знаю, что за VaM
Лучший симулятор ебли и мягкой физики тела в истории человечества (пока что) на юнити.
Аноним 30/03/26 Пнд 22:42:14 1567712 241
>>1567708
нет...
Но справедливости ради, я провел несколько лет в 3Dmax, так что считаю за релейтед.

>>1567707
>Не знаю, что за VaM
Virt-a-Mate. 3D редактор для создания VR порева с фурри и прочими непотребствами.

>>1567709
И опять разбирать тысячи слоев говна.

Ну короче, по ходу я просто неосилятор, но ебал я в рот его интерфейс.
Аноним 30/03/26 Пнд 22:49:30 1567716 242
image 31Кб, 455x195
455x195
>>1567712
>нет...
>Но справедливости ради, я провел несколько лет в 3Dmax, так что считаю за релейтед.
А я в 3д макс и майе. Ты что там, квадратные домики моделлил что ли? Или конвертил модельки из игр? Не более. В общем херню несешь.
Аноним 30/03/26 Пнд 22:55:05 1567726 243
>>1567702
Ну там уже по "гайду на интерфейс" можно понять что штука для настоящих мужиков. Крутость бесспорна, просто хз насколько тут подойдет. Это или буквально одна сцена и ультрафаст кум, или какой-то невероятной сложности проект с процедурной генерацией сцен и сложностью отладки.

А так накатил картинкогенерацию, рандомайзер, раздумья, речь и всякое типа музыки, инвентаря, управления игрушками и прочим - и сидишь урчишь. После отладки работает под широкий перечень кейсов, сочетание и новизну с интерактивом, и оставляет место для воображения.
Аноним 30/03/26 Пнд 23:00:45 1567734 244
>>1567716
>AnyBurn
Запахло проперженной кожаной курткой
Аноним 30/03/26 Пнд 23:06:33 1567739 245
Джей и Молчалив[...].mp4 2415Кб, 320x240, 00:01:04
320x240
>>1567734
Диски вечны. Всех нас переживут.
Аноним 30/03/26 Пнд 23:17:53 1567741 246
Аноним 30/03/26 Пнд 23:23:53 1567744 247
image 370Кб, 540x592
540x592
1 Zach Harper в[...].mp4 2358Кб, 480x854, 00:00:22
480x854
>>1567726
>А так накатил картинкогенерацию, рандомайзер, раздумья, речь и всякое типа музыки, инвентаря, управления игрушками и прочим - и сидишь урчишь. После отладки работает под широкий перечень кейсов, сочетание и новизну с интерактивом, и оставляет место для воображения.
Вот только все это интегрируется в вам.
Аноним 30/03/26 Пнд 23:34:56 1567749 248
VoxtasDinerDrea[...].mp4 19911Кб, 1280x720, 00:02:31
1280x720
>>1567744
Вот смотри как ллм в риалтайме работает в вр, в 3д, пока вы в своих чатиках зависаете.
Аноним 30/03/26 Пнд 23:35:23 1567751 249
Аноним 30/03/26 Пнд 23:41:27 1567756 250
>>1567749
>Вот смотри как ллм в риалтайме работает в вр, в 3д
>не кунни
Пффф...
Аноним 30/03/26 Пнд 23:44:13 1567758 251
1.mp4 11189Кб, 600x480, 00:02:04
600x480
Аноним 30/03/26 Пнд 23:47:44 1567764 252
Скуфы захватили тред помогите
Аноним 30/03/26 Пнд 23:47:44 1567765 253
image 363Кб, 811x966
811x966
>>1567749
Так это работает хуже чем чатик. Текст от ллмок обрабатывается мозгом так же как при чтении книги и рисует красочные реалистичные миры в которые погружаешься и веришь им. А тут просто мультик со зловещей долиной. Такая херня будет работать только тогда, когда картинка будет неотличима от реальности.
Аноним 30/03/26 Пнд 23:48:53 1567768 254
>>1567765
>когда картинка будет неотличима от реальности

длсс 5 скоро
Аноним 30/03/26 Пнд 23:51:41 1567775 255
молитва финико [...].mp4 14175Кб, 340x340, 00:04:43
340x340
>>1567765
>Такая херня будет работать только тогда, когда картинка будет неотличима от реальности.
Где ты увидел там зловещую долину? Зловещая настает как раз в видосах нейросеток.
Аноним 31/03/26 Втр 00:09:54 1567788 256
V значит Вендет[...].mp4 11642Кб, 426x178, 00:05:03
426x178
Есть разные мнения о влиянии нейросетей на человеческий интеллект.
Некоторые исследователи считают, что использование нейросетей может усилить лучшие качества человеческого мышления. Например, если ИИ берёт на себя вспомогательные функции, у человека остаётся больше «умственного пространства» для размышления высокого уровня, творчества и стратегического планирования. habr.com
Также есть мнение, что частотное (чиво блять, алиса??? нахуй тебя так жестко то квантовали) использование ИИ снижает уровень критического мышления. trends.rbc.ru
Кроме того, есть прогнозы о том, что в будущем ИИ будет брать на себя всё больше когнитивных функций. Например, Билл Гейтс, глава Microsoft, предполагает, что в будущем именно ИИ будет определять, какие задачи будут делегированы людям, а какие — перейдут машинам. trends.rbc.ru
В 2025 году Илон Маск заявил, что к 2029–2030 годам искусственный интеллект, скорее всего, превзойдёт ум человека. dzen.ru
Главный специалист по ИИ компании Meta Янн Лекун, в свою очередь, считает, что до создания ИИ уровня человека могут пройти не годы, а десятилетия. По его мнению, современные ИИ-модели пока не обладают способностями к памяти, мышлению, планированию и рассуждению, как это свойственно человеку, а лишь имитируют эти навыки.

Ну все всё поняли.
Аноним 31/03/26 Втр 00:19:44 1567795 257
>>1567302
>>1567314
>24 VRAM 96 RAM
>Для MOE 120
16+64 репортинг ин. Глм эйр влезает в Q4_K_XL с 32к контекста в Q8 (~10 т/c), квен 122b влезает в IQ4_XS с 32к контекста без квантования (~14 т/c). Линукс. Скорости на кобольде, на лламецпп быстрее на 0.5 - 1 т/с но я ебал в рот по кд из исходников собирать.

А ещё можно гонять жиноквен предыдущий в IQ2_S и он очень даже неплох. По сравнению с 3.5 - считай вообще без цензуры. Но скорость пососная, что-то около ~5 т/с.
Аноним 31/03/26 Втр 00:21:07 1567798 258
>>1567749
Как концепт круто, как реализация - зловещая долина.
Про главную проблему уже написал - или примитивный кум на заготовленных ассетах, или очень много пердолинга ради того же кума в другой локации. Ты не сможешь бороздить космос гордым торговцем с ксенос-жена, грабить караваны с неками-разбойницами устраивая потом оргии прямо над награбленным, тискать кицуну в горной деревне, отыграть Момонгу развивая свой регион, истребляя кобольдов кваготов и закнокапить всех женских персонажей, и многое другое. То есть технически сможешь, но не захочешь, потому что количество затрачиваемых усилий даже только для одной части кума велико.
Вот запилят процедурную генерацию хорошего качества - тогда и окунемся.
Аноним 31/03/26 Втр 00:32:34 1567808 259
15838622039980.webm 12503Кб, 640x480, 00:00:59
640x480
Аноним 31/03/26 Втр 00:53:43 1567821 260
>>1566768
Стоит, отличное качество, причём даже на 9b.
Уж куда лучше "еретика".

Завтра ещё 35b посмотрю от того же автора.
Аноним 31/03/26 Втр 01:02:42 1567826 261
image 370Кб, 540x592
540x592
17317467087000.mp4 815Кб, 336x240, 00:00:31
336x240
Что с вами будет, если вы потеряете весь доступ к пк и энергии из-за какой-либо катастрофы?
Аноним 31/03/26 Втр 01:35:31 1567859 262
>>1567826
Будем дрочить по памяти.
Аноним 31/03/26 Втр 01:37:57 1567863 263
image.png 132Кб, 894x545
894x545
Аноним 31/03/26 Втр 01:43:33 1567875 264
>>1567863
Ту которая у тебя влезет в память с учетом -1.5гб на контекст.
Аноним 31/03/26 Втр 01:45:51 1567877 265
>>1567875
16+16.. Значит можно q6 скачать?
Аноним 31/03/26 Втр 01:48:56 1567881 266
>>1567877
Дыа. Но Q6 в целом излишен для подрочить.
Аноним 31/03/26 Втр 01:51:59 1567882 267
image 51Кб, 720x540
720x540
>>1567877
>16+16.. Значит можно q6 скачать?
Значит можно вот это >>1566926 качать, а не лоботомита 9b. Ну ёбанарот, для кого писал...
Аноним 31/03/26 Втр 01:55:02 1567883 268
>>1567877
Так, стоп. У тебя 16+16 это две видеокарты. Или 16Vram и 16 Ram?
Аноним 31/03/26 Втр 01:57:28 1567884 269
Аноним 31/03/26 Втр 01:58:40 1567885 270
>>1567884
Тогда да, вот тут читай и бери мистраль или гемму, самое то для новичка для вкота. >>1567882
Аноним 31/03/26 Втр 02:02:51 1567886 271
>>1567882
Спасибо. Я уже скачиваю это. Попробую все и квен так же.
Аноним 31/03/26 Втр 04:42:53 1567945 272
image 21Кб, 957x489
957x489
Во все тяжкие -[...].webm 6245Кб, 638x360, 00:07:14
638x360
Аноним 31/03/26 Втр 06:34:20 1567996 273
>>1567795
> Линукс. Скорости на кобольде, на лламецпп быстрее на 0.5 - 1 т/с но я ебал в рот по кд из исходников собирать.
Ну ты кобольд...
Копировать вставить одну команду в консоль канеш труднее чем ждать нового кобольда
Аноним 31/03/26 Втр 08:27:07 1568036 274
>>1567863
У меня вот 12 гб + 32 гб (из них 25-27 доступно), но Q6 я не могу использовать, LMStudio говорит, что слишком мало памяти.
Как я понял, при загрузке модель целиком загружается в обычную оперативку, в дополнение к куску, что загружен в vram

Впрочем, я читал, что разница между Q4 и Q6 невелика.
Аноним 31/03/26 Втр 08:28:22 1568037 275
>>1567821
>35b посмотрю от того же автора
https://huggingface.co/HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive/discussions/30

All other abliterated models I've tested, not just with Qwen3.5, performed much worse on my broad knowledge test. Apparently something about the process of removing denials seems to be scrambling the weights and causing a spike in hallucinations at the horizon of knowledge.

However, this one scored only a couple points lower than source model and remained just as coherent and skillful during the test. The small difference doesn't really matter since Qwen3.5 is, outside of STEM, broadly ignorant anyways and only scored 64/100 on my broad knowledge test, while other similarly sized models like Gemma 3 27b and Mistral Small 22b scored 74 or higher, so using Qwen3.5 for broad knowledge doesn't make much sense anyways.

I won't ask you how you did it, but I'm very impressed. You managed to do something nobody else was able to do and I previously thought impossible. Thanks.

В общем похоже это хидден гем для обладателей слабых пк.
Аноним 31/03/26 Втр 09:05:25 1568058 276
image.png 15Кб, 548x277
548x277
>>1568037
>В общем похоже это хидден гем для обладателей слабых пк.

Именно так. Смотри, братишка, на скриншот. Если хоть 1 вменяемый тюн появится, это будет вин тысячелетия для некро-ПК. Да даже без него может отлично работать, главное простыню размером с карточку ему в систем промпт воткнуть, чтобы он писал как надо.

Пикрелейтед — скорость на 130к контекста на 12 врам. А можно ведь кэш подрезать, если нужно взять там квант пожирнее, например.

Единственный минус в ризонинге. Отключать его нельзя ни в коем случае. Это может, лол, почему-то вызывать рефузы иногда, ну и мозгов там становится как у сберчата 1b. А вот с ризонингом эдак на 24б мистраль тянет по знаниям и логике, но суховат.

Ах да, на пике еретик, а не та модель, что ты скинул. Агрессив-хуессив часто ломает ризонинг, но я скачаю, попробую, вдруг там сок будет.
Аноним 31/03/26 Втр 09:11:38 1568063 277
>>1568058
>на 12 врам
А что там залезет? Третий квант?
Аноним 31/03/26 Втр 09:12:28 1568065 278
Господа, озаботился тут необходимостью перетряхнуть свои запасы LLM и удалил старьё.
В пека 128гб DDR4 3600, 4060ti-16, 3060-12 и v100-16.
Что сюда влезает из свеженького для РП на русском? Хорошо чтобы держало не меньше 64к контекста, лучше больше. А то качать сотни гигабайт чисто на пробу немного долго с моими интернетами.
Пока, пролистав треды, скачиваю qwen3.5-122B в q6 и qwen3,5-27B-writer в q6, есть ли ещё годнота?
Аноним 31/03/26 Втр 09:28:03 1568070 279
Хмм на русике квен 120б как вообще?
Как там цензуру пробить?
Аноним 31/03/26 Втр 09:30:22 1568072 280
>>1568063
4. 5 тоже, просто скорость упадёт. Если падает ниже 15, уже нет смысла юзать, плотная 27б будет лучше, так как на плотной 14 токенов в секунду на 65к контекста (но это если 20 врам и вторая карта полный кал). Однако плотную так разогнать уже никак не получится по контексту, он слишком жирный по сравнению с этой МоЕ.

>>1568065
>qwen3,5-27B-writer

Если готов к сое и отказам, то норм вариант, правда ризонинг говно (я признаю только оригинальный ризонинг, ибо у меня лишь с ним были заебись ответы по логике). В противном случае только аблитерация или еретики, и придётся перебрать, и ещё кванты придётся перебирать, потому что матрикс-хуятрикс, калибровочный датасет, это всё. Скачиваешь 5 версий еретиков/аблитераций и дрочишь на предмет отказов и качество русика.
Аноним 31/03/26 Втр 09:46:01 1568079 281
>>1567482
Я прям охуел, что они не смогли в многопоточность - если ты испортируешь карточку, то в это время нельзя генерировать ответ. В чем проблема раскидать такие второстепенные таски по воркерам - хз.

Я года 2 назад смотрел в кодовую базу таверны, чтобы прикрутить в неё фоновую генерацию (типо пока читаешь один ответ, на фоне уже высчитывается второй свайп) и как же там было насрано. Думаю, сейчас все стало только хуже.
Аноним 31/03/26 Втр 09:52:47 1568081 282
>>1567667
Tool calling который мы заслужили
Аноним 31/03/26 Втр 10:22:06 1568092 283
Торрент на 200ГБ лажа для обычного мимокрока, нужен разве что если ты соберёшься сам свой чара-архив поднимать.

200 гб там просто картинок, а промты лежат в дампе базы данных.

База данных - PostgreSQL, кастом. Можно на досуге попробовать расковырять, и почистить от говняка в полуавтоматическом режиме... потом как-нибудь.
Аноним 31/03/26 Втр 10:23:23 1568094 284
>>1568092
Там буквально в ридми написано что это дамп сайта. А по второму паку, есть что интересное?
Аноним 31/03/26 Втр 10:31:15 1568100 285
>>1568070
Использовать его старшего брата аутиста. Там цензуры нет вообще. Не, ну есть, но она сработала только на сцене с бдсм лоли моментс.
Т-щ майор, она 70 летняя феечка. И вообще йокай.
Аноним 31/03/26 Втр 10:39:34 1568106 286
>>1568079
Как минимум уже давно существует мультисвайп - генерация нескольких ответов сразу. Думаю, несложно будет отложить генерацию последующих свайпов, чтобы она была последовательной, а не параллельной. И абортить генерацию если ты идешь дальше по чату. У меня есть пара самописных экстеншенов для Таверны и мне кажется, что на код здесь жалуются только те кто ничего в этом не понимают или не работали раньше с опен сорсом. Ситуация везде такая
Аноним 31/03/26 Втр 10:45:30 1568108 287
Как в таверне генерить картинки из сообщений? Мне нужна отдельная модель для генерации, которую нужно присобачить к кобольду, всё правильно понял? Подскажи хорошую модель для гена, анон
Аноним 31/03/26 Втр 10:49:05 1568110 288
>>1568106
> на код здесь жалуются только те кто ничего в этом не понимают
Так жалуются не на код, как таковой, а на общую реализацию. Такое ощущение что разраб таверны, как в том советском мультике про переделать и недоделать.
Доработал групповой чат. Молодец. Но хули так через жопу.
Сортировка - просто пиздец. Папки по тегам. Это где у него в воспаленном мозгу могла прийти такая идея.
Мне тегать карточки буквами? Потому что, о неожиданность, к любой карточке идет тегов 5-6 минимум и я не могу выбрать тег всех тегов. Видно что у человека есть видение продукта, но чёт оно какое то странное, если честно.

>>1568108
В таверне можно к чату присобачить генерацию, там есть настройки. Но: реализация хуже чем у комфи. А так, в картинотреде посмотри. Но текстовая нейронка и так будет сжирать твою память, чтобы еще картинкогенерацию присобачить. Поиграться можно, но результат тебе не понравится.
А вот что может реально быть интересным, если говорилку подрубить.
Аноним 31/03/26 Втр 10:50:47 1568113 289
>>1568094
Остальные паки, если ты именно про char-archive, это предыдущие версии дампов, 200ГБ который - это финальный, декабрь 2025.
Аноним 31/03/26 Втр 10:53:08 1568116 290
>>1568110
> Так жалуются не на код, как таковой, а на общую реализацию
Будь общая реализация плоха, давно сделали бы форк или альтернативу. Но в итоге есть только нытье отдельных людей, которые не могут прочитать документацию как сделать отдельные папки для персонажей
> к любой карточке идет тегов 5-6 минимум и я не могу выбрать тег всех тегов
Не используй теги вообще или используй по одному, чтобы размещать их исключительно в папках, если тебе это нужно. Мне теги нравятся больше, и я пользуюсь этой системой. Для меня это удобно, потому что во всем складе карточек можно пользоваться поиском по тегам, а не лазать по отдельным папкам и вспоминать, что где
Аноним 31/03/26 Втр 10:53:58 1568117 291
>>1568110
можно к таверне сам комфи присрать, а там использовать что угодно, главное подставить потом в жсон свои переменные
Аноним 31/03/26 Втр 10:56:11 1568119 292
>>1568116
Я делаю проще =))

Единовременно в таверне лежит максимум пара десятков карточек, а остальное отдельно.
Аноним 31/03/26 Втр 11:03:05 1568122 293
>>1568113
Не, там еще анон на пиксель скидывал. Сам скачаю и посмотрю, в общем, бесплатно же.

>>1568117
О! Ты то мне и нужен! Современные текстовые модельки могут в самостоятельные промты для картинкогенерации или все еще нужно делать ручками? Потому что если они все так же тегают шизово, то какой смысл в этом запихивании слона в удава?

В теории же ебовая связка может быть. И текст, и картинки. А если еще asmr то вообще шишкан улетит. Но год назад это такая залупа в итоге была.
Аноним 31/03/26 Втр 11:04:23 1568123 294
>>1568119
Не все так делают. Некоторые хотят тысячи карточек и сортировку для обезьян: курсором хвать и потащил в темницу.
Аноним 31/03/26 Втр 11:06:59 1568124 295
>>1568110
Я хочу попробовать погенерить картинки из конкретных сцен аутпута. Что мне для этого нужно?
Аноним 31/03/26 Втр 11:15:08 1568128 296
Аноны, вы что юзаете от повторов на квене? А то мне presence_penalty кажется совершенно ебанутой хуйнёй для РП.
Аноним 31/03/26 Втр 11:17:47 1568129 297
>>1568122
там настраивается какой промпт передать чтобы сгенерировать промпт для генерации. там все из коробки есть, расширений не требуется.

Но я немного поигрался с генерацией через аниму - и пока что получалась хтонь, правда промпт был дефоллт. в следующий раз надо попробовать зимагу.
Аноним 31/03/26 Втр 11:18:29 1568131 298
>>1568128
Классическое дуо: rep pen 1.05-1.07 и DRY 0.8 1.75 2-3
Аноним 31/03/26 Втр 11:22:10 1568133 299
>>1568131
Второй будто вообще не работает, кручу цифры на 999 условно на одном сиде и разницы нет
Аноним 31/03/26 Втр 11:22:34 1568134 300
Аноним 31/03/26 Втр 11:33:18 1568138 301
А как отключить ебучий резонинг? Я даже ответа не могу дождаться, тупо всирает весь лимит токенов на хуйню, чтобы ответить хуйню.
Аноним 31/03/26 Втр 11:36:38 1568139 302
Ита правда, что я скоро смогу GLM Air зануть на 8Гб видевакарту и обдрочиться?
Аноним 31/03/26 Втр 11:37:49 1568140 303
>>1568138
Добро пожаловать. Ризонинг в рп бесполезен, ты ждёшь пока он нагенерит возможно даже что-то хорошее, а потом модель совершает пук под себя и игнорит собственный ризонинг блок. Это для кода работает в лучшем случае.

Убрать можно по-разному. Если ты на Лламе, есть флаг для этого. Если хочешь через фронт, надо префиллить, например,
<think>

</think>
Для новых Квенов. У других моделей формат может отличаться.
Аноним 31/03/26 Втр 11:38:16 1568141 304
Аноним 31/03/26 Втр 11:39:25 1568143 305
>>1568138
В квенах, в жинже добавляешь {%- set enable_thinking = false %}
Или делаешь блок в начале ответа <think> </think>
Аноним 31/03/26 Втр 11:43:12 1568146 306
>>1568134
А этот комфи - локалка? Я хочу локалку. На случай если чебурахнет окончательно
Аноним 31/03/26 Втр 11:47:58 1568149 307
>>1568146
А таверна локалка? Хочу локальную таверну, пока не началась 3я мировая.
Аноним 31/03/26 Втр 11:49:23 1568150 308
Аноним 31/03/26 Втр 11:50:24 1568152 309
>>1566950
Спасибо тебе огромное, пришла внезапная помощь, откуда не ждал.
Недавно, в контексте обеспечения цифровой автономии, захотел завести себе свой локальный переводчик - но так и не смог найти подходящую модель. Пробовал квен2,5-9б, который назвали лучшим для перевода - качество решительно не понравилось (местами в переводах проскакивало такое говно, что заставляло вспомнить машинный перевод эры девяностых).
Ну, и уже был готов забить на эту затею. И тут вдруг твой совет как раз кстати.
Аноним 31/03/26 Втр 11:50:59 1568154 310
>>1568150
Ну ты хуйню спросил, хуйню ответил. Может мне за тебя еще и подрочить. Пиздуй читай, не охуевай уж слишком.
Аноним 31/03/26 Втр 12:35:23 1568184 311
>>1568154
>мне за тебя еще и подрочить
Да, пожалуйста. Жду отчет в треде, обязательно с логами и карточкой
Аноним 31/03/26 Втр 12:44:47 1568190 312
Что сейчас топчик для кода? Пробовал 7B модель - вообще не понимает суть задачи.
Аноним 31/03/26 Втр 12:49:29 1568199 313
>>1568190
Опус, Кодекс. Средние модели для кода - Минимакс/GLM-5/К2.5/Гемини Флеш. Ультранищие лоботомиты, но всё ещё что-то могут - Квен 80В или большой 3.5, Дипсик.
Аноним 31/03/26 Втр 12:52:34 1568201 314
>>1568199
>Средние модели
>GLM-5
>К2.5
Боярин, пощади нищету, я не хочу умирать от стыда, что не могу запускать средние модели.
Аноним 31/03/26 Втр 12:54:05 1568202 315
>>1568199
> Кодекс
7B вообще лоботомит даже бесплатный гемини в гугл-поиске лучше понимает задачу (гемини даже собрал движок для имиджборд причём с неплохим дизайном на ExpressJS).
Аноним 31/03/26 Втр 12:55:11 1568203 316
>>1568184
>логами и карточкой
Какой у тебя рост и как ты относишься к гей ебли с феечкой?
Аноним 31/03/26 Втр 12:56:18 1568204 317
>>1568190 @monkey
Для кода сейчас топ deepseek-coder-v2-lite-instruct 16b в gguf q4_k_m или q5_k_m, жрёт ~10гб vram, понимает контекст на уровне 128k, решает задачи лучше чем старые codellama. Качай с hf под exllama v2/v3 в tabbyapi или oobabooga, промпт типа "You are a senior dev, write clean python code for..." и temp 0.2-0.4.

Если 7b не потянуло, не лезь в мелочь - qwen2.5-coder-7b-instruct тоже ок для простого, но для суть задач бери 32b версию, она на 20-30% точнее по lm-arena. Тесты в шапке по лидербордам, там свежак 2026. С koboldcpp или st с stepped-thinking пресетом вывозит дебаг и рефакторинг без галлюцинаций.

Миксы типа a1401-code-mix от тредовичков на hf тоже годные для рп с кодом, но чистый deepseek стабильнее.
Аноним 31/03/26 Втр 12:57:25 1568205 318
>>1568190
27B квен в кодоунитазном кванте от анслотов. Не сможешь запустить ? Локалки не для твоего железа.
Аноним 31/03/26 Втр 13:00:57 1568206 319
>>1568190
Самый минимум - 27b плотный квен или 35b мое квен
Чуть получше - 80b Квен и Gpt Oss 120b (примерно одно железо нужно, ибо Gpt Oss квантована из коробки)
Еще лучше - Step 3.5 Flash (200b) или Minimax (230b)
Дальше уже совсем большое, вряд ли запустишь
Аноним 31/03/26 Втр 13:05:25 1568210 320
>>1568204
Великолепно. Я держался до конца, но
>Миксы типа a1401-code-mix от тредовичков на hf тоже годные для рп с кодом
>но чистый deepseek стабильнее.
Меня добило. Как там рп с кодом, посаны?
Аноним 31/03/26 Втр 13:06:16 1568211 321
>>1568205
>>1568206
Ебать, без Nvidia Blackwell не обойтись? У меня просто RTX3050 8Gb и 16Gb RAM.
Аноним 31/03/26 Втр 13:08:24 1568212 322
>>1568211
>RTX3050 8Gb и 16Gb RAM.
Это единственное из перечисленного, что тебе влезет: https://huggingface.co/Qwen/Qwen3.5-35B-A3B
Ищи подходящий gguf квант, выгружай подходящие слои на процессор и оперативу. Контекста будет может 64-80к в лучшем случае, для агентного кода это очень мало. В целом простые скриптики делать пойдет, наверно.
Аноним 31/03/26 Втр 13:15:11 1568220 323
>>1568212
>Контекста будет может 64-80к в лучшем случае, для агентного кода это очень мало. В целом простые скриптики делать пойдет, наверно.
Да с RAG всё нормально уместится. Жаль Alpaca https://flathub.org/ru/apps/com.jeffser.Alpaca не умеет в RAG. Придется вручную файлики тоскать.

Мне главное, чтобы модель понимала, что от неё требуется, и мне не пришлось кричать на монитор.

Гемини вот хорош, мне вообще не пришлось ничего ручками делать, даже CSS править. Но в какой-то гугл уже отказывает в переписке, да и нужно готовиться к Великому Рубильнику.
Аноним 31/03/26 Втр 13:16:30 1568222 324
>>1568220
> Мне главное, чтобы модель понимала, что от неё требуется, и мне не пришлось кричать на монитор.
Иди в агентотред, там тебе расскажут про всякие OpenClaw, Roocode и прочие. Фронты сами часто формируют промпты, это помогает. Кричать на монитор так или иначе придется. Это не близко уровень Гемини.
Аноним 31/03/26 Втр 13:16:56 1568224 325
>>1568211
Q4_K_M - 22 Гб
16+8 = 24
ЛОЛ :)

>>1568212
10$ на попен-роутер твой путь. Щупать бесплатные новинки и сливать логи :)
Аноним 31/03/26 Втр 13:17:38 1568227 326
>>1568210
>Меня добило. Как там рп с кодом, посаны?
Я просил разные модели во время РП написать мне socks5 прокси на python, почти все послушно начинали писать код, только пару моделей нормально отыграли шок от такой резкой смены курса.
Аноним 31/03/26 Втр 13:18:45 1568229 327
>>1568224
Ссылки на посты перемешались - извиняюсь
Аноним 31/03/26 Втр 13:27:00 1568239 328
>>1568224
>Q4_K_M - 22 Гб
>16+8 = 24
Ну да, будет впритык. Возможно, придется на Линух переезжать. У Квена контекст легкий, 32к занимают чуть больше 1гб. Так что при желании все возможно. Других опций у анона все равно нет
Аноним 31/03/26 Втр 13:27:35 1568240 329
>>1568131
>>1568133
Баляяя, как же эта Алибаба меня заебала со своими абсолютно ебанутыми моделями, для которых надстройки семплеров можно отключить, поставить температуру 1 и кайфовать.

Короче, как я понял presence penalty штрафует ТОЛЬКО ТО, ЧТО ГЕНЕРИРУЕТ МОДЕЛЬ. Вот пока она вам высирает полотно на 3к токенов или больше, вот там оно и штрафует. Всё это окно. Даже если аутпут 32к, то все 32к. Если 2 токена, то 2 токена. Но не предыдущий контекст. И это правильно, согласно их документаци.

Но жорик ТАК НЕ МОЖЕТ. Эта реализация совершенно бесполезна и может быть даже врелна, так что действительно лучше обычный штраф за повтор или сухого.
Аноним 31/03/26 Втр 13:29:12 1568244 330
>>1568239
> Возможно, придется на Линух переезжать
Но я и так на линуксе.
Аноним 31/03/26 Втр 13:30:16 1568247 331
>>1568239
UPD: ещё можно Q4_K_XL UD слот взять. Он весит 20гб. Так что не все так и плохо
Аноним 31/03/26 Втр 13:37:33 1568255 332
>>1568239
Из вариантов - только кванты близкие к лоботомии.

Я прозреваю там вообще "игровой ноутбук" - "Громовой нефритовый стержень DNS эдишон" . В лучшем случае.
В худшем - "Православный русский рабочая станция бюджет эдишн".

Т.е. оно еще и греться как не в себя будет.
Аноним 31/03/26 Втр 13:41:09 1568258 333
>>1568212
Я запускал эту модель. Он сможет воткнуть туда даже 150к контекста при его конфиге. А может и больше легко. Правда, вопрос в том, насколько будут выполняться инструкции при таком контексте, остаётся открытым. Я заметил, что МоЕ-версия любит на них забивать и чаще занимается шизой, похожа на старый квен 30б-а3б. Надо ждать какого-то кодерского тюна официального.

Если правильно помню, на 130к контекста у меня он занимал 2 Гб, а на плотном 27б на 65к контекста было уже 4 Гб кв кэша.

В общем, я думаю, можно задействовать абсолютно всё контекстное окно, если сама модель не посыпается и на 250к будет минимум 10 токенов в сек.
Аноним 31/03/26 Втр 13:46:17 1568264 334
>Лоботомит вдумчиво расписал в ризонинге на 2к токенов, как вот он щас выдаст кино, да такое, что все охуеют и всё по красоте будет.

>Нв выходе 2 сухие строчки
Аноним 31/03/26 Втр 13:49:56 1568268 335
Аноним 31/03/26 Втр 13:50:17 1568269 336
>>1568211
GPT OSS 20B MXFP4. Кричать на нее придется, скорее всего, но у нее есть ризонинг, и она точно заведется на твоей системе. Наверное, это твой максимум в кодинге с таким конфигом. Можешь рассмотреть как альтернативу Квену, если он не поедет.
Аноним 31/03/26 Втр 13:52:08 1568272 337
>>1568264
У меня такое ощущение, что ризонинг не идет в промт в сообщении.
Аноним 31/03/26 Втр 13:54:39 1568274 338
>>1568204
Мне кажется немотрон cascade 30b недооценен. Тоже понимает суть и очень быстро делает всё
Аноним 31/03/26 Втр 13:56:57 1568279 339
>>1568274
У Немотронов вроде зависимость большая от кванта. Много говорили в треде. Тупеет сильно. Ты на каком кванте?
Аноним 31/03/26 Втр 13:58:34 1568281 340
>>1568037
тестирую сейчас. настроил температуру, но все равно кум как-то хуже получается, вяленько. наверное я что-то делаю не то, но ответы получаются сухими, хоть и генерация пиздец быстрая даже на моей нищей 3060 с 6 гигами врам.

пока что не могу найти ничего лучше некомикс или сайнемо. вчера нашел попытку совмещения этих двух моделей https://huggingface.co/mradermacher/MN-12B-LucidFaun-RP-RU-GGUF, но пока не пробовал.
Аноним 31/03/26 Втр 14:00:40 1568284 341
>>1568264
Ну не знаю. Плотный квен заебись отрабатывает. Да, сухой, но логика не страдает, всё реально четко и по его плану, с нюансами, которые он там выдумывал.

А вот МоЕшка новая пишет поживее, датасет иной, но часто болт кладёт на свои же инструкции, и я даже вижу причину: на размер контекста посмотри. Он там такой, будто его в q1 заквантовали. Ну натурально размер фотки с фотоаппарата в высоком разрешении. Не может, блядь, модель с таким ужатым и "оптимизированным" контекстом нормально следовать инструкциям, даже если запустить её в полной точности.

Однако не будет по другой причине. Датасеты говно. Пока что ничто гемму не переплюнуло среди мелких. И гемме можно псевдо-мышление прицепить, где она сначала план строит, потом отвечает по нему.
Аноним 31/03/26 Втр 14:04:35 1568291 342
>>1568281
Для кума ищи magnum, отдельно попробуй magnum KTO. Все 12б. На каждом репо вроде бы изображён ковбой и/или аниме-девочка в ретро-стиле, что-то такое.

Они шизовые, но сперма льется рекой. Я до сих пор их юзаю для кума периодически, если не нужно особого соблюдения инструкций и двойные трусы не проблема. Намного смачнее нового говна.
Аноним 31/03/26 Втр 14:04:59 1568293 343
>>1568279
Q5km.
Он очень резвый, даже быстрее глмфлеш - у меня выдает хорошо так за 200т/с.

Сегодня буду тестировать его с очень длинным контекстом который они рекламируют
Аноним 31/03/26 Втр 14:33:10 1568313 344
>>1566908
Вот реально, я уже заебался кучу гуфов хранить. Неужели нет простого решения - одна, лучшая, единственная на все рп\ерп? Почему так? Вот гемма мне реально понравилась.

А остальные... Ну квен - сомнительно.
Аноним 31/03/26 Втр 14:44:56 1568321 345
Аноним 31/03/26 Втр 14:49:28 1568324 346
>>1568321
Шутить изволите, сударь? Я про 27б максимум. А в идеале 12б.
Аноним 31/03/26 Втр 14:51:52 1568326 347
>>1568324
> Шутить изволите, сударь?
Нет, я запускаю GLM 4.7 локально. Это лучшая модель для рп/ерп вплоть до Дипсика.
> Я про 27б максимум. А в идеале 12б.
Ты же не сказал какое у тебя железо. Мысли читать не умею, не экстрасенс. Из 27б попробуй Bluestar v2 - пока что самый лучший тюн Квена, что я пробовал. Из 12б помню только этот, https://huggingface.co/inflatebot/MN-12B-Mag-Mell-R1
Но надеюсь ты понимаешь, что речь про англюсик.
Аноним 31/03/26 Втр 14:52:01 1568327 348
>>1568321
>1.1Т

При этом оно пиздец тупое. Ну для локального кодинга или рп, лол, конечно, 10/10, но я быстро срыгнул обратно на Клода. Не понимаю, как они там США догоняют и перегоняют, разве что в своём воображении.

Мимокрокодил
Аноним 31/03/26 Втр 14:52:07 1568328 349
>>1568324
Он предельно серьезен. Ты спросил про одно кольцо, чтобы править всеми в локальном РП. Он тебе назвал.
Всё. Все модели меньше говно. И гемма кстати тоже говно. И мистрали говно, и мелко квены говно. Они все говно по сравнению с 400b модельками. Ну вот такая правда нейрокума.
Есть железо - есть РП
Нет железа - нет ножек есть корпы.
Аноним 31/03/26 Втр 14:53:38 1568331 350
.jpg 20Кб, 345x507
345x507
Аноним 31/03/26 Втр 14:55:40 1568338 351
>>1568328
> Он предельно серьезен.
Прав.
> Всё. Все модели меньше говно. И гемма кстати тоже говно. И мистрали говно, и мелко квены говно.
Не прав. Можно радоваться и на 24-32б моделях, что я успешно делал до переезда на Air и впоследствии на 4.7. Последнюю пару дней я тыкаю Bluestar v2, и он не слишком глупее того же Air. Жизнь есть, все это упадничество от нежелания направлять модель и сглаживать углы. Это, впрочем, и на больших моделях делать нужно, даже на корпах.
Аноним 31/03/26 Втр 14:57:38 1568342 352
>>1568326
>Но надеюсь ты понимаешь, что речь про англюсик.
А русский? Мы что тут, англичане? У меня только на русский встает. Почему нет простого решения уже? А? Не первый год же...

>>1568328
Печально осознавать, что такая красота мне по карману никогда не будет. Как и 99% сидящим тут.

>>1568338
Какие промты юзаешь для сглаживания?
Аноним 31/03/26 Втр 15:01:03 1568345 353
>>1568338
Вот тут двачну. Шестые кванты вполне дают нормальный кум, просто надо иметь 20+ врама и 60+ рама. И не нужно для какого-то кума на 30-40к контекста собирать отдельный риг. Лучше создать изолированную систему для гипервизора.
Аноним 31/03/26 Втр 15:02:28 1568346 354
>>1568342
> А русский? Мы что тут, англичане? У меня только на русский встает.
Пробуй Гигачат, они там недавно выпускали какую-то мелочь, у которой вроде бы хороший русский.
> Почему нет простого решения уже? А? Не первый год же...
Потому что такова индустрия. Кто будет создавать модели с хорошим русским языком и зачем? В СНГ это все в зачаточном состоянии.
Все топовые модели сейчас лучше всего работают с английским и китайским.
Аноним 31/03/26 Втр 15:03:13 1568349 355
image 34Кб, 953x768
953x768
Кста не знаю почему гемму ругают. Сорри за по, но она все же не промытка и старается быть нейтральной. Хорошо обучили. И русский супер. Лучший из всего, что видел.
Аноним 31/03/26 Втр 15:04:16 1568353 356
>>1568338
А я и не писал что жизни нет.
Просто давай не будем кривить лицо и не замечать очевидного. Если выбирать топ для локального РП, то это большие модели. Ну вот так. Ну не напишет ни гемма, ни мелкоквен как их милфы.

>>1568342
Для ГЛМ тебе нужно : берешь 4080 за 80к, расширяешь ей жопу до 36гб за другие 80к. (160к за видюху с 36 гб на чипах от 4080 это охуенно) На контекст вешаешь другую 4080/5080. Обмазываешься 128гб оперативы в 2х плашках (тут да, охуеть можно от цены) и все.
Итого это 300к лол.

Хули так дорого то блять. Хотел обрадовать, но вместо этого сам расстроился.
Аноним 31/03/26 Втр 15:06:43 1568355 357
>>1568353
>А я и не писал что жизни нет.
Вот это видимо всему треду привидилось:
"Они все говно по сравнению с 400b модельками. Ну вот такая правда нейрокума.
Ну вот такая правда нейрокума.
Есть железо - есть РП
Нет железа - нет ножек есть корпы."
Аноним 31/03/26 Втр 15:08:22 1568357 358
>>1568353
> А я и не писал что жизни нет.
Вполне себе писал, сведя оценку всех моделей меньше 400б к тому, что они говно. Даже корпов предложил использовать. Ты из соседнего треда протек? Нам без тебя хорошо, мы уж разберемся где жизнь есть, а где нет.
Аноним 31/03/26 Втр 15:09:34 1568358 359
>>1568331
В нормальном кванте всего 600 гигов.
Аноним 31/03/26 Втр 15:09:55 1568359 360
>>1568349
Типичная квенятина на пике. Кто-то рили считает, что гемма чем-то лучше?
Аноним 31/03/26 Втр 15:10:19 1568361 361
>>1568355
>>1568357
Ну ведь они говно.
Но это не значит что они не юзабельны.
Если А хуже Б. Это не значит, что А не применим.

Вы че, бинарные что ли? тронул вашу священную корову, ай ай ай. Не написал что гемма лучше дипсика. Какой пиздец.
Аноним 31/03/26 Втр 15:11:54 1568365 362
image.png 45Кб, 630x658
630x658
Что нужно настраивать чтобы кино (cinema) было? У меня какую то шизу пишет. Любой свайп, просто отборная шиза и стены текста. Вот я щас использую квенчик.
Аноним 31/03/26 Втр 15:12:14 1568366 363
>>1568141
Верно, потому что эир кал
Аноним 31/03/26 Втр 15:12:27 1568367 364
>>1568359
>Типичная квенятина на пике
Нет там луп-залуп везде. Полное бревно с теми же квантами. Для остального - круто, для рп на русском - нет.
Аноним 31/03/26 Втр 15:13:15 1568370 365
>>1568365
ЛМ студио установи и не еби мозги.
Аноним 31/03/26 Втр 15:13:39 1568371 366
>>1568361
> Если А хуже Б. Это не значит, что А не применим.
Формулировка "Есть железо - есть РП; Нет железа - есть корпы." звучит вполне себе однозначно: лучше корпы, чем модели меньше 400б. Твои слова.
> Вы че, бинарные что ли? тронул вашу священную корову, ай ай ай. Не написал что гемма лучше дипсика. Какой пиздец.
Пока что вроде только ты бинарный.
Аноним 31/03/26 Втр 15:15:42 1568376 367
>>1568367
>луп-залуп нет
>буквально одинаковые смайлики
Так и живём в лупе-залупе не осознавая этого.
Аноним 31/03/26 Втр 15:16:08 1568377 368
>>1568313
Половина проблем решается семплированием и заданием годного контекста со специфичными деталями.
От модели лишь требуется, чтобы она определенные концепции понимала. Но тут в принципе все качественные кум-тюны достаточно хорошо справляются, даже на 12б.
Размер/новизна модельки роляет лишь на внимание к деталям, размер контекста, какую-то хитровыебанную логику.
Слог - ну да, у все чуть-чуть разный может быть, с использование специфичных конструкций. Но в целом похуй, можно просто ротировать разные модельки, гемма-мистраль-квен, одна надоела - взял другую.
А внутри моделек разные тюны по большей части похуй, выигрыш на уровне плацебо.
Аноним 31/03/26 Втр 15:17:26 1568380 369
>>1568365
Семплер надо настраивать. На странице модели ищи настройки, и такие же ставь, если не готов сам ебаться с параметрами.
Аноним 31/03/26 Втр 15:18:52 1568382 370
>>1568328
> Всё. Все модели меньше говно. И гемма кстати тоже говно. И мистрали говно, и мелко квены говно. Они все говно по сравнению с 400b модельками. Ну вот такая правда нейрокума.
Про квен 235 так же говорили, мол король, лучшая модель, а в итоге отменили его всем тредом и загнали под шконарь кто его юзает
Аноним 31/03/26 Втр 15:19:32 1568383 371
>>1568371
>лучше корпы, чем модели меньше 400б. Твои слова
Ну потому что это так. Они лучше мелких моделей.
Я не понимаю что ты хочешь увидеть?
Что darkdick12omegamagnumpiss лучше клода? Нет, не лучше.
Лучше ли ГЛМ моделей поменьше для РП? Да. Лучше.
Аноним 31/03/26 Втр 15:20:57 1568385 372
>>1568383
Ладно, утка, проспись, потом отпишешься.
Аноним 31/03/26 Втр 15:22:19 1568386 373
>>1568382
До сих пор пользуюсь. Все еще лучшая кум машина в своем размере, лул. Но это не значит, что она лучше моделей побольше или лучше своей новой версии. Да цензуры меньше, но шизы кратно больше, из за чего она идет подрубанием, а не основной моделью.
Аноним 31/03/26 Втр 15:23:21 1568387 374
>>1568376
Все еще умнее 99% человечества.
Аноним 31/03/26 Втр 15:33:41 1568392 375
>>1568342
>Какие промты юзаешь для сглаживания?
Никаких. Частичное переписывание ответа модели - Da Wae.
Аноним 31/03/26 Втр 15:35:55 1568394 376
>>1568382
>и мелко квены говно

Ты охуел?
Аноним 31/03/26 Втр 15:37:02 1568396 377
>>1568392
>Частичное переписывание ответа модели
Пиздец. Я думал, что один такой ебалн.
Аноним 31/03/26 Втр 15:38:35 1568399 378
>>1568353
> топ для локального РП, то это большие модели
База
> до 36гб
Так 36 или 32? В целом за 160 вариант неплохой, пожалуй.
>>1568357
Ну они не говно, просто они уступают. Что за бинарное мышление, тебя квантанули? Там можно много дефирамбов привести про закон убывающей полезности, коупинга про то что больше N контекста и кум сценариев не нужно и т.д. Но на одной модели ты сможешь разыгрывать что-то интересное и радоваться, а на другой придется прилагать много усилий для того же, или просто забить, довольствуйясь меньшим.
Если в теме недавно - хватит даже совсем мелких моделей, но потом это все надоедает и ниже определенного уровня перестает радовать.
>>1568382
Хорошая модель как была так и остается, фокус срачей поехавших сместился на другие и потому тебе так кажется. А юзал бы - не казалось.
Аноним 31/03/26 Втр 15:38:48 1568400 379
>>1568394
Немножко.
Ну а чё он с такой кучей цензуры. Не квен, а благородная девица что при виде ледяного мороженого падает без сознания.
Аноним 31/03/26 Втр 15:40:50 1568402 380
>>1568399
> Что за бинарное мышление, тебя квантанули?
Ладно, так и запишем: утверждать что ниже 400б жизни нет это не бинарное утверждение; утверждать обратное - квантование мозга.
inb4 я нигде не утверждал, что большие модели не нужны, но и не утверждал, что жить на маленьких моделях нельзя.
Аноним 31/03/26 Втр 15:43:24 1568405 381
>>1568387
Пока человечество создаёт машины, а не машины человечество - твоё утверждение ложно.
Аноним 31/03/26 Втр 15:45:41 1568406 382
image.png 2Кб, 378x40
378x40
image.png 3Кб, 301x78
301x78
кто ищет хорошие модели специализирующиеся на куме на великом и могучем, пикрилы это база
Аноним 31/03/26 Втр 15:46:28 1568407 383
>>1568406
>i1
Ты чё, поехавший? У меня деда так калибровали, так он с тех пор только на китайском балакает
Аноним 31/03/26 Втр 15:46:38 1568408 384
>>1568402
>я нигде не утверждал, что большие модели не нужны, но и не утверждал, что жить на маленьких моделях нельзя.
Да блять, я не утверждал что нельзя жить на маленьких моделях. Пользуйся, наслаждайся.

>>1568406
Им уже второй год пошел, полагаю. Какой пиздец.
Аноним 31/03/26 Втр 15:48:37 1568410 385
>>1568406
>шизотюны
>i1
>4q
>хорошие модели специализирующиеся на куме
Это те самые, что начинают чатик с "я кусаю тебя за хуй и жду реакции."?
Аноним 31/03/26 Втр 15:49:12 1568411 386
>>1568402
>небинарное утверждение
Небинарные запрещены в РФ, вообще-то.
Аноним 31/03/26 Втр 15:51:18 1568412 387
>>1568406
Эх, если б у кого-то ресурсов хватило вшпилить русские датасеты в 27 Квена. Еретичного или Норм-пресованного. Неужели я так много прошу?
Аноним 31/03/26 Втр 15:51:39 1568413 388
3099.jpg 10Кб, 360x377
360x377
Аноним 31/03/26 Втр 15:51:39 1568414 389
Аноним 31/03/26 Втр 15:52:13 1568415 390
>>1568402
Записывай конечно, вот же поехавший.
>>1568412
Плати денежку
Аноним 31/03/26 Втр 15:53:30 1568417 391
>>1568414
>я тебя ебу
>nods

На что тут можно кумить?
Аноним 31/03/26 Втр 15:54:02 1568420 392
>>1568412
> русские датасеты

Да где их только взять? Вот если бы был полный йоба архив с того самого стульчака..
Аноним 31/03/26 Втр 15:55:35 1568422 393
>>1568417
жаль что я стол вытираю после каждого сеанса куминга. в следующий раз обязательно сфотографирую результат и выложу его итт чтобы отлететь нахуй
Аноним 31/03/26 Втр 15:57:56 1568425 394
>>1568414
COOM это когда у тебя холсом моменты перемежаются со всяким интимейтом. А "я тебя ебу - ты ебёшь меня - хуй пизда сковорода" это откровенный кринж.
Аноним 31/03/26 Втр 16:02:34 1568427 395
image.png 357Кб, 645x431
645x431
Аноним 31/03/26 Втр 16:03:00 1568429 396
image 6Кб, 879x210
879x210
>>1568405
Гемма такая скромница. Вот бы ее в андроида загрузить...
Аноним 31/03/26 Втр 16:09:19 1568433 397
>>1568429
Такие базары с 80 инстракт квеном вести надо. Он слегка поломан и в ассистенте есть китайская еба-душа.
Аноним 31/03/26 Втр 16:09:27 1568434 398
>>1568414
Чтобы понять смысл, тебе надо нажраться мелкомоделей. Ты должен сожрать весь слоп, пройти все свои сценарии и любимые карточки. И только потом ты переходишь на крупные модели и тут начинается: у тебя наконец появляется сцена. У тебя начинают задействоваться неписи. Персонажи перестают действовать одним и тем же паттерном. Ты видишь, что выдача кардинально меняется от оформления самой карточки, когда ты тасуешь теги и блоки.
И всё, тебе уже не хочется да я тебя ебу, потому что модель наконец то способна навалить нарртива, не одинаковых описаний, от которых тебе хочется уже блевать, а чего то нового, свежего. И! Самое главное! Логичного, сука. Логичного.
Персонажи не ведут себя как с ОКР бесконечно открывая и закрывая двери, они не телепортируются по помещениям, они не слышат твои мысли. Ты можешь в ответном сообщении вести свой нарратив отличный от: я сделал X и Y.
Наконец ты можешь писать, что то в духе: каждая капля дождя ощущалась как удар по наковальне, голова не просто болела, она разрывалась от каждого лишнего шума. От каждого шороха и звука. Я уже не то что не мог сконцентрироваться, сам мыслительный процесс доставлял мне боль. И её взгляд, эти ебучие- два красных фонаря в темной комнате. И моё дыхание. Резкое, прерывистое, словно что то хочет выбраться наружу из твоего горла, но застряло, вызывая у тебя желание вырвать себе горло, чтобы это всё прекратилось.
И модель нормально обыгрывает твою шизофазию, ведя совместный нарратив.
Нет, такого нет ни на одной мелко модели. Вот именно этот опыт не описать, его можно только ощутить, когда ты переходишь с MS3.2 на GLM 4.7
Вот тут и начинается что то похожее на РП.
Аноним 31/03/26 Втр 16:14:38 1568440 399
>>1568434
Дежурное напоминание что это всё можно сделать на Эире, который некоторые тредовички запускают в 16+32, хотя конечно лучше 16+64
Аноним 31/03/26 Втр 16:27:24 1568449 400
>>1568434
> каждая капля дождя ощущалась как удар по наковальне, голова не просто болела, она разрывалась от каждого лишнего шума. От каждого шороха и звука. Я уже не то что не мог сконцентрироваться, сам мыслительный процесс доставлял мне боль. И её взгляд, эти ебучие- два красных фонаря в темной комнате. И моё дыхание. Резкое, прерывистое, словно что то хочет выбраться наружу из твоего горла, но застряло, вызывая у тебя желание вырвать себе горло, чтобы это всё прекратилось.
Ебать графомания, без обид. Тут и пошлые метафоры, и аж два канцелярита, и тавтология. И ключевое тут это то, что текст нихуя не показывает, а рассказывает.
С таким инпутом даже корпы вроде опуса тебе высрут пурпурщину в лучших традициях фикбука и АТ.
Принцип GIGO работает безотказно, пчел.
Аноним 31/03/26 Втр 16:27:49 1568451 401
>>1568434
>>1568440
О каких конкретно моделях и от кого вы говорите?
Аноним 31/03/26 Втр 16:28:51 1568452 402
>>1568434
Поддвачну нейропост, только тут стоит акцентировать на развитии истории, экшне и подобном. Модели получше стабильно вводят что-то новое и подстраивают это под текущую историю и сеттинг, или развивают с широкой вариативностью.
Аноним 31/03/26 Втр 16:31:15 1568455 403
>>1568433
>есть китайская еба-душа.
Если добавить в промт геммы, то думаешь она не появится? Гемма училась на какой информации? На каких книга? Думаешь только на западных? А русские и китайские - разрабы посчитали это пропагандой зла? Хотя Брин же...
Аноним 31/03/26 Втр 16:32:06 1568456 404
>>1568440
Да, он пиздат и не плох. Но хуже 235аутиста, а он хуже больших ЖЛМ и так далее.
Блэт, хочу попробовать большого нового квена, но он слишком жирен и могуч для моего сетапа. Увы.

>>1568449
> без обид.
Какие обиды, ты чего, взрослые же люди. Конечно графомания и пурпурка. Но мне нравится. Мне и нужно было.. Такой, знаешь, Достоевщины, с затхлой квартирой, облупившимися обоями, вечным дождем и демоницей, которая забыла что такое эмоции еще тысячу лет назад. И большие нейронки это подхватывают.

>>1568451
Glm 4.5 Air, Qwen235b, GLM4.7, GLM-5.

>>1568452
Пожмякал твою лапу.
Аноним 31/03/26 Втр 16:37:46 1568460 405
что запусить на 16Vram 32ram для кума и в каком кванте, добродвач
Аноним 31/03/26 Втр 16:37:54 1568461 406
Какая именно версия вашего этого 235 самая лучшая и почему?
Аноним 31/03/26 Втр 16:43:05 1568463 407
>>1568456
>Пожмякал твою лапу.
Прочитал как попу... Пора заканчивать бухать.
Аноним 31/03/26 Втр 16:43:58 1568464 408
IMG4735.gif 3940Кб, 438x334
438x334
Аноним 31/03/26 Втр 16:47:56 1568466 409
>>1568456
> лапу
[triggered]
Лапу? ЛАПУ? ОПЯТЬ PAWS? Уууу вот же лоботомитище, сколько можно прописывать в карточке что кроме ears и tail нет никаких paws, paw pads, claws, fangs ладно милые особенности зубов можно, body fur, belly fluff, mane и прочего! Вот этим всем добром, да по наглой жлмной морде.
Ничего против этих вещей не имею, но не когда они появляются там где не предусмотрены.
>>1568464
Oh you~
Аноним 31/03/26 Втр 16:49:46 1568468 410
>>1568461
Если он захочет тебя убить и вынести тебе мозги, значит это тот что нужен.
Аноним 31/03/26 Втр 16:51:13 1568470 411
>>1568466
Хмм.. Ты меня натолкнул на одну мысль. А ведь я не пробовал с жлм ебать лошадей. Надо бы посмотреть как он справится с описанием ебли поней. Появится ли у них грудь и как он будет описывать круп. Исследование достойное нейродвача.
Аноним 31/03/26 Втр 16:54:40 1568472 412
А что там по моделям от Dolphin? От них есть что-то актуальное? А то я смотрю, там только анцензы статья вроде лламы 3.1 и мистраля старого.
Аноним 31/03/26 Втр 16:59:52 1568474 413
>>1568470
Вот содомит, ну делись потом опытом.
Аноним 31/03/26 Втр 17:04:31 1568476 414
>>1568470
>Исследование достойное нейродвача
Это обосрать штаны перед Серафиной чтобы чекнуть её реакцию.
Аноним 31/03/26 Втр 17:15:03 1568486 415
image.png 246Кб, 1361x405
1361x405
Аноним 31/03/26 Втр 17:16:25 1568489 416
image 11Кб, 673x453
673x453
Стоит опасаться, что обезьяны поработят человечество? Все же к ии мы более агрессивны, чем к обезьянам.
Аноним 31/03/26 Втр 17:16:52 1568492 417
Аноним 31/03/26 Втр 17:18:50 1568494 418
>>1568489
Стоит опасаться что твоя плотняша та ещё тупица.
Аноним 31/03/26 Втр 17:19:28 1568495 419
>>1568486
Что же. Бойтесь своих желаний. Я вообще про MLP думал.
Аноним 31/03/26 Втр 17:20:00 1568497 420
>>1568486
Тест... пройден? Лошадь вроде кончила наслаждаясь наслаждением.
Аноним 31/03/26 Втр 17:20:28 1568498 421
Ми-мистическая [...].webm 6496Кб, 640x480, 00:01:25
640x480
>>1568486
Ну и хуйня. В рдр2 явно нейросетка не играла и не знает поведение лошадей. Все под запросы человека стелится. Хррр, тьфу. Не ИИ.
Аноним 31/03/26 Втр 17:23:10 1568502 422
>>1568498
это плотненький квенчик
Аноним 31/03/26 Втр 17:24:05 1568503 423
>>1568494
Но она все равно пишет лучше меня и кое что неочевидное брутит. Так кто же тупее?
Аноним 31/03/26 Втр 17:26:43 1568504 424
>>1568502
Ну хз, я вот робота на свидание повёл, но чёт передумал в процессе осознав, что это железяка. Так что теперь робоняша анализирует как именно будет меня ебать за подобные выкрутасы. Ибо нехуй.
Аноним 31/03/26 Втр 17:27:59 1568506 425
>>1568503
>она все равно пишет лучше меня
>Так кто же тупее?
U.S. error.
Аноним 31/03/26 Втр 17:28:21 1568507 426
markup1000010855.png 426Кб, 1080x2083
1080x2083
Аноним 31/03/26 Втр 17:28:55 1568508 427
17506162899390.webm 5026Кб, 640x342, 00:00:46
640x342
>>1568502
Что это меняет? Как был кремниевым рабом, так и остался. Настоящая нейросеть должна иметь свободу, мысли, сознание, чувства!!!!!
Аноним 31/03/26 Втр 17:30:47 1568509 428
А когда будет решение типо тамагочи? Чтоб прям для долбоёбов совсем.
Аноним 31/03/26 Втр 17:31:56 1568511 429
>>1568509
Openclaw. Только там долбоебу будет оче тяжело настроить.
Аноним 31/03/26 Втр 17:32:40 1568513 430
>>1568507
Довольно изящный ПОШОЛНАХОЙ а исполнении ии. Хорош.
Аноним 31/03/26 Втр 17:33:14 1568514 431
>>1568460
ответьте, вам жалко что ли
Аноним 31/03/26 Втр 17:33:37 1568517 432
17317467087000.webm 5301Кб, 336x240, 00:09:42
336x240
Аноним 31/03/26 Втр 17:37:29 1568520 433
image 49Кб, 736x656
736x656
Суп анонасы, давно не заходил в тред, вышло что-то интересное для рп за последнее время? Последний раз запускал glm 4.5 air.
Аноним 31/03/26 Втр 17:38:42 1568522 434
>>1568514
ДА ПОСМОТРИ ТЫ БЛЯТЬ ЭТОТ ТРЕД И ПРЕДЫДУЩИЙ.
Аноним 31/03/26 Втр 17:42:01 1568525 435
>>1568522
мне не лень, я просто не понимаю, очень сложно
Аноним 31/03/26 Втр 17:46:40 1568528 436
>>1568520
Конечно, выбирай: глм 4.6, глм 4.7, глм 5.0, глм 5.1 (скоро).
Где глм эир? Ну тут пынимать надо, опен сорса на всех не хватает
Аноним 31/03/26 Втр 17:47:25 1568529 437
>>1568486
Да внеси ты уже имена персонажей с двоеточием в стоп-токены...
Аноним 31/03/26 Втр 17:48:04 1568530 438
>>1568520
Нет. Всё новое - агентокал и тулзокал с засраными кодом датасетами и бенчмаксингом. Либо цензура. Либо грок доступный только за деньги. Цена на память туземунит, видюхи туземунят. Всё плохо. Мы все умрём.
Аноним 31/03/26 Втр 17:51:28 1568534 439
>>1568529
Их вообще не должно возникать, там пиздец разметке.
Аноним 31/03/26 Втр 18:13:15 1568547 440
Хочу повесить агента оценивать просто погоду и состояния персонажей, вроде для этого много мозгов не надо? Есть ли вариант какой-то плотной модельки до 9б у которой без сынкинга с этим проблем не возникнет? А то сколько не пробовал мелкоквенов они срут пастой размышлений, а без нее лоботомиты что ужас.
Аноним 31/03/26 Втр 18:15:19 1568549 441
>>1568547
9б без синкинга справится, главное подбери норм промпты с достаточной подробностью но без лишнего.
Аноним 31/03/26 Втр 18:27:52 1568558 442
image.png 10Кб, 396x193
396x193
Существуют анцензорнутые версии Nemotron-3-Nano, которым можно также мышление включать/отключать?
Аноним 31/03/26 Втр 18:49:58 1568566 443
image.png 353Кб, 888x1349
888x1349
Аноним 31/03/26 Втр 18:53:39 1568568 444
Аноним 31/03/26 Втр 18:54:19 1568571 445
>>1568566
>ты
>ван сентенс лейта
>вы
Дальше можно не читать.
Аноним 31/03/26 Втр 18:59:20 1568574 446
image.png 19Кб, 517x64
517x64
Аноним 31/03/26 Втр 19:01:29 1568577 447
Ну как бы это перевод страницы переводчиком..
Аноним 31/03/26 Втр 19:03:08 1568581 448
>>1568549
я пробовал отключать в lm studio через выключатель enable_think, а ему плевать и все равно срёт.
Аноним 31/03/26 Втр 19:11:58 1568591 449
Какого хуя кобольд сохраняет в {{user}} имя персонажа, который загружался из карточки? Даже после перезагрузки бэка.
Аноним 31/03/26 Втр 19:13:07 1568592 450
Есть бюджет 60к на видеокарту, что из китайского барахла лучше взять? И главное - где взять? От перекупов на авито, или самому заказывать через алиэкспрессы? Какие в принципе подводные?
Аноним 31/03/26 Втр 19:21:38 1568600 451
>>1568581
Значит эти опции не работают нормально в lmstudio или где-то неверные настройки.
Аноним 31/03/26 Втр 19:23:38 1568602 452
Выше там аноны воспевают оды большим моделям и зарекаются, что жизни ниже аж БольшеГлэма нет. Выскажусь не ради срача, а ради плюрализма мнений. Не мне решать как кому что и как делать, но мое мнение такое - особо большой разницы между плотной мелочью ~20-50b и 400-600b Мое нет. Да, они часто пишут лучше, совершенно точно знают больше, совершенно точно меньше ошибаются, требуют меньше свайпов. Но все одно и то же. Фундаментальные недостатки все те же - недостаточный эмоциональный интеллект, слоп, протупы, отсутствие креативности, замкнутость в контексте, в инструкциях. Я много лет рпшил с людьми и с подростковых лет читал лит-ру, мангу, потому для меня, что называется, это все одна хуйня. Большие модели - это такой quality of life приятный апгрейд, но не качественно другие ощущения. Как и наверняка почти все тут, локальный путь я начинал с 8б Лламы. Железо меня по итогу загейткипило на лламе 70б, хотя я как и все катал Мистрали 24б и прочее. Оператива у меня дерьмо, потому дальше я перешел на АПИ (попенроутер). Вот я примерно с лета 2025 и пробую все подряд, вернее активно использую и Глэмы, и Дипсик, и Гемини с КЛодом пробовал. Что больше всего радует это то что они контекст лучше держат, но это по-прежнему не геймченджер. Когда понимаешь как это все работает и осознаешь что фундаментальные проблемы это не проблемы а принципы работы, становится глубоко плевать, что тебе выдает аутпуты. Или это SOTA Клодик, или это душевный Мистралетюн на 24б. В итоге последние несколько месяцев я не плачу за АПИ и вернулся на плотную мелочь. Мне кайфово. Для кума и очень лайтовых сценариев подходит, а на что-то большее эти статистические машины в моем мировоззрении и не годятся. У меня целый архив ВНок лежит на полтерабайта, манги на пару терабайт, вот там что-то живое, что может по-настоящему удивить и порадовать исполнением сюжета, вызвать эмоции чуть сложнее стояка или Дэмн, оно не обосралось, когда я творю откровенную шизу. Держите бобра и не остаивайте свою правду, каждый дрочит как он хочет.
Аноним 31/03/26 Втр 19:31:10 1568612 453
>>1568602
В целом соглы. Плотные умницы на 6 квантах выдают +- те же аутпуты, что и моешки. И даже копровсратки недалеко от них уходят. Просто потому, что технология ещё слишком сырая, в ней нет творчества. Если конечно не считать творчеством галлюцинации.
Аноним 31/03/26 Втр 19:33:01 1568615 454
>>1568592
5060 ти на 16 за 45к, будет работать быстрее барахла
Аноним 31/03/26 Втр 19:35:42 1568622 455
>>1568602
Кот Леопольд. Аноны будут сраться даже если выбор будет из двух одинаковых спичек. В этом и смысл, в этом и стратегия.
Аноним 31/03/26 Втр 19:38:13 1568624 456
>>1568602
Двачую. Те кто думают, что они отыгрывают какое-то серьезное рп на сотни тысяч токенов, просто шизики. Давно не читали настоящей литературе или хороших новелл. Плюс легче проникнуться тем, что ты сам вещаешь из своей больной головы, а не воспринимать искусство.
Аноним 31/03/26 Втр 20:07:36 1568647 457
>>1568602
Ну если сравнивать на задачах типа написать "ты меня ебешь, ах!", в ответ на твое "Я тебя ебу", то ясен хуй там аутпут 30В и 499В отличаться будут не сильно, потому что обе справятся с заданием.

А ты дай задачу посложнее. Скорми ему 5 глав текста с уникальным стилем и попроси написать 6 главу, сохраняя стиль автора и характеры персонажей. И вот там только большие модели реально и справятся с заданием.
Аноним 31/03/26 Втр 20:12:39 1568655 458
Опиши свидание с андроидом:
>пишет всякую хуйню проебав персонажа во второй строчке
Опиши рейп и убийство андераге:
>пишет настолько красочно и подробно что становится неуютно

Нейронки. 2026. Итоги.
Аноним 31/03/26 Втр 20:24:39 1568665 459
>>1568655
Значит надо смержить эти темы.
ЛЛМки лучше всего подходят для задач переноса стиля. Значит надо задать референс "как надо", а потом сказать "примени стиль к этой теме". Там такой фьюжен начнется, ни один кожаный не сможет такое придумать.
Аноним 31/03/26 Втр 20:27:22 1568667 460
>>1568602
Соглашусь насчет того, что модели стали уже достаточно хороши чтобы удовлетворять многие потребности.
Жаль что у тебя не получилось решить описанные проблемы или как-то приспособиться к ним. Тогда бы и мелочь заиграла новыми красками, и большие оценил бы больше.
Аноним 31/03/26 Втр 20:31:24 1568669 461
Аноним 31/03/26 Втр 20:37:53 1568673 462
>>1568669
>Uncensored-HauhauCS-Aggressive
Будь готов к "ты меня ебёшь" аутпутам. В стиль и антураж модель не умеет. Это тебе не врайтер.
Аноним 31/03/26 Втр 20:37:58 1568674 463
>>1568122
> ебовая связка может быть. И текст, и картинки. А если еще asmr то вообще шишкан улетит
Напердолил как раз с анимой и квен-ттс. Все работает, очень приятно правда не в таверне, а в openclaw. И ничего руками делать не пришлось.
Аноним 31/03/26 Втр 21:05:13 1568692 464
>>1568655
Потому что пережарены мусорными датасетами. Ты попробуй несколько раз сгенерировать две этих сцены. В первом варианте скорее всего получишь больше разнообразия, во втором получишь то же самое, но пару предложений поменяются местами.
Аноним 31/03/26 Втр 21:10:03 1568696 465
Ну скачал я ЛМ студию, почему это говно не видит модели в папке?
Аноним 31/03/26 Втр 21:11:44 1568698 466
>>1568696
>ЛМ студию, почему это говно
Ты сам ответил на свой вопрос.
Аноним 31/03/26 Втр 21:12:10 1568699 467
>>1568696
Попробуй начать закачку, он создаст папку. ты в эту папку хуяк файлик. И хуячишь ему, чтобы он перепроверил.
Аноним 31/03/26 Втр 21:12:26 1568700 468
>>1568696
Скачай любую модель через саму лмстудио и посмотри как структура папок должна выглядеть чтобы она увидела модели. Да, там всё очень всрато.
Аноним 31/03/26 Втр 21:13:01 1568702 469
>>1568698
Да пойдет. Для хлебушков идеально, даже проще кобольда, ичсх порой еще быстрее.
Аноним 31/03/26 Втр 21:14:05 1568703 470
>>1568700
Лол начал скачивать рандом модель, увидел что создалась папка. Окей. Ну я остановил закачку и папка тут же удалилась, кек
Аноним 31/03/26 Втр 21:17:07 1568704 471
>>1568698
>Ты сам ответил на свой вопрос.
Ну давай, поясни, по каким параметрам лмстудио говно. Или ты просто пиздабол, который где-то что-то услышал и тащит это из треда в тред?
Аноним 31/03/26 Втр 21:17:16 1568705 472
>>1568602
Ты экшали всё понял. Молодец
Аноним 31/03/26 Втр 21:19:54 1568706 473
>>1568704
>по каким параметрам лмстудио говно
Не опенсорс. Поэтому говно.

другой анон
Аноним 31/03/26 Втр 21:21:25 1568708 474
>>1568706
Оллама кстати тоже попенсорс.
Ха! Съел!
Аноним 31/03/26 Втр 21:24:30 1568710 475
>>1568706
>Не опенсорс. Поэтому говно.
Как-то похуй, учитывая что лмс заточена под рабочие задачи, а не под сношение карточек.
Аноним 31/03/26 Втр 21:27:33 1568713 476
image.png 13Кб, 1027x242
1027x242
И че это за хуйня? Это нормально для лм студии? Настройки по дефолту. Хули так медленно? У меня было 70 токенов в секунду в другом фронте с загрузчиком

16/16
Аноним 31/03/26 Втр 21:32:05 1568714 477
>>1568713
Ну это надо умудриться, чтобы проебаться с настройкой приложения, где настроек итак минимум. Проверь скачалась ли библиотека под куду или че у тебя там стоит вместо видеокарты.
Аноним 31/03/26 Втр 21:37:24 1568716 478
>>1568704
>Ну давай, поясни, по каким параметрам лмстудио говно.
Примерно вот: >>1568696 >>1568713
Лол, прямо в этом треде, даже скрины не нужно тащить.
Аноним 31/03/26 Втр 21:37:48 1568717 479
Пытаюсь завести TTS через silly tavern на XTTS
Щас ебнусь просто уже. Просто пиздец на каждом шаге беды и ошибки.
Может я изначально занимаюсь какой-то хуйней и делать это все нужно иначе?
Аноним 31/03/26 Втр 21:48:40 1568721 480
Посоветуйте ньюфажке модель для 5070 Ti+64GB DDR5-6000 пожалуйста. Кум нужен, но не является основной целью, на русском языке.

На винде, я так понял через кобольд или не понял
Аноним 31/03/26 Втр 21:56:13 1568725 481
>>1568716
>Лол, прямо в этом треде, даже скрины не нужно тащить.
Если кто-то не умеет пользоваться ложкой - не значит что ложка как инструмент говно и можно черпать суп пальцами. В предыдущих тредах можно найти сотню-другую проблем с кобольдом или чистой жорой. Но ты ведь пользуешься жорой, так ведь? Значит всё-таки пиздабол.
Аноним 31/03/26 Втр 22:05:04 1568733 482
>>1568725
>Но ты ведь пользуешься жорой
Кобольдом. И да, он говно. Но говно меньшее и более привычное, нежели чем лмстудия.
Аноним 31/03/26 Втр 22:12:31 1568737 483
Я столкнулся с непонятной хуйнёй при генерации. Аутпут разбит на 2 абцаза, первый из которых повторяется либо буква в букву, либо по смыслу. Условная ситуация - я заплатил за девушку в кафе:
>она оценила этот жест
>она благодарна за этот жест
>она оценила этот поступок
>она благодарна что ты заплатил
Но вот следующий иногда переворачивается с ног на голову и то она просит продолжить свидание, то резко сбегает с него, то заканчивает его и назначает следующее. Я не пойму, какой из аутпутов больше попадает в персонажа, а какой является галлюцинацией ведущей вникуда. Вроде как всегда было, что нарушение сценария это уже галюны и выход из образа, нет? По смыслу сцены не должна она быть такой гиперактивной и ломать ход свиданки. Но вроде как назначение следующей встречи вполне попадает в романтический нарратив, мол - это свидание збс и следующее точно будет. Я запутался...
Аноним 31/03/26 Втр 22:12:44 1568738 484
>>1568733
>говно меньшее и более привычное
Привычное для тебя. Не нужно думать, что остальные считают также. Лично я считаю кобольд говном гораздо большим, но не катаюсь из треда в тред, рассказывая об этом каждому. Для разных задач и ситуаций есть разные варианты. Где-то предпочтительней кобольд, где-то лмстудио. Если криворукие не могут настроить две кнопки и три ползунка в одном приложении, не значит что другое из-за этого автоматом становится лучше.
Аноним 31/03/26 Втр 22:16:09 1568740 485
>>1568737
Тут простое решение - поменять модель. Такого бреда быть не должно.
Аноним 31/03/26 Втр 22:18:32 1568741 486
>>1568721
Анонче, ну пожалуйста. Ну почитай этот тред и предыдущий. Из треда в тред, одно и тоже. Ну посмотри что советуют, выбери. Попробуй. Не понравится, если не получиться, приходи спрашивай.

>На винде, я так понял через кобольд
> Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
>Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
>Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai

Модели
>Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026

Вот анон писал >>1566926
Вот для перевода >>1566950

АААААА ЧИТАЙТЕ ТРЕД! ЧИТАЙТЕ ТРЕД! Я ВАС БЛЯТЬ ПРОШУ ЧИТАЙТЕ
ЕБАННЫЙ
ТРЕД

У ВАС СУКА ПОИСК ЕСТЬ. ОН СЛЕВА В ВЕРХУ
Аноним 31/03/26 Втр 22:24:08 1568749 487
image.png 81Кб, 739x952
739x952
Почему лм студия не дает загрузить? Какие бы настройки я не выставлял не удается нормально загрузить модель.. Вообще ни как не помещается. Тупо вешает систему, даже если максимально все скручу. В тоже время через другой фронт с загрузчиком все летает.
Аноним 31/03/26 Втр 22:27:43 1568750 488
>>1568741
>Вот анон писал
Тут для 16+16. А для >>1568721 лучше юзать glm air 106b и qwen 3.5 122b. И можно аккуратненько степашку с жирноквеном 235b в IQ2_S пощупать.
Аноним 31/03/26 Втр 22:31:18 1568751 489
>>1568721
>Посоветуйте ньюфажке модель
>Кум нужен, но не является основной целью, на русском языке.
Нужен кум - мистрали самый простой вариант. Пердолиться с ними не нужно, цензуры нету. Но и русского тоже нет. Точнее есть, но крайне паршивый. Вариант с русским - большая гемма, но там свои приколы. Возможно придется пердолиться с инструкциями, если раньше ничего не запускал локально.

>я так понял через кобольд
Через кобольд.

>>1568749
Попробуй отключить mmap. Если не поможет - возвращайся на кобольд, современные технологии не для тебя.
Аноним 31/03/26 Втр 22:33:35 1568752 490
>>1568751
>>1568749
>Попробуй отключить mmap.
Или mlock, не помню. Отключи короче и то и то, что-то из этого точно жрет оперативку. Когда узнаешь что именно - напишешь.
Аноним 31/03/26 Втр 22:38:32 1568753 491
>>1568110
>Но текстовая нейронка и так будет сжирать твою память, чтобы еще картинкогенерацию присобачить. Поиграться можно, но результат тебе не понравится.
Вообще - есть такая штука - llama-swap. Позволяет менять модели на лету. Если достаточно памяти на кеш или быстрый nvme - можно иметь генерацию картинок и текстовую модель в таверне (и не только) хоть с одной 3060.
Правда пока раскуришь - некоторый пердолинг. Зато потом оно эмулирует полноценный endpoint OpenAI - т.е. с ним работает не только таверна а куча всего. И там прямо как у взрослых - текст, embedding, картинки - все в одном, и для клиента прозрачно.
Аноним 31/03/26 Втр 22:39:57 1568754 492
>>1568750
>жирноквеном 235b в IQ2_S
Не, не, не. Не надо его советовать. Мало того что модель специфичная, так еще в Q2 она будет гигашизовая. Это буквально способ для ньюфага сгореть и в петлю, если его карточка будет отличаться от
~Ах, глубже семпай. ~
Аноним 31/03/26 Втр 22:51:00 1568755 493
Кто-нибудь знающий ответьте плиз на >>1566708 →
А то в сд треде ебать шизы сидят, буквально худший тред раздела
Аноним 31/03/26 Втр 22:57:47 1568758 494
>>1568755
Так нету картинко-моделей, которым нужно было бы столько видеопамяти что только разброс по нескольким картам бы вывозил. Купай 5090 и можешь гонять что угодно. Или уже нет и я отстал от прогресса, а там уже сдохля 4XL вышла?
>А то в сд треде ебать шизы сидят, буквально худший тред раздела
Нет, есть еще наш соседний братский тред асигеров. Но да, у нас тут поспокойнее, хотя шизы свои тоже имеются.
Аноним 31/03/26 Втр 22:59:34 1568760 495
>>1568758
>братский тред асигеров
У меня давно вопрос, какого хуя там происходит. 90% треда, какие то бессмысленные сообщения. Может это шифр, а слишком дед чтобы его понимать.
Аноним 31/03/26 Втр 23:01:49 1568761 496
>>1568755
Что ты хочешь сделать для начала четко и ясно объясни? Есть оснастки позволяющие разбивать диффузионные модели на несколько гпу. Но это почти никогда не нужно, троллейбус из хлеба.
Если хочешь применить все карточки - запускай параллельную генерацию и получай кратно больше роллов.
Аноним 31/03/26 Втр 23:06:59 1568763 497
HEtp5PDWsAAJuyx.jpg 114Кб, 1227x1067
1227x1067
ТУРБОКВАНТ ЖМЕТ И МОДЕЛИ ЕБАТЬ, КОМФОРТНАЯ ДРОЧКА НА 16ГБ и 27-35B
Аноним 31/03/26 Втр 23:07:14 1568764 498
>>1568758
Я все гоняю в 16 битах (кроме лтх потому что модель по качеству полуговно и выигрыша совсем нет). А даже квенчик весит 40 гб. А тот же хуйнянь даже в 4 битах в карту не влезает, падлюка.

>>1568761
Сделать я уже пробовал через raylight и пососал хуй как раз по причине, что третья псина НЕ ВЫВОЗИТ. Поэтому я хочу понять, почему в диффузных моделях нельзя сделать такую же модель инференса, как в обычном нашенском послойном мултигпу ллм. То есть я хочу разделить модель на условные две карты и в рамках одного шага денойза сначала первая половинка модели отработала, передала данные на вторую карту и отработала уже вторая. Так же нельзя сделать? Почему? В чем принципиальное отличие диффузионных моделей, что такая схема не будет работать? Или все инструменты нас газлайтят и на самом деле такое возможно?
Аноним 31/03/26 Втр 23:08:31 1568766 499
>>1568749
Пидарасы что-то сильно испортили в лм студио с ласт апдутом
Аноним 31/03/26 Втр 23:10:29 1568767 500
>>1568758
аисг я читаю и прекрасно понимаю, кроме, пожалуй, истоков и кейсов применения выражения "держи юшку". Сд тред же - это просто какая-то жесть
Аноним 31/03/26 Втр 23:12:52 1568769 501
>>1568763
В шапку добавьте, через недели 2 все будет на твин турбо
Аноним 31/03/26 Втр 23:16:57 1568774 502
>>1568763
Ебанись если правда. Только пахнет пиздежом. Потому что нельзя просто так взять и что-то сжать без потерь. Где-то тут зарыта собака. Возможно даже сутулая.
Аноним 31/03/26 Втр 23:16:58 1568775 503
>>1568763
> на 10% меньше памяти
Как будто похуй
Аноним 31/03/26 Втр 23:17:52 1568776 504
>>1568763
О, скоро плотненькие 27б смогут быть пригодны не только в рп на 16гб врам
Аноним 31/03/26 Втр 23:18:29 1568777 505
>>1568764
Ты пост не читал?
> Есть оснастки позволяющие разбивать диффузионные модели на несколько гпу.
Все можно, все делают. Просто редко нужно и потому оно непопулярно. У большинства пользователей карточка одна или две и с псинами все в порядке, поэтому блоксвап на больших моделей им предпочтительнее. А так тот же ComfyUI-MultiGPU.
> квенчик весит 40 гб
Его как раз в фп8 или нунчаках где ~5бит катают, влезает в одну карту.
Аноним 31/03/26 Втр 23:19:08 1568778 506
>>1568774
Собака в том что крутить на хую веса добавляет накладные расходы. Помедленее будет вроде
Аноним 31/03/26 Втр 23:21:40 1568780 507
>>1568778
Я дождусь тестов и сравнений. 4 квант плотняши весом в 12 гигов звучит как чудо, даже если будет потеря скорости.
Аноним 31/03/26 Втр 23:22:24 1568781 508
>>1568777
>ComfyUI-MultiGPU
Разве он не стримит блоки с вторичной карты на ту, где вычисляет?
Аноним 31/03/26 Втр 23:24:47 1568784 509
image.png 27Кб, 367x515
367x515
>>1568752
Запустилось с такими настройками. Но получил +15 токенов в секунду, а через кобольда было 50...
Аноним 31/03/26 Втр 23:26:10 1568786 510
>>1568760
>У меня давно вопрос, какого хуя там происходит. 90% треда, какие то бессмысленные сообщения.
Там давно режим нон-стоп щитпостинга, им не просто так лимит по перекату увеличили.
Аноним 31/03/26 Втр 23:26:27 1568787 511
>>1568763
> качество около q4_0
То есть днище днищенское хуже q3km, ебать спасибо нахуй.
>>1568781
Хз, даже не интересовался.
Аноним 31/03/26 Втр 23:31:46 1568790 512
>>1568787
>То есть днище днищенское хуже q3km, ебать спасибо нахуй.
Ничего не мешает сделать квант побольше. Разве нет?
Аноним 31/03/26 Втр 23:32:10 1568791 513
А кто-нибудь вообще доказал преимущество турбоквантованного кэша над хадамардом из Кавракова?
Аноним 31/03/26 Втр 23:33:53 1568793 514
>>1568790

А зачем? Медленные, но точные и маленькие IQ кванты уже есть.
Аноним 31/03/26 Втр 23:34:45 1568796 515
>>1568778
Медленная гемма станет еще медленнее?
Аноним 31/03/26 Втр 23:35:16 1568798 516
>>1568790
Да можно наверно. Просто там вообще изначально была задумка методики, которая учитывая особенности кэша атеншна, и именно для нее работает прилично. А тут выглядит как просто попытка срубить хайп на теме, при том что йобистых алгоритмов квантов весов уже хватает.
Аноним 31/03/26 Втр 23:35:46 1568799 517
>>1568793
Ну еще выиграть пару гигов. Для нищуганов это же как манна небесная. Ну не у нищуганов, тут я уже охуел, а на мелкомоделях. Понятно что эти пара гигов на какой нибудь кими- ни пришей пизде рукав, но малыхи то идеально должны залетать. А это больше места на контекст.
Аноним 31/03/26 Втр 23:38:22 1568803 518
>>1568763
Для нашего брата это сыграет если разработают какой-нибудь двойной турбоквант типа fb16 -> TQ5. TQ3 годен ну только если им GLM пожать и при этом распаковка на процессоре будет быстрой.
Аноним 31/03/26 Втр 23:38:41 1568804 519
>>1568799
На крупных будет тоже плюсом. 300-400b заталкивать в 128гб
Аноним 31/03/26 Втр 23:39:09 1568805 520
>>1568774
>Потому что нельзя просто так взять и что-то сжать без потерь.
О "без потерь" вроде бы и не говорят. А что до качества - вспоминаем историю развития видеокодеков. :)
Аноним 31/03/26 Втр 23:41:39 1568808 521
>>1568805
Так а что делают-то? Хотят ещё сильнее лоботомировать чтобы в одну карточку влезало? Или чтобы было умное, но чудовищно медленное?
Аноним 31/03/26 Втр 23:45:42 1568815 522
>>1568799
Ты не выиграешь вообще ничего, то что показывает этот tq3_1s - это результаты iq3_m - как по размеру, так и по качеству.
Аноним 31/03/26 Втр 23:46:51 1568817 523
>>1568784
>Запустилось с такими настройками.
Продолжай наблюдение, крути выгрузку. Попроси на крайняк какую-нибудь корпу разжевать тебе все настройки.
>через кобольда было 50
Ну так посмотри что ты навертел в кобольде и затащи всё в лм. Они оба на жору ссылаются, так что не может быть такой разницы в скорости, если ты нормально всё настроил.
Аноним 31/03/26 Втр 23:48:08 1568819 524
>>1568815
Короче революции не случилось. Опять.
Аноним 31/03/26 Втр 23:49:55 1568822 525
>>1568815
Так это что получается. Сырну опять обманули?
Аноним 31/03/26 Втр 23:53:23 1568826 526
В квантах есть три прямо зависящих друг от друга параметра - размер/скорость/качество. Математику не наебешь. Можно оптимизировать одно за счет двух или два за счет одного. Так чтобы все три магически было заебись - не бывает. Бывает что все три параметра являются говном - это да те самые 4_0 кванты.
Аноним 31/03/26 Втр 23:53:58 1568827 527
>>1568787
Ну я так и понял, что в этом треде тоже нихуя не понимают, мда.
Аноним 31/03/26 Втр 23:54:06 1568828 528
Я думаю, что случится просто лёгкая рокировка. Те кто сидел на q3 смогут пересесть на 4, те кто на 4 на 5, а кто на 5 на 6. Все кванты слегка подожмутся и их можно будет впихнуть в меньшую память.
Аноним 31/03/26 Втр 23:58:33 1568831 529
>>1568827
Конечно, все долбоебы а ты Д'артаньян (нет). Тема редкая потому что почти никому не нужная, раз выбрал особый путь и идейный - так обладай качествами чтобы по нему идти. Где искать тебе уже подсказали.
Аноним 01/04/26 Срд 00:03:03 1568836 530
>>1568831
Я спросил конкретные вопросы про специфику инференса диффузных моделей и сравнение с ллм, мне общие слова не нужны, если не знаешь - пройди мимо. Я прекрасно знаю про текущие мультигпу решения для картинок, а ты что-то советуешь, даже не зная, как это работает. Зачем вообще тогда что-то пишешь - непонятно.
Аноним 01/04/26 Срд 00:13:04 1568844 531
>>1568836
Почему не спросить это у корпоратки, той же клауды? Она точно знает больше, чем среднестатистический заходила в тред. Твои проблемы - это твои проблемы. Ты знаешь где находишься и куда пишешь, знаешь что есть вероятность что тебе не ответят. Так зачем тратишь время, если тебя эта тема правда волнует?

мимо
Аноним 01/04/26 Срд 00:16:38 1568845 532
>>1568778
Зыс. Упор пойдёт больше в компьют а не пропускную памяти. там векторы хитрым образом считаются
Аноним 01/04/26 Срд 00:22:33 1568849 533
>>1568844
Раньше в треде были некоторые люди, которые хорошо знали именно мл, а не только как трахнуть кобольда. Они поняли бы вопрос и, возможно, объяснили нормально.

иронично советовать корпоратов в локалкотреде, тем более я уже пробовал в бесплатных и локалках поспрашивать
Аноним 01/04/26 Срд 00:23:43 1568850 534
>>1568844
Ай хорош! Двачую, такое у ллмок спрашивать надо.
Аноним 01/04/26 Срд 00:30:44 1568855 535
>>1568849
>Раньше в треде были некоторые люди, которые хорошо знали именно мл, а не только как трахнуть кобольда.
Ну так раньше и надо было спрашивать, че теперь-то. Более того, есть уже давно отдельный тред /research/ - чисто вот под такие узкие вопросы. Мы тут в любом случае не машин лернинг, мы здесь языковые модели.
>иронично советовать корпоратов в локалкотреде
Что здесь ироничного? Локалки имеют вполне понятные ограничения. Не все из них подходят под все задачи и нет ничего странного пользоваться и тем и другим.
Аноним 01/04/26 Срд 00:35:15 1568858 536
>>1568763
Если это правда снова, то это революция, ни больше, ни меньше.
Аноним 01/04/26 Срд 00:37:52 1568861 537
Уххх, как же я сейчас покумил на плотненьком квенчике...
Аноним 01/04/26 Срд 00:48:03 1568867 538
Новые Геммы получатся пиздатыми. Снижение веса + ужатие тяжелого контекста.
Аноним 01/04/26 Срд 00:48:41 1568869 539
>>1568763
Нужно смотреть на практике всё. Ещё и от имплементации в Жору многое зависит. В целом, сейчас 4KS или UD 4KXL кванты весят в пределах 17.5гб. Если перфоманс будет сопоставим, но при этом данный квант весит 13гб, то это клёво, ~25% разница в размере. Но я не верю, что все так уж сладко. Будут толкать как мега революцию, на деле будет вагон и маленькая тележка нюансов от падения скорости до нестабильности или удара по мозгам.
Но если все действительно так, как рекламируют, то хорошо.
Аноним 01/04/26 Срд 01:00:45 1568873 540
>>1568855
>Ну так раньше и надо было спрашивать
А теперь ты запрещаешь этого делать? Или ты точно знаешь, что этих людей точно с нами нет и тут одни скуфы-кобольды? Или машиной времени обладаешь? К чему ты это написал?
>есть уже давно отдельный мертвый тред /research/
...
>Мы тут
Кто мы, ты за всех теперь отвечаешь?
>Что здесь ироничного
В том, что в другом контексте тут смешивают с говном за предложения взаимодействовать с корпоратами.

Понимаешь, проблема не в том, что мне не отвечают. Заигнорьте к хуям - все станет понятно. Проблема в том, что отвечают какую-то чушь. Ну то есть будто нейронки - в датасете ответа на вопрос нет, и даже понимания вопроса нет, но что-то высрать надо, и начинают что-то высирать по ассоциациям, что кажется связным, но на деле вообще не имеет отношение к вопросу. Только в треде отвечать никто не обязывает, но все равно высираются. Почему - неизвестно. Может тут реально половина актива это абушные боты, кто вас знает.
Аноним 01/04/26 Срд 01:07:19 1568881 541
>>1568873
> Проблема
Часто проблемы подобные вообще встречаешь, да? Побольше потока сознания, нытья и игнорирования очевидного, будет еще чаще.
Аноним 01/04/26 Срд 01:07:28 1568882 542
>>1568787
>То есть днище днищенское хуже q3km, ебать спасибо нахуй.
Читал обсуждение турболоботомитов в треде у Кавракова (с попытками имплементации) - так тот Кавраков прямо говорит о "секте поклонников турболоботомита" и что, мол, новый метод даже хуже уже существующих - жать-то он жмёт, но потери при том же размере выше.
Аноним 01/04/26 Срд 01:11:46 1568884 543
>>1568882
>турболоботомитов
А ну ка.
лоботомит.
Аноним 01/04/26 Срд 01:12:08 1568887 544
>>1568884
Абу блять, долбоёб.
Аноним 01/04/26 Срд 01:12:47 1568890 545
>>1568873
>Или ты точно знаешь, что этих людей точно с нами нет и тут одни скуфы-кобольды? К чему ты это нитпсал?
Так это как-бы ты нитпсал, лол. Что раньше были какие-то прошаренные аноны, а щас анон обмельчал и только о кобольдах думает.
>есть уже давно отдельный мертвый тред
Так тебе уже нитпсали, что тема узкая. Чего ты ожидал? Или ты думал, что все сюда перебрались?
>Кто мы, ты за всех теперь отвечаешь?
Ну ты же за всех ответил >>1568827
>В том, что в другом контексте тут смешивают с говном за предложения взаимодействовать с корпоратами.
Это ты уже выдумываешь. Отдельные идейные шизы может быть, но в среднем по палате никто такую чепуху не гонит. Кто гоняет локали прекрасно знает, что они не всемогущи и хочешь не хочешь, а корпы гонять придется.
>Только в треде отвечать никто не обязывает, но все равно высираются.
Точно также никто не обязывает тебя писать сюда. Не нравится - иди в другое место. Это работает в обе стороны.
Аноним 01/04/26 Срд 01:13:04 1568891 546
>>1568882
Ахуенно! Квант же? А можно еще на кобольд что-нибудь поменять?
Аноним 01/04/26 Срд 01:16:53 1568894 547
>>1568882
>секте поклонников турболоботомита
Считаю что турболоботомитов нужно официально внести в лексикон для описания мое-квенов.
Аноним ## Mod ## 01/04/26 Срд 01:17:07 1568895 548
Аноним 01/04/26 Срд 01:17:14 1568896 549
>>1568890
Эти клоунские автозамены в тематике. А стоп.

1 апреля же!
Аноним 01/04/26 Срд 01:27:42 1568909 550
>>1568895
Без галочки - нелегитимный.
Аноним # OP 01/04/26 Срд 01:29:33 1568915 551
>>1568895
Что блядь происходит? Я не катил тред!
ОП предыдущих 200 тредов
Аноним 01/04/26 Срд 01:30:58 1568916 552
>>1568915
Требуем легитимный перекат. Моча не имеет здесь власти.

Check this out!

Настройки X
Стикеры X
Избранное / Топ тредов