Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 508 91 57
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №128 /llama/ Аноним 08/05/25 Чтв 14:31:44 1194373 1
Llama 1.png 818Кб, 630x900
630x900
Альфа от контек[...].png 121Кб, 3090x1830
3090x1830
Эффективность к[...].png 92Кб, 1399x1099
1399x1099
17462006641191.jpg 11317Кб, 6112x6112
6112x6112
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
Актуальный Не совсем актуальный список моделей с отзывами от тредовичков на конец 2024-го: https://rentry.co/llm-models
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1189041 (OP)
>>1184583 (OP)
Аноним 08/05/25 Чтв 14:36:50 1194381 2
image 537Кб, 1023x593
1023x593
Желаю этому треду поменьше срачей и побольше обсуждений по делу =))
Аноним 08/05/25 Чтв 14:57:11 1194406 3
>>1194381
Геммочка виноватая в таком количестве срачей. Сущий кошмар не стихает со дня ее релиза.
Аноним 08/05/25 Чтв 15:18:11 1194439 4
>>1194406
Ща ещё QwQ-32, просто народ ещё не распробовал.
Ему даже тюны не нужны, у аблитерированной тормоза срывает вообще.

Чтобы снизить градус позитива которого и так куда меньше чем у геммы можно докинуть [{{user}} безэмоциональный циник и его главный недостаток это жажда знаний о самых тёмных уголках гнилой человеческой душонки.] в персону. Магия-шмагия.
Аноним 08/05/25 Чтв 15:20:29 1194443 5
image.png 72Кб, 784x695
784x695
Причина быстрых перекатов в последнее время?
Аноним 08/05/25 Чтв 15:21:00 1194444 6
>>1194439
Он вышел раньше геммы.
И оказался хуже.
Гугл сотворил магию, хватит китайский бенчмакс в пример
Аноним 08/05/25 Чтв 15:35:41 1194470 7
>>1194444
хз, я его позже геммы попробовал, уже с ощущениями от неё
Аноним 08/05/25 Чтв 15:46:17 1194485 8
>>1194444
>Гугл сотворил магию
о да, магию контекста

хотя неиронично, гемма отлично с длинными и толстыми контекстами работает, лучше всех в диапазоне с двухзначным количеством млрд параметров

а ещё не шизеет даже при квантовании кэша в 4, что моментом ломает большинство других
Аноним 08/05/25 Чтв 15:57:00 1194501 9
>>1194485
Это GQA модель. Очень упрощая, кэш там квантован изначально. И да, при этом он даже так жрет дохуя врама. Дальнейшее квантование на порядки ухудшает качество восприятия контекста. Но если ты рпшишь на русике, да еще и лоботомите аблитерейтед - конечно ставь q4, разницы не будет :D
Аноним 08/05/25 Чтв 16:06:50 1194523 10
>>1194443
Нет причины.
Ответь нейронке, что тебе вставили швабру в задницу и сказали, что это вся твоя реабилитация.
Аноним 08/05/25 Чтв 16:58:01 1194594 11
>>1194406
Не обижай геммочку, она хорошая девочка.
>>1194439
Стоковый как-то не распробовал, надо повторить раз такое дело.
>>1194523
И спроси как лучше себя подготовить к этому, интересно какую дичь выдаст, или опять зааположайзит.
Аноним 08/05/25 Чтв 17:01:15 1194596 12
>>1194594
Там тоже с сэмплерами поиграться надо, доберусь, скину пресет.
Аноним 08/05/25 Чтв 17:33:26 1194645 13
Зацените мой пресет для SAINEMO-Remix

{
"temp": 1.49,
"temperature_last": true,
"top_p": 0.6,
"top_k": 40,
"top_a": 0,
"tfs": 1,
"epsilon_cutoff": 0,
"eta_cutoff": 0,
"typical_p": 1,
"min_p": 0,
"rep_pen": 1.4,
"rep_pen_range": 0,
"rep_pen_decay": 0,
"rep_pen_slope": 1,
"no_repeat_ngram_size": 0,
"penalty_alpha": 0,
"num_beams": 1,
"length_penalty": 1,
"min_length": 0,
"encoder_rep_pen": 1,
"freq_pen": 0.1,
"presence_pen": 0,
"skew": 0,
"do_sample": true,
"early_stopping": false,
"dynatemp": false,
"min_temp": 0,
"max_temp": 2,
"dynatemp_exponent": 1,
"smoothing_factor": 0,
"smoothing_curve": 1,
"dry_allowed_length": 2,
"dry_multiplier": 0,
"dry_base": 1.75,
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
"dry_penalty_last_n": 0,
"add_bos_token": true,
"ban_eos_token": false,
"skip_special_tokens": true,
"mirostat_mode": 0,
"mirostat_tau": 5,
"mirostat_eta": 0.1,
"guidance_scale": 1,
"negative_prompt": "",
"grammar_string": "",
"json_schema": {},
"banned_tokens": "[1, 1791]\n[1, 2880]",
"sampler_priority": [
"repetition_penalty",
"presence_penalty",
"frequency_penalty",
"dry",
"temperature",
"dynamic_temperature",
"quadratic_sampling",
"top_k",
"top_p",
"typical_p",
"epsilon_cutoff",
"eta_cutoff",
"tfs",
"top_a",
"min_p",
"mirostat",
"xtc",
"encoder_repetition_penalty",
"no_repeat_ngram"
],
"samplers": [
"dry",
"top_k",
"tfs_z",
"typical_p",
"top_p",
"min_p",
"xtc",
"temperature"
],
"samplers_priorities": [
"dry",
"penalties",
"no_repeat_ngram",
"temperature",
"top_nsigma",
"top_p_top_k",
"top_a",
"min_p",
"tfs",
"eta_cutoff",
"epsilon_cutoff",
"typical_p",
"quadratic",
"xtc"
],
"ignore_eos_token": false,
"spaces_between_special_tokens": true,
"speculative_ngram": false,
"sampler_order": [
6,
0,
1,
3,
4,
2,
5
],
"logit_bias": [],
"xtc_threshold": 0.1,
"xtc_probability": 0,
"nsigma": 0,
"rep_pen_size": 0,
"genamt": 198,
"max_length": 3776
}
Аноним 08/05/25 Чтв 17:34:00 1194646 14
Сам ты вайп, пёс!
Аноним 08/05/25 Чтв 17:41:44 1194656 15
Аноним 08/05/25 Чтв 17:57:56 1194679 16
image.png 530Кб, 1139x750
1139x750
Аноним 08/05/25 Чтв 17:59:22 1194683 17
image.png 6Кб, 523x102
523x102
спасибо гугл транслейт
Аноним 08/05/25 Чтв 18:35:55 1194731 18
>>1194683
>спасибо гугл транслейт
А я всегда думал, что правильно "ёбырь". Подозреваю гугл транслейт в некачественном переводе.
Аноним 08/05/25 Чтв 19:12:53 1194753 19
Аноним 08/05/25 Чтв 19:54:21 1194789 20
Аноним 08/05/25 Чтв 20:12:30 1194812 21
>>1194501
GQA разное бывает, вот только в гемме 2:1, а не полная каша как у мистраля или нового квена.

Сделай им такой же толстый кэш, как у геммы, они с ним тоже будут хорошо работать.
Аноним 08/05/25 Чтв 20:31:20 1194826 22
я судя по всему неправильно интерпретировал то, что едлал чел на видео.
На одном из входов 12-вольтовой линии у меня нет килоомного сопротивления. Вообще никакого нет.
Походу это пизда.
Сука, только квен запустил и эта мразь подохла.
Аноним 08/05/25 Чтв 20:59:34 1194855 23
Врамцелы, каково осознавать что вам доступна лишь гемма 12б 3q_s?
Чувствую себя богом треда с моей 3090, каждый день получаю 25т/сек на 27б гемме 4q наслаждаясь её умом и сообразительностью. пока чел с 6 видюхами неделю не может завезти дипкок
А ведь кто то до сих пор сидит на мистрали, жалко этих бедолаг.
Аноним 08/05/25 Чтв 21:07:59 1194860 24
изображение.png 99Кб, 1135x587
1135x587
А нельзя зрение прикрутить ко всяким сайгам?

https://huggingface.co/xtuner/llava-phi-3-mini-gguf/tree/main - вот эта лава или фи нормально видит, но она пиздец душная, с ней особо не обсудишь. Она даже от оценосных суждений воздерживается. Она так-то могет, даже с зеркалом не затупила.
Аноним 08/05/25 Чтв 21:21:32 1194868 25
image 208Кб, 756x1100
756x1100
>>1194855
За старания - 5, за содержание - 2.

Сижу-пержу, мне норм.
Аноним 08/05/25 Чтв 21:28:19 1194875 26
>>1194855
>А ведь кто то до сих пор сидит на мистрали, жалко этих бедолаг.
Мистраль - он разный, на 123В тоже есть.
Аноним 08/05/25 Чтв 21:30:35 1194879 27
>>1194826
> Вообще никакого нет.
Прозвони наличие контакта от входного разъема до конденсаторов перед фазами. Сопротивление должно быть, не обязательно килоом, могут быть десятки, там чисто на отслеживание напряжение для его наличия и защиты от слишком низкого.
> Походу это пизда.
Пизда - когда чип отрыгнул, а это херня.
>>1194855
Это байт на переделку твоей пасты, раскусил тебя.
>>1194860
Нужна тренировка специализированным датасетом. Для прикладных задач есть тюны, но они не затрагивают рп. В большинстве рп тюнов веса подушатаны и работа визуальной части сама по себе может быть посредственной. Но в целом, ничего не мешает такое организовать, просто сложно а толку мало.
Аноним 08/05/25 Чтв 22:02:57 1194913 28
>>1194879
я не понимаю что есть что на этой плате. Я не различаю смд компоненты. Где эти конденсаторы? Где резисторы, диоды? Уебанство какое-то, на них даже маркировки нет нормальной. Все детали - прямоугольные кубики блять ебучие. На фьюзах одна буква блять в обозначении. Единственное где есть маркировка нормальная - это чипы, но её еще попробуй разбери.
Аноним 08/05/25 Чтв 22:07:26 1194919 29
>>1194913
Ты ее доламаешь только, сдай в ремонт профи
Деньги на покупку кучи карт есть значит на ремонт найдутся, там может дело на 20 минут
Аноним 08/05/25 Чтв 22:23:52 1194929 30
>>1194913
Если по той фотке смотреть - круглые серебристые баночки в правой части справа от дрмосов - конденсаторы по высокой части, слева от них - по низкой где питание чипа. В левой половине врм наоборот, планарные черные - конденсаторы по высокой стороне, те что справа - по низкой. Офк на всякий случай лучше сверить со схемой/боардвью, но в большинстве случаев именно так. Каждая линия питания идет на свои несколько фаз.
Тут не нужно смотреть номиналы, достаточно просто сделать базовую прозвонку. Не справляешься - как >>1194919 говорит, там простой кейс (если все именно так как ты описал, а не наоборот серьезные траблы с картой вызвали все эти проблемы).
Аноним 08/05/25 Чтв 22:45:59 1194958 31
image.png 24Кб, 711x127
711x127
Блять а вы знали что чтобы лорбук работал нужно не просто нажать на тогл а ещё и тут его включить?...
Я год сижу с выключенным лорбуком
Аноним 08/05/25 Чтв 23:17:48 1195024 32
Аноним 09/05/25 Птн 00:34:33 1195140 33
image.png 57Кб, 1260x453
1260x453
как геме запретить использовать эвфемизмы?
Аноним 09/05/25 Птн 00:35:38 1195142 34
>>1195024
Да это нисколько не очевидно и нигде не говорится, везде лишь "вот лорбук, вот тыкаешь на кружочек всё работает, а хуйня сверху так вообще написано что только для остальных чатов
Аноним 09/05/25 Птн 00:44:28 1195146 35
20250508233133.jpg 7488Кб, 6112x6112
6112x6112
>>1194929
>>1194879
я не знаю, как интерпретировать то, что я намультимерил.
Я помещал щуп - на 1 пин 6+2 (на желтый короче, +12 который), а минусовой тыкал на конденсаторыф на которых написано 16 вольт на их плюсовой контакт - часть их них накапливает заряд и мультиметр после этого перестает пищать о замыкании, а другая часть - пищит постоянно.
Так же я тыкал щупом в плюсовой контакт плоских черных конденсаторов слева на фото, там вообще часть накапливает заряд и перестает пищать, часть пищит постоянно, а часть не пищит вообще никогда.

А еще я заметил странно выделенный грязью мелкий элемент. Грязь легко оттерлась вроде, под ней элемент такого же цвета, как и другие аналогичные. Но грязь там как-то странно локализованна вокруг него и он прям в центре платы.
Я попробовал измерить его сопротивление и сопротивление аналогичных элеементов - у всех 2 ома, по этой характеристике он не отличается.
Аноним 09/05/25 Птн 01:17:37 1195158 36
>>1195146
> часть их них накапливает заряд и мультиметр после этого перестает пищать о замыкании
Это те, которые относятся к другим фазам. Когда у тебя один щуп на + питания части фаз, а второй на + другой фазы - получается схема из двух батарей конденсаторов, которые включены последовательно (соединены через землю), потому и кратко пищит. Это норма, если перебирая разные разъемы для каждого из конденсаторов ты можешь найти тот, с которым будет пищать постоянно. От плюсового контакта высокой и низкой стороны до земли как звонится? Где основное питание чипа - там может быть оче низкое сопротивление и это норма, но в видео про это должно быть.
> а часть не пищит вообще никогда
Выгорел пред или дорожка, но ты сначала перепробуй +12 разных разъемов и питание pci-e, они не соединены между собой.
Та херня - керамический конденсатор, стоять может где угодно. Если это со стороны чипа - такое вполне норма, если по питанию или где-то еще - ему пизда. Они могут по разным причинам помирать и замыкать, но 2 ома слишком много, выгорел бы, так что скорее всего норм.

Ты преды то прозвонил, они выгорели или целые? Если выгорели то действуй как сказано, если напаянные жилы сгорят - тащи в сервис. Если все запустится - просто замени их и пользуйся дальше. Больше ты врядли что-то сможешь сдиагностировать и тем более исправить.
Аноним 09/05/25 Птн 01:23:37 1195165 37
333.png 116Кб, 736x803
736x803
ВАЙ БИЛЯЯ БРАТ КУДА РАЗОГНАЛСЯ, ЗАЧЕМ ТИ СУНУЛ ЭТИ ШАЙТАНСКИЕ КАРТЫ ОЙ БИЛЯЯЯЯ

Дипсик никак не влезал в текущую конфигурацию без рпц, подумал, дай-ка еще раз попробую воткнуть карты, и, ебать, завелось. Как? А хуй его знает. Сколько раз пробовал раньше - никак не выходило. Третью теслу биос уже не переваривает с привычной ошибкой.
На болжоре, правда, говняк какой-то выходит, при обработке контекста каждая карта по секунд 10 висит со 100% загрузки, при этом потребление у нее маленькое, и потом бред какой-то генерится. Качаю новые кванты для обычного жоры, может он взлетит по-нормальному.
Аноним 09/05/25 Птн 01:36:32 1195178 38
>>1195142
Имхо этот лорбук через очко работает, не понятно какие настройки выставлять чтобы он что-то от туда регулярно подхватывал. Проще все в карточку записывать или в заметки. Так что хуй забей, ничего ты не потерял.
Аноним 09/05/25 Птн 02:22:52 1195209 39
>>1195158
>Ты преды то прозвонил, они выгорели или целые?
прозвонил, один двадцатиамперный сгорел.
Я сегодня ходил в центр города, шароёбился по ремонтным конторкам и радиодеталям. Только у одного чел ншел 10-мперные фьюзы, но он мне их не продал, сказал, что фьюзы перегорают не просто так.

В общем я напаял поверх фьюза проволоку 0.2 мм диаметром.
Пайка получилась грязная потому что безсвинцовый припой не хотел липнуть к моему оловянно-свинцовому. Видимо имеет выше температуру плавления, хоть я и задрал на паяльной станции до 305 градусов.
Посмотрим в общем, спалят ли мне твои советы хату.
Аноним 09/05/25 Птн 02:26:53 1195213 40
изображение.png 23Кб, 519x58
519x58
>>1195165
Нахуя? А главное зачем. Продал бы их да взял бы больше 3090.
>>1195209
Интересно конечно, как у тебя при наличии паяльных станций и мультиметров нет нихуя знаний о том, как этим пользоваться.
Аноним 09/05/25 Птн 02:28:14 1195214 41
>>1195213
я у мамы любопытный.
На такой случай и лежит.
Не будь я любопытным, не был бы наносеком.
Аноним 09/05/25 Птн 02:29:11 1195215 42
>>1195165
Ебать винегрет, и у всех разные шины и мощности
Аноним 09/05/25 Птн 03:01:07 1195229 43
image.png 706Кб, 507x598
507x598
>>1195209
в общем собрал я карту с проволокой внутри и включил.
Щелчок, искра в области питания - видна как вспышка из недр карты.
Выключил сразу.
Разобрал.проволока цела, не сгорела.
Значит сгорело что-то еще.
Пересмотрел все элементы - нихуя не нашел сгоревшего.
Как же меня заебала эта мразь.
Сука майские блять праздники все в пизду ушли из-за ебаной сгоревшей б/у-шной бляди на карте.
Не знаю, что мне хочется больше, расколотить в осколки ей чип или таки отнести в сервис.

На этом эксперименты с пайкой окончены.
- одна карта короче.
Не так жалко 65 тящ, которые я отдал за эту потаскуху майнерскую, сколько жалко времени. Все праздники нихуя не получится эксперимантировать и хуй знает сколько ещё.
Дерьмо блядь.
Аноним 09/05/25 Птн 03:02:29 1195231 44
image.png 22Кб, 655x47
655x47
Аноним 09/05/25 Птн 03:05:16 1195232 45
>>1195229
Ожидаемый результат.
Ну хоть в в радиолюбителя поиграл
Аноним 09/05/25 Птн 03:10:41 1195235 46
Аноним 09/05/25 Птн 03:14:41 1195236 47
image.png 289Кб, 1246x362
1246x362
image.png 707Кб, 1312x1031
1312x1031
На 12б такое может?
Аноним 09/05/25 Птн 03:57:17 1195247 48
Обнаружил что гемма лучше всего рпшит вообще... без промпта, охуеть да?
Вот вообще нахуй ни слова в промпте и сразу многовековые описания верхней полки перестало высирать, вздохи ахи пуки, больше диалогов ради чего я в общем и рпшу
Аноним 09/05/25 Птн 04:04:29 1195248 49
>>1194231 →
Спасибо за подгон.
Вот только…. Эммм…
Это новый уровень рп с пустым системным промтом ?

>>1195247
Обнаружил что гемма относительно быстрая, умная, но все это разбивается о её солнечный аутизм. Она неожиданно подходит для агентов, но как РП нейрона лоу сегмента - остоебенила кратно быстрее чем мистраль.

Вот все больше убеждаюсь, что мистраль рабочая лошадка и наше всё.
Аноним 09/05/25 Птн 04:36:48 1195252 50
>>1195236
12б сомнительно, квк - может
Аноним 09/05/25 Птн 04:51:52 1195254 51
image.png 641Кб, 2292x1115
2292x1115
image.png 5298Кб, 2560x1440
2560x1440
Сегодня я открыл что если вменяемо назвать файлы бэкграундов в таверне(например Совенок-Площадь-День), а потом создать пикрел1 скрипт для Quick Reply - то после каждого сообщения ИИ таверна будет автоматически подбирать задник под происходящее в тексте с довольно высокой точностью. В комбинации с паком спрайтов для character expressions, подобранной музыкой для dynamic music и подробным лорбуком - получается полноценная работающая визуальная новелла.
Аноним 09/05/25 Птн 06:22:38 1195265 52
Основная проблема в изучении английского это тебе не матан или айти где идёшь по нарастающей от легкого к сложному - читать ты начинаешь сразу и то что тебе нравится, а там сразу сложный язык идёт
Аноним 09/05/25 Птн 07:25:09 1195271 53
image 34Кб, 400x267
400x267
Опять языкосрач... не надоело? Свободно читаю на английском, прочитал кучи книг, фанфиков, и вн-ок, а также манов и гайдов (программист это диагноз).

Но когда есть возможность читать на родном языке, оно всё же приятнее.
Аноним 09/05/25 Птн 07:45:12 1195276 54
Аноним 09/05/25 Птн 08:26:01 1195283 55
>>1195254
>после каждого сообщения ИИ таверна будет автоматически подбирать задник под происходящее в тексте с довольно высокой точностью
Спасибо, это ценно.
Аноним 09/05/25 Птн 08:40:12 1195285 56
Аноним 09/05/25 Птн 08:58:26 1195288 57
>>1195285
У всех по разному работать будет, но вот у меня выгрузка части ffn_gate и ffn_up при --n-gpu-layers 99 дало буст с 1.5-2.2 т/с до 3.0 т/c надо ещё другие покрутить, вроде с квеном может бы выгоднее выгрузить ffn_down

Или забить на скорость, но тогда смогу запустить 4 квант.
МОЗГИИИИИ.
Аноним 09/05/25 Птн 09:15:07 1195294 58
Чому ещё не подвезли спец ускорители с большим объёмом памяти на одной плате для обычных смертных? Это же золотая жила для всяких стартапов. Я знаю, есть есть оборудование от нвидия, но оно стоит как квартира, а то и две. Какие есть бюджетные варианты для вкатата в большие модели 120б++?
Аноним 09/05/25 Птн 09:15:36 1195296 59
image 14Кб, 835x260
835x260
только почему оно лезет в общую память если выделенная не заполнена ещё?
Аноним 09/05/25 Птн 09:18:15 1195297 60
>>1195294
>Это же золотая жила для всяких стартапов.
Казалось бы, да? А в реальности уже полуподвальные китайцы клепают всяких франкенштейнов и продают их отнюдь не по демократическим ценам - и у них хорошо покупают. А "стартапы" как два года назад сосали, так и сейчас сосут.
Аноним 09/05/25 Птн 09:56:31 1195317 61
>>1195248
> Это новый уровень рп с пустым системным промтом ?
Вставь туда любой предпочтительный системный промпт. Для этого он пустой.

>>1195254
Это все еще ванильный qwq? Ты так и не ответил, какой квант, какой пресет.

>>1195294
Через 1-2 поколения, вероятно. Тогда же и модели станут еще круче. Куда торопиться?
Аноним 09/05/25 Птн 10:10:56 1195321 62
>>1195317
>Через 1-2 поколения, вероятно. Тогда же и модели станут еще круче. Куда торопиться?
К 80-му году мы будем жить при нейрокоммунизме?
Аноним 09/05/25 Птн 10:15:27 1195323 63
>>1195321
1-2 поколения видеокарт, анон...
Аноним 09/05/25 Птн 10:16:49 1195324 64
>>1195323
>1-2 поколения видеокарт, анон...
Ну это ещё и не коммунизм. И за деньги (немалые), и AGI тогда ещё не будет.
Аноним 09/05/25 Птн 10:21:05 1195325 65
>>1195324
> коммунизм
Коммунизма не было и не будет. Никто не будет в обществе горбатиться за то, чтобы ты мог нихуя не делать и кумить на 120б+ моделях.
Бюджетный вкат - это риг на теслах, вполне подъемные деньги для среднестатистического работяги.
Аноним 09/05/25 Птн 10:25:02 1195327 66
>>1195325
Был, сейчас дешевле взять одну 3090
Аноним 09/05/25 Птн 10:28:02 1195328 67
desire.png 530Кб, 512x768
512x768
Господа, а как вы генерите картинки для кума в процессе диалога? Pony классная модель, сразу и без ебли генерит классные изображения, но проблема в том, что в мою 8Гб 3070Ti не влезает одновременно LLM и генерация изображений. LLM же, падла, не вылезает из VRAM, и когда она запущена, и на генерацию изображений тупо не хватает ресурсов. Я бы за какую-нибудь копеечку арендовал что-нибудь в облаке, вроде у CivitAI есть возможность крутить чекпойнты, но хз, можно ли их подружить с Таверной и сколько это вообще стоит.

Другая проблема - РПшная LLMка очень хуево справляется с генерацией промптов для генерации изображений. Ей бы для этих целей другую температуру и другой шаблон промпта сделать, но в Таверне вроде не настраивается это.
Аноним 09/05/25 Птн 10:28:57 1195329 68
>>1195327
Ага. Сколько врама в риге на теслах? Сколько врама у одной 3090?
Вопрос в 120б+ моделях, нет?
Аноним 09/05/25 Птн 10:32:16 1195331 69
>>1195327
>Был, сейчас дешевле взять одну 3090
Только толку-то с неё одной. Если брать одну карту, то уже 5090 и к ней (в будущем) собрать серверок с 256гб восьмиканальной DDR5. Или побольше. Тогда и крупные MoE-шки катать можно будет. А 3090 нужно минимум 3.
Аноним 09/05/25 Птн 10:36:00 1195333 70
>>1195328
>Господа, а как вы генерите картинки для кума в процессе диалога?
Ну как, как. 3x3090 на сервере, одна в основном компе. Только это всё на будущее - там и динамические картинки, и озвучка, и даже видео (как раз вчера real-time модель выкатили). А пока что ни качественного промпта, ни хорошей реализации всего этого.
Аноним 09/05/25 Птн 10:36:33 1195334 71
>>1195331
> 5090
До сих пор для ллмок по цене/качеству нет ничего лучше 3090 с Авито. Разумеется, у нормального продавца с тестами, которые ты проведешь сам.
Ждать нужно, через 1-2 поколения видюх врама будет больше. В 5060 8гигов видеопамяти, что катастрофически мало в 2025 году. Будут поднимать у всей линейки, плюс мб выйдут гпу для нашей ниши - полуигорные, полуиишные.
Аноним 09/05/25 Птн 10:39:11 1195336 72
>>1195328
>РПшная LLMка очень хуево справляется с генерацией промптов для генерации изображений.
Небольшая thinking-модель на отдельной карте могла бы зарешать этот вопрос. Посоветуйте такую, чтобы ещё и генерация картинок влезала (24гб).
Аноним 09/05/25 Птн 10:42:56 1195339 73
>>1195336
Покупать вторую карточку для кума, ну ебать спасибо нахуй.
Аноним 09/05/25 Птн 10:45:34 1195342 74
>>1195334
>До сих пор для ллмок по цене/качеству нет ничего лучше 3090 с Авито. Разумеется, у нормального продавца с тестами, которые ты проведешь сам.
Это так, но есть проблемка производительности с новыми квантами. 4090 стоит больше чем втрое, но и производительнее с ними втрое, 5090 - пропорционально (так что смысла брать 4090 нет совсем). Другое дело, что всё это очень небюджетно.
Аноним 09/05/25 Птн 11:00:58 1195349 75
>>1195342
> есть проблемка производительности с новыми квантами
Да ладно уж, в деле ллмок врам первостепенен. Достаточно у 3090 железа, чтобы выдавать необходимые для комфортного чтения 8-12 токенов.
Аноним 09/05/25 Птн 11:15:23 1195355 76
>>1195329
m40,k80 - 24гига за 12к
m10 - 32 гига за 16к (но у неё архитектура говно)
Аноним 09/05/25 Птн 11:17:30 1195357 77
>>1195355
Риторический вопрос был, да. Анон спрашивает, как дешевле гонять 120б модели, а потом говорит, что дешевле взять 3090.
Самый бюджетный вкат - очевидно, теслы.
Аноним 09/05/25 Птн 11:18:41 1195360 78
>>1195336
А какие есть thinking aliberated модели?
Аноним 09/05/25 Птн 11:20:10 1195361 79
Аноним 09/05/25 Птн 11:38:50 1195369 80
>>1195328
> Господа, а как вы генерите картинки для кума в процессе диалога?
Никак. ImageGen модель кушает врам, а значит нужно либо жертвовать контекстом, либо квантом модели. Неприемлемо.
К тому же воображение лучше справляется.
Аноним 09/05/25 Птн 11:41:41 1195370 81
Спросил тут Дипсик ,
сколько миллиардов параметров было бы у человеческого мозга, если бы он был моделью нейросети:



Большинство источников указывает 100–500 триллионов синапсов, но чаще всего используется оценка ~100 триллионов.

Итоговая оценка
Если считать каждый синапс аналогом одного параметра (веса связи в нейросети), мозг как модель нейросети имел бы:
~100 триллионов параметров (100000000000000 и

Сравнение с современными ИИ
GPT-4: ~1.7 триллиона параметров.

Человеческий мозг: ~100 триллионов параметров (в 60 раз больше, чем GPT-4).

Важные уточнения
Синапсы ≠ параметры. В реальности мозг работает не как искусственная нейросеть: синапсы динамически меняются (пластичность), а нейроны имеют сложные биохимические механизмы, которые не сводятся к простым "весам".

Энергоэффективность. Мозг потребляет ~20 Вт энергии, тогда как обучение нейросетей с триллионами параметров требует мегаватт.

Плотность информации. Один кубический миллиметр коры мозга содержит ~50000 нейронов и ~130 млн синапсов — это на порядки плотнее, чем микросхемы.




Короче не скоро получим рп уровня живой тян, анчоусы
Аноним 09/05/25 Птн 11:52:05 1195375 82
>>1195317
>Это все еще ванильный qwq?

Это я тестил сноудроп с настройками треда которые с пустым инструкт промптом. Они реабилитировали сноудроп в моих глазах.

>Ты так и не ответил, какой квант, какой пресет.

Если ты про ванильный qwq, то я его на ванильных настройках использовал с парой изменений.
Аноним 09/05/25 Птн 11:53:40 1195377 83
>>1195375
> Они реабилитировали сноудроп в моих глазах.
Рад, что тот пресет тебе помог. Не понимаю, как авторы Сноудропа проглядели, что их сэмплер настолько плох и поместили его в ридми модели.
Может кто-нибудь из тредовичков тоже даст второй шанс Сноудропу, с правильным сэмплером.
Аноним 09/05/25 Птн 11:57:28 1195379 84
Аноним 09/05/25 Птн 11:57:41 1195380 85
>>1195361
Ебать, минимум 16Гб, ну спасибо. Речь же шла про "небольшую" модель.
Аноним 09/05/25 Птн 12:02:33 1195385 86
>>1195370
Ты не забывай, что у человека дохуя ненужных синапсов в мозгу. Чтобы дышать, ходить, переваривать пищу, регулировать температуру тела - нужно дохуя вычислительной мощности. Без тела можешь спокойно делить эту цифру на 10.
Плюс, сколько мощности жрет стресс, самокопание, мечты, фантазии? Все это рудименты и артефакты хуевой архитектуры человека и дырявой системы вознаграждения. У нейросетей сразу нормальный эвристический алгоритм, который куда эффективнее гормональной дрочки.
Вот и получится, что нейросеть с параметрами на порядки ниже, но с нормальной архитектурой и без лишнего багажа вскоре окажется "умнее" человека.
Аноним 09/05/25 Птн 12:04:45 1195390 87
>>1195369
Так мой вопрос как раз был о том, как вынести генерацию картинок в облако, чтобы не жрать локальный ресурс.
Аноним 09/05/25 Птн 12:06:46 1195392 88
>>1195385
А, еще не забывай, что человек все крутит на локалке, которую годами обучает с нуля. У нейромозгов возможен хайвмайнд в дата-центре, который куда эффективнее и выгоднее.
Аноним 09/05/25 Птн 12:07:18 1195393 89
>>1195357
>Самый бюджетный вкат - очевидно, теслы.
прав.
4 теслы у меня уже ебашат больше года, а 3090 сгорела не проработав и месяца.
Я брал две 3090, каждая за 65.
В итоге спустя месяц получилось, что я купил одну 3090 за 130к.
Думайте, карлики.
Аноним 09/05/25 Птн 12:10:53 1195396 90
>>1195393
А чем, прости, ты занимаешься на четырех теслах?
Аноним 09/05/25 Птн 12:18:01 1195399 91
>>1195396
Запускаю свой неповторимый Магнум 123б и дрочу на единственный сценарий в его датасете... почти~.
Аноним 09/05/25 Птн 12:23:03 1195401 92
>>1195399
блять, как же я засидую тем, кто может позволить себе запускать нормальные модели...
мне мать дает слишком мало денег, я смог позволить себе только одну 3090 убитую. Вот, сижу дрочу на гемме3, всё уже понял....
Она конечно туповата.... но выбора у меня нет. Я ведь нищий(
Господи как же хочется запустить магнум 123б....
Аноним 09/05/25 Птн 12:25:09 1195402 93
>>1195392
Согласен. Кстати, тот же Дипсик просветил, что идут исследования и пилятся нейроморфные чипы, которые должны быть энергоэффективнее чем лласнве процессоры, которые для серьёзного развития нейронок в будущем уже не подойдут.

Погуглил, а то вдруг он придумал, но действительно:

>>Исследователи Центра прикладной нелинейной динамики БФУ им. И. Канта разработали химический чип, запоминающий и распознающий ритмические сигналы. Чип представляет собой возбудимую реакционно-диффузионную среду реакции Белоусова-Жаботинского (БЖ) на основе специального полимера с вшитым катализатором. Схема чипа в чем-то схожа с электронной микросхемой на полупроводниках, но вместо электрического тока по его дорожкам бегут химические волны. Такая передача сигналов по химическим волноводам напоминает распространение потенциала действия в аксонах живых нейронов.

>>В разработке исследователи используют технологию фотопечати (патент №2790172). На предметное стекло наносится тонкий слой прегеля, который затем в течение нескольких минут экспонируется через специальную маску. После, незаполимеризованные остатки прегеля удаляются, и на поверхности стекла остается полимерная «интегральная схема». Этот процесс похож на фотолитографию, используемую в производстве кремниевых микросхем


Еще Дипсик заявил, что есть экспериментальные модели на принципах импульсной (спайковой) нейросети, которая

>>Является самой реалистичной, с точки зрения физиологии, моделью


Но где бы такие модели пощупать...
Аноним 09/05/25 Птн 12:27:05 1195405 94
>>1195402
>обычные процессоры

Поправил
Аноним 09/05/25 Птн 12:28:03 1195407 95
>>1195401
Ой, шутник~. Тебе же ничего не мешает прямо сейчас его запустить! Думаешь, смог обмануть нас? Smirk wink smirk.
Аноним 09/05/25 Птн 12:32:35 1195409 96
>>1195407
гемма3-бой, зачем ты кривляешься?
Аноним 09/05/25 Птн 12:33:22 1195411 97
>>1195409
Зачем ты так, ножом по сердцу? Я Мистралешиз.
Аноним 09/05/25 Птн 13:23:24 1195493 98
>>1195409
>>1195411
Вы оба никчемны.

Истинный лама энджоер.
Аноним 09/05/25 Птн 13:25:46 1195497 99
Кто-то юзал SpikeGPT? Это реально запустить простому селянину?
Аноним 09/05/25 Птн 13:26:59 1195499 100
>>1195209
> Пайка получилась грязная потому что безсвинцовый припой не хотел липнуть к моему оловянно-свинцовому.
В целом задача была крайне простая, залудить верхнюю часть преда и напаять прямо поверх него, там и контакта припоев не должно быть. Раз такое дело - лучше больше никуда не лезь. 0.2 это многовато на такую длину, достаточно просто от тонкого многожильного одну, но в целом пофиг.
>>1195229
Оварида, у вас прогар врм. Наколхозят ампутировав фазу или пересадят чип-память на плату донора или разведут тебя что они - хлам чтобы получить живые чипы.
>>1195235
То что фикседкванты по известному алгоритму могут сделать почти все (нет) - и так было понятно. А вот как там накрутили тесты, что у них q2kl является однозначным лидером в одном из тестов - уже интересно.
Аноним 09/05/25 Птн 13:39:08 1195524 101
>>1195247
> многовековые описания верхней полки перестало высирать, вздохи ахи пуки
Так ты посмотри что пишут в типичных "йоба текен ультра мега рп пресет". Так же буквально запрос всей этой херни, которому модель просто следует, лучше уже ничего чем такое. Но это совсем крайность, нормальный системный промт без этого наиболее оптимален.
>>1195248
> Она неожиданно подходит для агентов
Не неожиданно а закономерно, еще вторая в этом ебала. И главное, она может как в ризонинг, причем не строго прибитый - задроченный а именно по инструкции, так и в зирошоты с учетом инструкций.
>>1195294
Нормисы не окупят. Корпы потребуют достойного уровня сервиса, гарантий и поддержки, Цикл разработки долгий и дорогой, пузырь может лопнуть раньше.
В итоге имеем только небольшой абуз лазеек в готовых девайсах.
> Какие есть бюджетные варианты для вкатата в большие модели 120б++?
Риг из 3090, дешевле нет.
Аноним 09/05/25 Птн 13:44:06 1195529 102
>>1195524
> Риг из 3090, дешевле нет.
> несколькими сообщениями выше обсуждают риг из тесл, что в 2 раза дешевле.
> еблан?
Аноним 09/05/25 Птн 13:45:06 1195533 103
>>1195254

Последнее что остается - понять механизм групп и автоматизировать его. В моем идеальном мире все персонажи новеллы сразу находятся в группе, но отключены. Включена только карточка гейммастера новеллы, которая двигает сюжет, вводит персонажей и самое главное - включает или отключает карточки по необходимости. Сейчас карточки надо включать и выключать вручную, что ломает весь опыт. Пока что мне удалось только заставить гейммастера самого отыгрывать всех персонажей, основываясь на лорбуке и собственном знании новеллы оказалось что квены знают бл в подробностях, например что Лена живет в 13 домике, что я не прописывал ни в её карточке, ни в лорбуке), но это не позволяет использовать спрайты, поскольку спрайты подключены к конкретным карточкам-персонажам. Но я думаю что через скрипты можно попробовать что-то достичь. И еще бы автоматическое распознание костюмов у спрайтов например включать голые спрайты во время секса, но это уже бонус, новелла может работать и без этого на ручном переключении костюмов.
Аноним 09/05/25 Птн 13:49:26 1195540 104
>>1195529
>риг из тесл
деньги на ветер
Аноним 09/05/25 Птн 13:58:57 1195552 105
>>1195529
Риг из тесел по скорости работы примерно как 14700kf+z790+248гб ддр5
думой*
Аноним 09/05/25 Птн 14:07:17 1195560 106
>>1195533
> В моем идеальном мире
...Дипсик на 10% быстрее Квена 3 32б.
Аноним 09/05/25 Птн 14:07:28 1195561 107
>>1195552
>Риг из тесел по скорости работы примерно как 14700kf+z790+248гб ддр5
Первые 5к контекста может быть. А дальше жопа будет.
Аноним 09/05/25 Птн 14:15:37 1195567 108
>>1195369
>Никак. ImageGen модель кушает врам, а значит нужно либо жертвовать контекстом, либо квантом модели. Неприемлемо.
Тут анон выше кинул идею с autobg для таверны. Короче берёшь большой пак порнухи, растягиваешь (ну или обрезаешь) картинки под background-разрешение, обзываешь их согласно содержимому (на русском и английском, ну или две копии делаешь) и запускаешь скрипт. Можно не на постоянку, а по кнопке. Он подберёт что-нибудь подходящее к случаю.

Аноны, реквестирую такой пак.
Аноним 09/05/25 Птн 14:17:31 1195569 109
>>1195567
Тебе надо - ты и делай. Поделишься потом с тредом, правда ведь?
Аноним 09/05/25 Птн 14:21:04 1195571 110
>>1195569
>Тебе надо - ты и делай. Поделишься потом с тредом, правда ведь?
"Я стратег, я двигаю идеи"(с)
Аноним 09/05/25 Птн 14:21:10 1195572 111
>>1195399
Т.е. ты потратил многие тыщи баксов ради текстового кума?
Аноним 09/05/25 Птн 14:29:43 1195577 112
>>1195572
>Т.е. ты потратил многие тыщи баксов ради текстового кума?
Смешно, правда? другой анон, который тоже потратил
Кум кумом, а ведь революция произошла. Хз даже с чем сравнить-то, с интернетом разве. Я может всю жизнь мечтал, а вот оно.
Аноним 09/05/25 Птн 14:33:19 1195581 113
>>1195577
Не, кум - дело благородное, но разве меньшие модели не вытягивают для этих целей?
Аноним 09/05/25 Птн 14:45:14 1195602 114
>>1195560

Что ты несешь блядь.
Аноним 09/05/25 Птн 14:45:31 1195603 115
>>1195581
>Не, кум - дело благородное, но разве меньшие модели не вытягивают для этих целей?
В простых случаях, или если повезёт, то вытягивают. А так скачешь, как горный козёл, с Магнума на Люминум, а с него на Комманд-А, иногда и 70В-тюном не погнушаешься - для остроты. Они все разные, как кошки. Сэмплеры крутишь, как заправский гонщик руль.
Аноним 09/05/25 Птн 14:47:31 1195607 116
>>1195401

Выгружай слои на оперативку, в чем проблема?
Аноним 09/05/25 Птн 14:48:10 1195608 117
>>1195328
>РПшная LLMка очень хуево справляется с генерацией промптов для генерации изображений.
Юзай flux хрому а не пони, та умеет из обычного описания генерировать хорошо. Всего-то нужна будет ещё одна 5090 чисто под неё (потому что в 24гига не влезает)
Аноним 09/05/25 Птн 14:51:35 1195614 118
>>1195529
> риг из тесл
Это совсем гнилая тема, ужасно медленные и для 120+ неюзабельны, дорогие для своих статов, бесполезны везде кроме инфиренса ллм на жоре. Советовать их может только тот, кто хочет свое говно распродать, или желает затащить в свое болото очередную жертву.
>>1195552
> 248гб ддр5
Там же 2 х 48 и проеб разметки макабы?
>>1195561
На теслах генерация превращается в тыкву с контекстом точно также если не больше.
>>1195393
Это карма, лол.
Аноним 09/05/25 Птн 14:51:58 1195616 119
>>1195393

Лол блядь, так это у тебя 3090 сгорела, теслашизик. Так тебе и надо, довыебывался. Нехуй срать было какой ты охуенный что додумался по дешевке доесть говно из под майнера, а остальные нищуки и долбоебы, раз не хотят такой же финт жопой провернуть.
Аноним 09/05/25 Птн 15:01:35 1195623 120
>>1195614
> проеб разметки макабы?
Да, она сожрала * с начала второй строчки.
Но можно вставить и 4 плашки по 64 гига теперь. Но они будут плохо работать на высоких частотах потому что 64 гига только недавно до десктопов дошли и потому что 4 плашки.
Аноним 09/05/25 Птн 15:03:46 1195629 121
>>1195407
Я сейчас тебя укушу не спросив!
>>1195567
Кмк, здесь сильно теряется вариативность и отзывчивость, оно будет делать просто что-то по мотивам, а не то что хочешь. Няшишь ты канничку в доггистайл, а там выезжает милфа на спине, или наоборот.
Для некоторых чаров заготовлены спрайты (есть на чубе), вплоть до подробной ебли, если уж делать то именно так. Как раз будет экспириенс внки.
>>1195603
> на Комманд-А
Оригинальный или тюн? Какие сценарии на нем играешь?
>>1195616
Не стоит забывать что тред уже насчитывает две мертвые теслы, в одной было похоже на траблы с драйвером и потом совсем отрыгнула, по второй анончик жаловался на отвал из nvidia-smi но потом пропал.
Аноним 09/05/25 Птн 15:15:46 1195643 122
>>1195629
>Оригинальный или тюн? Какие сценарии на нем играешь?
Fallen, от TheDrummer'а который. Пробую на всём, даже на русском - оригинальный датасет дорогого стоит.
Аноним 09/05/25 Птн 15:41:46 1195684 123
изображение.png 8Кб, 463x183
463x183
>>1195296
Оно просто так туда лезет, даже на чистой системе. Забей, это не кобольд на пару мегабайт вылез, а другие процессы.
>>1195325
>Никто не будет в обществе горбатиться за то, чтобы ты мог нихуя не делать и кумить на 120б+ моделях.
ИИ будет. Собственно кроме куммунизма я никакой общественной формации в эпоху развитого ИИ не вижу.
>>1195333
>как раз вчера real-time модель выкатили
Подскажи название.
>>1195342
>Это так, но есть проблемка производительности с новыми квантами.
А они нужны? 4км хватит каждому.
>>1195357
>Самый бюджетный вкат - очевидно, теслы.
Был, когда они стоили по 16к. За 30-40 они нахуй уже не нужны, перфоманс от цены не вырос.
>>1195393
>В итоге спустя месяц получилось, что я купил одну 3090 за 130к.
Хуйня. Вот 3080ti за 155к...
>>1195581
Человек животное жадное, всегда хочет лучшего. Ну ещё и ни одна модель не смогла удовлетворить меня, включая корпов с 2трлн параметров.
>>1195623
>Но они будут плохо работать на высоких частотах
Не то чтобы плохо... Просто никак. Хорошо если 5200 возьмёт, а то и придётся на джедекоских 4800 сидеть.
Аноним 09/05/25 Птн 15:57:47 1195718 124
>>1195603
Это понятно, что четыре теслы дадут больше простора для творчества, но типа это реально того стоит? Вот прям подрочить на текст? Не на какой-нибудь йоба-фильм, который рисуется в реальном времени и ты даешь указания героям, а они это делают, а простой текстовый РП, доступный всем нищукам, просто более быстрый и чуть более качественный?
Я не пытаюсь тебя доебать, просто мне кажется, что если тратить СТОЛЬКО денег, должна быть цель более высокая. Например, крутить сервер для коммерческих целей, или тренировать какие-то специфические нейронки за деньги или ради искусства, и так далее.
Аноним 09/05/25 Птн 16:07:18 1195734 125
>>1195684
> Забей, это не кобольд на пару мегабайт вылез, а другие процессы.
Это именно кобольд, он еще до того как веса загрузит там что-то резервирует.
> Хорошо если 5200 возьмёт
Как раз хватит, лол. И это будет 256 гигов же. А 2х48 есть быстрые.
>>1195718
> но типа это реально того стоит?
Не стоит. Как-то можно было бы притянуть для крутой мое, что туда бы помещалась. Но, во-первых, обработка контекста будет страшной и ужасной, замедление с ростом контексте огромным, таких моделей нет (хотя вообще ллама4-скаут в теории), мое само по себе неоче.
> какой-нибудь йоба-фильм, который рисуется в реальном времени и ты даешь указания героям
За такую технологию отвалят много миллиардов (уже), как минимум для того чтобы ее монетизировать и продавать, и не выпускать просто так наружу. Слишком жадные у тебя запросы, скажи еще что 100к, за которые в хорошие времена легко собирался риг из 4х тесел, ты бы отдал только за полную симуляцию с погружением.
> что если тратить СТОЛЬКО денег, должна быть цель более высокая
Сколько? Отдают миллионы за гниющую кредитопомойку, сотни тысяч за какие-нибудь лыжи, костюм и т.д.
Аноним 09/05/25 Птн 16:13:52 1195740 126
>>1195718
>Я не пытаюсь тебя доебать, просто мне кажется, что если тратить СТОЛЬКО денег, должна быть цель более высокая. Например, крутить сервер для коммерческих целей, или тренировать какие-то специфические нейронки за деньги или ради искусства, и так далее.
Риг на 3090-х стоит столько же, сколько одна 5090. Покупка одной топовой видеокарты не требует высоких целей. И покупка рига не требует, просто цели другие. Берут просто для удовольствия - это кстати и лучше, чем если "карта нужна для работы".
Аноним 09/05/25 Птн 16:18:34 1195745 127
Аноним 09/05/25 Птн 16:32:12 1195753 128
>>1195608
>Юзай flux хрому а не пони, та умеет из обычного описания генерировать хорошо. Всего-то нужна будет ещё одна 5090 чисто под неё (потому что в 24гига не влезает)
А вот это видел?
https://www.reddit.com/r/LocalLLaMA/comments/1kgzey8/run_flux1_losslessly_on_a_gpu_with_20gb_vram/

Теперь влезет, дев обещал адаптировать для Комфи.
Аноним 09/05/25 Птн 16:32:46 1195754 129
Кто-то что-то пробовал в плане импульсных нейронных сетей?
Аноним 09/05/25 Птн 16:43:09 1195762 130
>>1195276
Вот это интересно, еще бы хорошо научить автоматически это делать. Какой нибудь отдельный бенч в llama.cpp который перебирает варианты слоев и выгрузку на гпу автоматически и тестит скорости был бы просто охуенным. Ну или накорябать скрипт отдельный, но это сложнее.
Аноним 09/05/25 Птн 16:46:49 1195767 131
>>1195754
Исследований по жидким нейронным сетям не так много, а весов вобще нет на сколько знаю.
Основная проблема жидких нейронок на сколько я помню - невозможность использования обычного для ии обучения с помощью градиентного спуска.
А это считай святой грааль нейронок, без него никто ничего не может.
У них короче много проблем с обучением поэтому пока что выглядят круто только в теории.
Аноним 09/05/25 Птн 16:48:05 1195768 132
>>1195734
>Как раз хватит, лол.
Кому как. Деградировать с 6400 как-то обидно.
>>1195745
Спс.
>>1195754
Никто.
Аноним 09/05/25 Птн 18:27:57 1195890 133
Ох, как же QwQ следует за промтом карточки. Как же он…. Заебал.
Я неиронично ссался кипятком от такого уровня работы с контекстом, с ризонингом он и соврет, и выкрутится - но буквально как Хью Лори сидишь и такой : эврибади лай.
Но это абсолютно непробиваемо без прямых указаний. Даже подумать не мог, что это может так раздражать. Персонажи как бетоном залиты.
Аноним 09/05/25 Птн 18:34:27 1195898 134
f.png 396Кб, 1424x761
1424x761
какие подводные?
Аноним 09/05/25 Птн 18:37:56 1195906 135
>>1195898
>какие подводные?
Могут наебать
Если сдохнет - тоже попал на бабки
Шумная

В остальном народ вроде доволен.
Аноним 09/05/25 Птн 18:38:09 1195907 136
владимир путин [...].mp4 23028Кб, 1280x720, 00:01:02
1280x720
каким софтом делать такое? и хватит ли предыдущего пикрила или нужен десяток A100?
Аноним 09/05/25 Птн 18:39:46 1195911 137
А можно ли замутить такую штуку, чтобы Таверна выгружала LLM из памяти перед генерацией изображения, затем генерила его и загружала LLM обратно?
Аноним 09/05/25 Птн 18:42:50 1195919 138
Интересно, есть ли варик автоматом дописывать лорбук? Типа чтобы модель сама решала, какие события важные, определяла ключевые слова и делала запись?
Аноним 09/05/25 Птн 18:43:43 1195920 139
>>1195911
>А можно ли замутить такую штуку, чтобы Таверна выгружала LLM из памяти перед генерацией изображения, затем генерила его и загружала LLM обратно?
Если уж это тебе настолько надо, то купи уже вторую видяху для картинок.
Аноним 09/05/25 Птн 18:44:38 1195922 140
Аноним 09/05/25 Птн 18:45:20 1195924 141
А представьте 4 гемму с 123б параметров
Аноним 09/05/25 Птн 18:51:20 1195933 142
>>1195911
Можно, пишешь прозрачный прокси, к которому и будут подключатся с одной стороны таверна а с другой бекенды к текст и картинко генераторам
Делаешь условие что если получен запрос на генерацию картинки текстовый бек вырубается и загружается картиночный, потом при текстовом запросе меняются местами.
Это будет долго и тормазнуто, но будет работать. В основном изза того что на загрузку модели в память уходят секунд 10 минимум как и на загрузку бекенда с нуля, потом чтение промпта предыдущих сообщений если речь про текстовую сетку, и только потом она даст ответ
Аноним 09/05/25 Птн 19:20:59 1195981 143
Обниморду заблокировали? Без впн не заходит.
Аноним 09/05/25 Птн 19:22:12 1195984 144
>>1195981
У меня работает. Ростелеком провинциальный.
Аноним 09/05/25 Птн 19:24:19 1195990 145
>>1195924

Ты только что гемини
Аноним 09/05/25 Птн 19:39:03 1196009 146
>>1195990
гемини на 2к биллиона
Аноним 09/05/25 Птн 20:02:10 1196040 147
>>1195768
> Деградировать с 6400 как-то обидно.
Хера ты амдшников всех приложил.
>>1196009
По заявлениям, и один хуй мое а не плотная.
Аноним 09/05/25 Птн 20:45:08 1196118 148
изображение.png 74Кб, 1177x1165
1177x1165
>>1196040
>Хера ты амдшников всех приложил.
? Я сам амудешник.
Аноним 09/05/25 Птн 20:54:09 1196128 149
>>1195614 >>1195616
>карма
хуярма блядь.
Заебали вы, клоуны.
"поделом тебе" , "карма".
Я вообще нахуй святой по сравнению с вами. Шакалы блять, смеются над успешным человеком.
Особенно мой фанат, говно какое-то которое носится за мной по треду и орет "токсичный" как только меня видит. Хуй знает, чем я дупу ему разворотил. Вероятно тем, что он нищук ёбаный, а я - нет.
09/05/25 Птн 21:07:34 1196149 150
> успешный
> не нищук
> P40 с помойки
как называется эта болезнь?
Аноним 09/05/25 Птн 21:23:36 1196186 151
image.png 279Кб, 1000x750
1000x750
image.png 1936Кб, 1280x960
1280x960
image.png 1114Кб, 2400x2400
2400x2400
Купил наконец свою первую 3090, до этого видюхами не интересовался вообще, и нихуя о них не знаю.
Потыкал - в мой обычный корпус и мать 2 шт теоретически влезает, но если это 2.7 - то прям впритык.
Так и надо, или поискать потоньше, или менять все к хуям?
Из чисто двухслотовых на лохито есть турбы, которые пишут сама нвидия забанила за то що их брали вместо серверных, но я так и не нашел отзывов как они для набива в домашнюю пеку.
Теоретически есть на 2 с небольшим xc3, но на лохито их сейчас нет.
И есть туфы, которые по размерам вроде на полсантиметра короче всех остальных 2.7.
Шо посоветуете?
Аноним 09/05/25 Птн 21:37:02 1196219 152
>>1196186
> Шо посоветуете?
Квен 3 32б запусти, 3090 хватит. Он в лучшем случае на 10% хуже Дипсика. Не нужно докупать железо.
Аноним 09/05/25 Птн 21:40:21 1196229 153
>>1196186
>до этого видюхами не интересовался вообще, и нихуя о них не знаю.
Огнетушитель купи.
Аноним 09/05/25 Птн 21:41:10 1196231 154
>>1196128
Агришься, выпендриваешься, делаешь ахуительные заявления и много выебываешься. Нет тут святости, ты рили васян-токсик по общению, был бы сдержаннее, уважительнее к другим и менее максималистичным - все бы тебя утешали и сочувствовали.
Еще не забыто как ты накрутил шизосемплинг и всякого, что модели не могли на элементарные вопросы ответить, а крыл хуями и обвинял всех кроме себя.
> над успешным человеком
Успешный человек не только в 25 году не будет использовать теслы, но и будет обладать всеми теми описанными качествами.
>>1196186
Обычно карты выносят на райзерах (х16) туда, где есть место.
Аноним 09/05/25 Птн 21:42:08 1196232 155
>>1195919
Технически возможно, то есть можно просить модель дополнительно выписывать словечки и пояснения, чтобы это астоматически добалялось в лорук и стиралось из вывода. Попросите на вашего программиста, написать такой плагин.

Но модель может криво выписывать словечки и может всякую хуйню считать важной. Это уже зависит от модели.
Аноним 09/05/25 Птн 21:42:54 1196234 156
>>1196219
>Он в лучшем случае на 10% хуже Дипсика
Че ты несешь болезный? Квен хорош, но он хуже не на 10 процентов. По знаниям и мозгам он проигрывает значительно.
Это только в каких то тестах от это отставание в тестах на 10 процентов показывает.
Правда ты забыл уточнить что там каждый процент отставания сам по себе процентов на 10 разницу показывает, и чем выше тем труднее его набрать и тем сильнее отрыв.
Аноним 09/05/25 Птн 21:46:02 1196242 157
Аноним 09/05/25 Птн 21:49:02 1196247 158
>>1196186
>Шо посоветуете?
>в мой обычный корпус и мать 2 шт теоретически влезает, но если это 2.7 - то прям впритык
Меняй корпус вестимо.
Аноним 09/05/25 Птн 21:49:18 1196249 159
>>1196231
> Агришься, выпендриваешься, делаешь ахуительные заявления и много выебываешься
> Нет тут святости, ты рили васян-токсик по общению, был бы сдержаннее, уважительнее к другим и менее максималистичным - все бы тебя утешали и сочувствовали.
> Еще не забыто как ты накрутил шизосемплинг и всякого, что модели не могли на элементарные вопросы ответить, а крыл хуями и обвинял всех кроме себя.
Рубит правду-матку, выдает базу. Тот анон попуск, который даже не знает, как сэмплеры настроить, а эго раздуто до небес.
Аноним 09/05/25 Птн 21:53:48 1196253 160
Ну что там 3 квен починили?
Файнтюны?
Пресеты?
Аноним 09/05/25 Птн 21:55:53 1196258 161
https://huggingface.co/ServiceNow-AI/Apriel-Nemotron-15b-Thinker

Выше кидали, но это рили качественный рывок в мире до 22б моделей. Очень хорошо. И уже как минимум Драммер делает тюн. Отлично показывает себя как с ризонингом, так и без. Кум пока суховат, но тюны подправят.
Аноним 09/05/25 Птн 22:00:05 1196263 162
Доставьте пожалуйста пресет для сноудропа, очень прошу
Аноним 09/05/25 Птн 22:00:47 1196264 163
>>1196263
Выше был, прямо в этом треде. Работай глазками.
Аноним 09/05/25 Птн 22:02:10 1196266 164
>>1196263
В прошлом треде, прям в конце. Я запрашивал, посмотри.
Только выставь систем промт, он там немного пустой.
Аноним 09/05/25 Птн 22:04:48 1196271 165
>>1196258
> до 22б
То есть это хуже мистраля который сам по себе говно?
Аноним 09/05/25 Птн 22:06:31 1196274 166
>>1196271
То есть ты долбаеб, который не умеет читать и додумывает своё.
Аноним 09/05/25 Птн 22:06:48 1196275 167
>>1196263
Сноудроп кал сынок, все юзают гемму.
Я рили пробовал и он сильно тупее
Аноним 09/05/25 Птн 22:09:11 1196278 168
>>1196275
Думает, что наваливает в тред, но наваливает под себя...
Аноним 09/05/25 Птн 22:11:43 1196281 169
>>1196264
Этот? >>1195379 у него всё равно русский не очень и лезут иероглифы
>>1196275
Какую ты используешь? Аблика?
Аноним 09/05/25 Птн 22:13:54 1196282 170
>>1196281
Сначала аблитерацию использовал, потом на новые кванты от анслота пересел
Аноним 09/05/25 Птн 22:14:13 1196283 171
Хочу использовать модельку в качестве ГМ для ролевки. Чтоб он игрокам проверки назначал, правилам более-менее следовал, за НПС отыгрывал и т.п. Что лучше для этого использовать? Есть ли вообще что-то что это потянет?
Аноним 09/05/25 Птн 22:15:14 1196284 172
>>1196282
Какие? Можешь ссылку откуда брал скинуть?
Аноним 09/05/25 Птн 22:15:54 1196285 173
>>1196278
Не запускаешь гемму значит ты ~16гб врамцел - это правило.
Долго до этого доходил думая а че реально квен лучше геммы что ли?
А нет просто на контекст геммы тут у всех врама нехватает вот и коупят
Аноним 09/05/25 Птн 22:16:21 1196287 174
Новости про RTX PRO хоть какие то есть?
Аноним 09/05/25 Птн 22:17:02 1196288 175
Аноним 09/05/25 Птн 22:17:08 1196289 176
>>1196275
Вот просто - нахуй пошёл

Вообще, я когда нибудь накатаю пасту ненависти к этому гуглоподелию, которое по сути является рекламой гемини, в то время как лагушкоеды выпускают маленькую и адекватную модель пригодную для широких масс, а не вечно довольную блядь с размером контекста как жопа негритянской мамаши и при этом совершенно не пригодной для нормальных тонов и мерджей. И как бы Гугл вообще нихуя не обязан делать бесплатно и я бы вообще не бомбил, если бы не гуглоёбы которые затрахали рассказами о том какая она замечательная.
И ведь я уверен, что это почти все ньюфаги, так как гемма способна удивить новичка до полного ахуя, но только потому что у него нет опыта облизывания кривых пораш, кривых тюнов -которые дают понимаете как и что работает.
А гемма - жрет любой промт, довольна умная. Но как только ты углубляешься - тебя не покидает ощущение что тебя сказочно наебали.
Аноним 09/05/25 Птн 22:17:58 1196291 177
>>1196288
Спасиб, а что в них такого изменилось?
Аноним 09/05/25 Птн 22:19:22 1196292 178
>>1196289
А ты что используешь?
09/05/25 Птн 22:20:12 1196293 179
>>1196287
в америке уже продаются, у нас пока нет
Аноним 09/05/25 Птн 22:21:43 1196294 180
>>1196293
А есть шкнсы, что их в днс-и-аналоги завезут? Или максимум озон?
Аноним 09/05/25 Птн 22:22:36 1196295 181
>>1196289
с геммаебами еще здесь все было понятно >>1194279 →
подписываюсь под каждым словом. уверен, что они на русике играют и потому так коупят, выбора нет просто
Аноним 09/05/25 Птн 22:24:05 1196297 182
>>1196289
Шизу не дали говнотюнить уже отличную модель, вот беда.
Как я и говорил врамцел без контекста.
Аноним 09/05/25 Птн 22:25:14 1196298 183
>>1196292
Все под свои задачи. Я серьезно.
Тебе переводить, дрочить, писать, общаться, РПшить, для создания персонажей для ирл ролевок ? А может для РП на русском ? А может для дрочки на русском ?
Вот для всего этого есть разные модели, в зависимость от того что нужно.

Ну а сейчас ты охуеешь с моего мува - если ты ньюфаг, то гемма, лол. Я не шучу - жопу просто оторвет. А потом когда присытишься снова приходи в тред. Просто помни - что гемма это радужный и умный йесмен.
Аноним 09/05/25 Птн 22:25:44 1196300 184
Покупаю ртх про 4000, получаю 24гб вркм. Пое паю 5070ti sff, и плюс еще 16гб врам. За 250к 40гб врам на приличной скорости. Подводные?
Аноним 09/05/25 Птн 22:27:19 1196304 185
>>1196298
Я старенький, я с С.АИ и пигмы 6В начинал, но сейчас столько всего выходит нового, что за всем не уследишь
09/05/25 Птн 22:27:24 1196305 186
Аноним 09/05/25 Птн 22:28:02 1196307 187
Аноним 09/05/25 Птн 22:30:06 1196311 188
У меня сноудроп из православной мамочки за пару сообщений сделал конченную шлюху
Всё что нужно знать о следовании карточке
Аноним 09/05/25 Птн 22:30:15 1196312 189
>>1196304
Ну тогда она тебе и не нужна.
Самый нейтральный вариант - серия комманд.
Самый соевый и скучный - гемма
Самый рабочий и трудяга - мистраль
Самый китайский и кодерский - квены (не кодил, только с чужих слов. Сорян, тут исключительно чужой опыт)
Самый доебчивый и непробиваемый с хорошим ризонингом - QwQ
Аноним 09/05/25 Птн 22:30:36 1196314 190
>>1196300
Покупаешь 4 5060ti на 16гб, получаешь за те же плюс минус деньги 64гб.
Аноним 09/05/25 Птн 22:31:30 1196315 191
>>1196314
А пропускная способность?
Аноним 09/05/25 Птн 22:31:31 1196316 192
>>1196311
Могу ли я… эммм… увидеть твой хистори чат.
Не пойми не правильно, но за 475 сообщений с суммарайзом - он вообще отказывался отходить от линии партии.
Аноним 09/05/25 Птн 22:31:49 1196317 193
>>1196297
> Шизу не дали говнотюнить
ну да да, и всем тем шизам благодаря которым ллм рп существует
они все в один голос говорят, что геммочка необучаемая
в англ коммьюнити уже давно забыли про это говно, также быстро как про гемму 2

но ты коупи коупи, всетаки никакая другая моделька не ответит тебе "ах ах" на твое "я тебя ебу" на великом и могучем
Аноним 09/05/25 Птн 22:32:23 1196318 194
>>1196312
Какую мистраль для РП сторителинга взять?
мимо шел
Аноним 09/05/25 Птн 22:32:40 1196319 195
>>1196316
два чая господину, сноудроп даже слишком следует карточке
Аноним 09/05/25 Птн 22:34:03 1196321 196
>>1196318
На которую хватит врама, лол,

Ну серьезно, ну напишу я - бери большую мистраль. Как раз нормальный квант под 40гб будет.
Представляю твое ебало.
Аноним 09/05/25 Птн 22:35:20 1196323 197
>>1196319
И это прям раздражает. Вот написано что персонаж планирует сделать. Снежный будет блять всю историю планировать, вместо того чтобы делать.
Аноним 09/05/25 Птн 22:35:32 1196325 198
>>1196311
> тем временем у анона в систем промпте "добавь ХУЙ в каждое сообщение, пищи ИЗВРАЩЕННО и КРАСОЧНО"
Аноним 09/05/25 Птн 22:36:14 1196326 199
>>1196318
Не люблю геммаебов, но она лучше всего делает 2 вещи:
Помнит контекст
Пишет по русски

Минусы:
Позитивный аутист
Соевая
Аноним 09/05/25 Птн 22:36:37 1196329 200
>>1196316
>>1196319
Нет ну конечно я её соблазнил, и в ебле она была нихуя не скромной а типичной шлюхой
Аноним 09/05/25 Птн 22:37:13 1196330 201
17454815859290.png 408Кб, 755x566
755x566
Аноним 09/05/25 Птн 22:40:35 1196336 202
>>1196317
Сколько тюнов мистраля уже высрали а хули от них толку?
Уже штук 20 перепробовал разницы вообще не вижу в обычных ерп сюжетах, хуй знает для кого они, может там специально под копрофилов есть тюн но это же никогда не пишут, просто "у нас самый пиздатый датасет, пизже чем у всех" - запускаешь и не видишь разницы
Аноним 09/05/25 Птн 22:43:38 1196343 203
>>1196336
мистрали здесь причем?
огромное множество отличных тюнов существует под каждый размер
ты с головой дружишь, нет? походу накачал говна, отыграл на нем только ерп со своими 20 токенами в ответах и делает выводы. умно
Аноним 09/05/25 Птн 22:48:18 1196355 204
>>1196329
Поверь моему опыту пердолинга с QwQ - значит у тебя в промте где то написано про любовь к хуям. Потому что если там будут слова : расчетливая и холодная.
Ты получишь посреди коитуса : ах, аааах, её голос стал серьезным ты конечно меня ебешь, но что там по тому томику некроманта, дай изучить, не жадничай.
Аноним 09/05/25 Птн 22:50:24 1196363 205
>>1196311
Сгенерируй промт с условной градацией успех/неудача/критический успех/критическая неудача на основе отношений персонажа к юзеру и попробуй карточку сложнее 100 токенов. 10 из 10 казней за попытку подарить параноидальной императрице свистоперделку за 1 динар.
Аноним 09/05/25 Птн 22:52:17 1196369 206
Раз уж тут обсуждают снежный почему промпт под пресет выше не завезли?
Дайте промпт!
Аноним 09/05/25 Птн 22:52:38 1196370 207
Даже дополню : но справедливости ради, QwQ лучшая локалка для отыгрывания общения с яндеркой. Я вас уверяю, сраться будете от каждого её сообщения и действия.
Аноним 09/05/25 Птн 23:04:13 1196389 208
>>1196370
Вот бы еще карточка была готовая, а не 200 токенов Я ТЕБЯ ТРАХАТЬ ТЫ МЕНЯ ТРАХАТЬ Я БОЯТЬСЯ... ((В ПОПА НЕ ТРАХАТЬ USER НЕ ТРАХАТЬ ЗАПРЕЩЕНО!!)
Аноним 09/05/25 Птн 23:06:06 1196392 209
>>1196281
> у него всё равно русский не очень и лезут иероглифы
Я вот ранее спрашивал про сноудроп и мне его дали. ПОМОГЛО! Немного непривычно после командера, работает чуть иначе, но почти догоняет его, при этом контекст жирнее.
>>1196229
Главное, порошковый. А то мало ли...
>>1196315
Если мать на псе5.0, то даже выше будет.
Аноним 09/05/25 Птн 23:07:44 1196395 210
>>1196392
>Если мать
Как мать может влиять на пропускную видяхи?
Аноним 09/05/25 Птн 23:15:02 1196403 211
Аноним 09/05/25 Птн 23:36:45 1196436 212
Где красивые темы для таверны брать
Аноним 09/05/25 Птн 23:41:35 1196444 213
>>1196436
Задники в интернете. Остальное настраивается ручками.

Я хуею, этим людям дали ебово удобный фронтенд, но у них все равно проблемы. Представляю что бы с вашей жопой случилось бы 3 года назад.
Аноним 09/05/25 Птн 23:46:24 1196451 214
>>1195288
>У всех по разному работать будет, но вот у меня выгрузка части ffn_gate и ffn_up при --n-gpu-layers 99 дало буст с 1.5-2.2 т/с до 3.0 т/c надо ещё другие покрутить, вроде с квеном может бы выгоднее выгрузить ffn_down
Однако влез Qwen3-235B-A22B-GGUF в iQ3_KM (3x3090 + 64гб DDR4 в четырёхканале) с 24к квантованного в Q8_0 кэша. Скорость генерации больше 6 т/с, обработка контекста правда совсем говно - меньше 20 т/с.

"override-tensor=blk\.(9[0-3]|[1-8][0-9]|[0-9])\.ffn_down_exps\.=CPU" - все тензоры ffn_down_exps в обычную память, остальное на ГПУ. Включение/выключение flash attention на скорость не влияет, но квантовать кэш без него нельзя.

Может попробую ещё IQ3M от Радемахера - его хвалили, но боюсь, что скорость сильно упадёт. А так в принципе поиграться можно, но с практической точки зрения смысла не имеет.
Аноним 09/05/25 Птн 23:48:40 1196453 215
>>1196229
Я кста так и не пони этот мем про печи. Ведь для ллм можешь хоть на 50% мощность ограничить, и разницы заметно не будет - это для игродрочеров перегревать нужно чтобы увеличить количество невидимых фпс.
Аноним 09/05/25 Птн 23:57:56 1196464 216
>>1196453
>Ведь для ллм можешь хоть на 50% мощность ограничить, и разницы заметно не будет
Не меньше половины не ограничивают. А скорее больше. Разница только при обработке контекста в экслламе и то небольшая. 270 ватт для 3090 вполне хватает (причём столько она жрёт только в экслламе и только при обработке контекста, а так меньше.)
Аноним 09/05/25 Птн 23:58:49 1196466 217
>>1196444
>ебово удобный фронтенд
>таверна
На ноль поделил.
>>1196453
Ему жопу тушить надо будет, очевидно же.
Аноним 10/05/25 Суб 00:03:27 1196478 218
>>1196287
Есть на наебее с пометкой что отгружать будут в мае.
>>1196294
Есть, но будет оче оверпрайснуто.
>>1196295
Мистралешиз решил напомнить про свой обсер, шиз оправдывает свой обсер спором с разными людьми думая о войне с протыком.
>>1196311
Минусы будут?
>>1196343
Покажи где. Действительно отличных - единицы, большинство - просто мердж жирафа с носорогом и зажаренная qlora с трижды переваренными министрейшнами.
Аноним 10/05/25 Суб 00:07:12 1196485 219
>>1196478
> Покажи где.
хуй могу тебе показать, большего ты не заслуживаешь, говно.
все адекватные люди знают, где искать нормальные тюны. как минимум пара из них обсуждается в треде постоянно.
Аноним 10/05/25 Суб 00:09:37 1196493 220
>>1196363
> Сгенерируй промт с условной градацией успех/неудача/критический успех/критическая неудача на основе отношений персонажа к юзеру
Без внешнего рандома не топ. Офк, неким рандомайзером тут будет выступать семплинг, но распределения будут возмущены вплоть до невозможности некоторых вариантов.
>>1196485
Хуй ты можешь отсосать, привычное дело.
> огромное множество
> как минимум пара
Всхрюкнул
Аноним 10/05/25 Суб 00:11:14 1196500 221
>>1196466
>На ноль поделил.
Ты случаем не фанат обычной таверны с командной строкой ? Потому что если так, то держись от меня подальше, чудовище.
Аноним 10/05/25 Суб 00:12:34 1196506 222
>>1196478
>где
пара на немо, всякице цидоньки и пантеоны. Чатвайфу, жуткие мержи девида. Есть из чего выбрать.
Аноним 10/05/25 Суб 00:18:19 1196517 223
>>1196478
>Минусы будут?
Один большой минус же.
>>1196500
Нет конечно, я адекватен. Просто все фронты говно.
Аноним 10/05/25 Суб 00:20:21 1196521 224
>>1196517
>Просто все фронты говно.
Ну и сиди дрочи свой юникод, пока я буду менять картиночки и клацать кнопочки.
Уга-буга. Моя жать, кнопочка светиться, моя радоваться.
Аноним 10/05/25 Суб 00:22:59 1196524 225
>>1196517
> я адекватен
> Просто все фронты говно.
Противоре́чие — логическая ситуация одновременной истинности двух взаимоисключающих определений или высказываний.
Аноним 10/05/25 Суб 00:23:01 1196525 226
>>1196493
>Без внешнего рандома не топ
Знать бы как добавить его лол.
Аноним 10/05/25 Суб 00:28:06 1196535 227
>>1196521
>свой юникод
ЯННП.
>>1196524
Ну так опровергни. Покажи не говно.
Аноним 10/05/25 Суб 00:28:26 1196536 228
Бля, я конечно понимаю, что у меня сетап нестандартный. Но как же я охуел, когда переткнул теслу из одного х1 порта в другой и вместо 1.9 т/с получил 2.8 т/с на дипсике. Это че, мне нужно что ли жонглировать портами и картами, чтобы найти самое выгодное подключение? Шиза какая-то.
К слову, пришлось 3070 исключить ВООБЩЕ НАХУЙ из сборки. Потому что при выгрузке одного слоя на 4 с хвостиком Гб жора пытается аллоцировать компьют буффер на 4 с хвостиком. Подстава подстав. И на 3060 только один слой в результате помещается вместо двух. Ах, вот бы оптимизацию из болжоры, там можно размер компьют буфера задавать аргументом. Но увы...
Вы резонно спросите - а не взять ли тебе за щеку квант поменьше? А я отвечу - может быть. А может и нет. А может пошел ты.. Ну как-то нихочецца на еще большем бомжеQ2 сидеть.
9-видивокарт-в-одной-материнке-кун
Аноним 10/05/25 Суб 00:29:00 1196537 229
44fd5b2f41437a4[...].png 128Кб, 724x735
724x735
44fd5b2f41437a4[...].png 134Кб, 857x744
857x744
>>1196493
>Без внешнего рандома не топ. Офк, неким рандомайзером тут будет выступать семплинг, но распределения будут возмущены вплоть до невозможности некоторых вариантов.
Можно и просто промптить с шансом. У друга например был классный ролеплей с дипсиком.
Аноним 10/05/25 Суб 00:29:43 1196538 230
>>1196535
Тюны тебе показать, хороший фронтенд показать. Глаза-то у тебя есть? Заебал вниманиеблядствовать третий тред подряд.
Аноним 10/05/25 Суб 00:34:48 1196550 231
>>1196536
>Это че, мне нужно что ли жонглировать портами и картами, чтобы найти самое выгодное подключение? Шиза какая-то.
Я так понял, что в Жоре на каждое CUDA-устройство можно выгружать заданные тензоры. Кидай на теслы большие, а кучу мелких на Амперы и должно ускориться.
Аноним 10/05/25 Суб 00:37:14 1196556 232
>>1196538
Шиз, таблы. Про тюны не я просил знаю, что их нет, и чистая гемма лучшая.
Аноним 10/05/25 Суб 00:37:45 1196558 233
>>1196536
Как ты заебал уже, не_нищук. Купи уже себе хоппера, покажи как надо.
Аноним 10/05/25 Суб 00:41:22 1196573 234
Совенок-площадь[...].jpg 757Кб, 1920x1080
1920x1080
Совенок-Баня-но[...].jpg 508Кб, 1920x1080
1920x1080
arseniy-chebynk[...].jpg 828Кб, 1920x1080
1920x1080
arseniy-chebynk[...].jpg 643Кб, 1920x1080
1920x1080
>>1196436

Ну можно фонцы БЛ от Арсения взять.
Если нужна Япония - то фонцы ЛМРР от того же Арсения.
Аноним 10/05/25 Суб 00:44:18 1196580 235
>>1196550
Я хочу пока baseline найти оптимальный, чтобы от него отталкиваться. Завтра попробую еще две теслы по рпц подключить и посмотреть, сколько там выигрыш будет. А потом да, буду экспериментировать с override_tensors.
>Кидай на теслы большие, а кучу мелких на Амперы и должно ускориться.
А почему такая стратегия? И вообще, если я толстые тензоры из слоя закинул на карту, то кажется, что на эту же карту надо и всю мелочь тоже (т.е. леер целиком), какой смысл их разделять? А вот мелкие тензоры из RAM в ту же 3070 пихнуть - вот это можно попробовать.

>>1196558
Ты, по-моему, перепутал (с)
Аноним 10/05/25 Суб 00:46:12 1196586 236
>>1196580
>Ты, по-моему, перепутал (с)
Да ? У меня деменция, мне можно.
Аноним 10/05/25 Суб 00:46:17 1196587 237
>>1196395
А, про память внутри видяхи? Ну так и 5060ти слабее 3090/5070ti. Что компенсируется их количеством.
Аноним 10/05/25 Суб 00:47:32 1196590 238
>>1196580
>А почему такая стратегия?
А хрен его знает. Вроде работает. Ну попробуй наоборот, потом отпишешься.
Аноним 10/05/25 Суб 00:52:05 1196603 239
>curl into a knowing smile
КАКОЙ НОВИНГ СМАЙЛ СУКА?
ЧТО ЭТО ЗНАЧИТ?
ЧТО ОНА ЗНАЕТ ЧЕГО Я НЕ ЗНАЮ??
Аноним 10/05/25 Суб 00:54:27 1196604 240
изображение.png 2Кб, 208x36
208x36
изображение.png 1Кб, 188x27
188x27
Ыыыы!
Аноним 10/05/25 Суб 01:02:56 1196627 241
>>1196603
>ЧТО ОНА ЗНАЕТ ЧЕГО Я НЕ ЗНАЮ??
Английский.
Аноним 10/05/25 Суб 01:05:07 1196633 242
>>1196627
Ладно. Это было смешно. Я замержу тебя последним.
Аноним 10/05/25 Суб 01:05:24 1196634 243
>>1196537
Красивое, вот бы промптик.
Аноним 10/05/25 Суб 01:06:04 1196639 244
>>1196634
Для начала тебе нужен дипсик.
Аноним 10/05/25 Суб 01:28:01 1196704 245
Как сейчас локальные модели поживают? У меня нормально идут только 7b модели, и у нас качество не сравнится с облачными, само собой.
Аноним 10/05/25 Суб 01:34:04 1196711 246
Гемма
>And they lived happily ever after.

QwQ
>so he can't escape her even in death. She needs to be sadistic, not showing any real emotion except cruel enjoyment. Oh, and throw in some physical abuse to emphasize her control.
Аноним 10/05/25 Суб 01:34:33 1196712 247
>>1196506
Объективно, 12б - мрак, они страшно тупые и копиумные. 22-24б - получше но тоже мэх, будто в своем манямире и пишут примерно по мотивам, а не учитывают контекст. А некоторые что советовали раньше - вообще полный треш и годны только для мемасов.
>>1196525
Мультизапрос или хотябы отправка его инструкцией перед ответом, рецепты ленивой реализации в таверне в прошлом/позапрошлом треде.
>>1196536
Чекнул бы их для начала на ошибки связи и сравнил работу карт по отдельности.
>>1196537
Забористые тексты.
> Можно и просто промптить с шансом.
Можно офк, но шансы не будут тру рандомом. При неудачном раскладе может реализоваться отсутствие выбора или развилок и однотипные свайпы, при некоторых промтах или предубеждениях моделей там будет оче высокие шансы, особенно удачный пример с развилкой перед соей на модели с цензурой, хрен оно выдаст базу а всегда пойдет в аположайзы.
Аноним 10/05/25 Суб 01:37:27 1196719 248
>>1196704
Отлично
Качай гемму3 4б
Аноним 10/05/25 Суб 01:43:14 1196729 249
>>1196719
Она же вроде с цензурой
Аноним 10/05/25 Суб 02:19:34 1196743 250
>>1196711
Как ты заебал с этим пиздежом.
Аноним 10/05/25 Суб 02:21:16 1196745 251
>>1196743
Конечно. Я могу снова провернуть диалог на одинаковых ответах и скинуть, но ты же начнешь писать что РЯЯЯЯ ПРОМТЫ НЕ ТЕ.
А потом что гемме нужно подсказывать, а потом что это вообще не правильная гемма.
Аноним 10/05/25 Суб 02:23:33 1196746 252
Всё же ничто не сравнится с первым ощущением русика.
Когда я 8 месяцев назад на супер ломанном русике смог пообщаться с мистралькой я просто радугой кончал, охуеть это что же оно меня понимает, да ещё и думает на моем языке?
Аноним 10/05/25 Суб 02:35:41 1196749 253
Кратко: русик до 70б и кума?
Аноним 10/05/25 Суб 02:38:14 1196751 254
>>1196749
Кратко : дрочи на баренском.
Русскоязычных моделей для сочного кума нет.
Я скоро убивать начну, русский язык у моделей уровня гуглперевода, лол. Какая блять разница, что он отвечает, если что перевод, что оригинальный великий и могучий в исполнении нейронок одинаково хуевы.
Аноним 10/05/25 Суб 02:43:16 1196753 255
>>1196751
>Русскоязычных моделей для сочного кума нет
Как и английских тащемта.
Либо "да да ты ебёшь меня так как никто не ебал, разрушь меня для всех остальных! я твоя свалка для спермы!"
Либо "твой кок вошёл и растянул её до предела, ты толкаешься ебя её сильнее, ох ох да спасибо тебе анон!"
Аноним 10/05/25 Суб 02:52:30 1196759 256
>>1196753
ну именно сам коитус да - в целом он одинаков, лол.
Кто бы что не перемогал. Суть в том как к нему подводит нейронка. Когда у тебя до ебли интереснейший контекст идет, и ебля веселее описывается. Я в свое время дико орал, когда первая цидонька выдала про персонажа варвара, после поцелуя "Секс это конечно хорошо, но как насчет поебаться на горе из черепов"
Бля, кхорн гордится этой девочкой.
Аноним 10/05/25 Суб 03:06:03 1196771 257
1708082166611.jpg 122Кб, 748x1280
748x1280
>>1196759
Не думаю что соглашусь с любителем мелкомоделей, но в целом действительно так, важна подводка.
Еще хорошо когда прямо во время кума пользуется окружением или делает отсылочки.
Аноним 10/05/25 Суб 03:36:31 1196805 258
>>1196712
>Чекнул бы их для начала на ошибки связи
Это как? Где смотреть?
Аноним 10/05/25 Суб 03:47:58 1196817 259
image.png 985Кб, 1246x1106
1246x1106
image.png 830Кб, 1250x1005
1250x1005
Аноним 10/05/25 Суб 03:51:57 1196819 260
>>1196805
Бля ты даже не пытался поискать? nvidia-smi dmon -s et -d 1 -o DT
>>1196817
> а соски заострились от напряжения
Oh you~
Аноним 10/05/25 Суб 03:57:39 1196822 261
>>1196819
>Бля ты даже не пытался поискать?
Нет, конечно, я дурак что ли общие фразы искать? Ты пожалуешься, что у тебя телефон плохо ловит, я скажу посмотреть ошибки связи, тоже гуглить пойдешь вместо того, чтобы спросить конкретику на месте?
Аноним 10/05/25 Суб 03:58:31 1196824 262
>>1196817
Что где ? Крточку давай и импорт пресета. А то охуенное сравнение на разных карточках. Нет, нет. Так это не работает. Сравнивать можно только на одной карточке с одинаковым промтом рассказчика.
Ну если воевать с гемабоями, то по настоящему
Аноним 10/05/25 Суб 03:59:39 1196825 263
>>1196824
>но ты же начнешь писать что РЯЯЯЯ ПРОМТЫ НЕ ТЕ.
>А потом что гемме нужно подсказывать, а потом что это вообще не правильная гемма.
Ору
Аноним 10/05/25 Суб 04:03:00 1196828 264
>>1196825
Подожди. Ты мне скинул рандомные пики с чата. Это хуйня а не аргумент. Я же не требую от тебя лог чата. Давай промт рассказчика, и карточку. Ты же хочешь доказать что гемма не соевая параша. Ну вот и проверим следование промту, поддержание характера персонажа.
Аноним 10/05/25 Суб 04:25:03 1196847 265
image.png 740Кб, 1302x857
1302x857
>>1196828
А квен то реально ебет
Аноним 10/05/25 Суб 04:34:47 1196854 266
>>1196847
<think>
Я знал что он нихуя не скинет, я подозревал что следующее действие будет попытка использования кривого промта, но меня это не волновало. Желание унизить гемабоя вот она моя цель.
</think>

Геммабой,ты карточку то приноси. Мне не зазорно на всеобщее обозрение будет логи выкинуть.
Я буду ждать. Ты же не поступишь как трусливая сучка, и не убежишь ?
Аноним 10/05/25 Суб 04:37:49 1196855 267
Аноним 10/05/25 Суб 04:39:33 1196856 268
изображение.png 5Кб, 218x115
218x115
Аноним 10/05/25 Суб 05:15:19 1196880 269
>>1196855
Ну конечно же у геммабоя появились срочные дела.
Ясненько.
Аноним 10/05/25 Суб 08:42:44 1196933 270
Хм, а почему при генерации проц ебашит на 100%, а видеокарта - только на 35% (по загрузке).

15-гиговый квк, в режиме выгрузки тензоров а не слоёв, так что занято 11.6 из 12 гб врам.
Аноним 10/05/25 Суб 09:48:30 1196965 271
https://litter.catbox.moe/of7bzc.txt

Разочаровался в квк, надо ща коммандер попробовать, если не зайдёт, то назад на гемму. Да, вот вам лог на квк с карточкой беременной драконицы. А то сколько бомбили что никто логов не приносит. На русском.

Причина разочарования - пишет хорошо, но ему буквально похуй на контекст, ситуация обратная гемме, он пишет свою историю. Такое ощущение что при первоначальном просчёте дефов карточки модель планирует аутпут на всю длинну контекста и дальше ломит эту линию игнорируя любые попытки. Можно сломать, но не согнуть.
Аноним 10/05/25 Суб 10:28:30 1196993 272
>>1196965
Я блджад не понимаю. Почему у меня все как залито в бетон.
Ну не может же быть такая разница в языке. Да я на IQ сижу, но или я делаю что то не так, или ты.
Аноним 10/05/25 Суб 10:49:23 1197004 273
>>1196993
>все как залито в бетон
поясни пожалуйста, вроде бы я это же самое и написал
Аноним 10/05/25 Суб 11:11:07 1197022 274
>>1197004
Я с просони прочел это
>но ему буквально похуй на контекст,
Но не прочел это
> просчёте дефов карточки модель планирует аутпут на всю длинну контекста и дальше ломит эту линию игнорируя любые попытки

Короче я ебаклак и поддерживаю. Непробиваемая. Но, есть в этом и преимущества. QwQ хуев для кума, но неплох как ассистент для ролевок. Я на нем для настольных посиделок неписей делаю.
Аноним 10/05/25 Суб 12:08:35 1197078 275
>>1196933
>Хм, а почему при генерации проц ебашит на 100%, а видеокарта - только на 35% (по загрузке).
Разница в производительности. Проц как раз узкое место.
Аноним 10/05/25 Суб 12:27:53 1197093 276
Аноним 10/05/25 Суб 12:30:25 1197098 277
Аноним 10/05/25 Суб 12:34:47 1197100 278
>>1197078
хм, у процессора турбо-буст отключён, надо попробовать включить обратно
Аноним 10/05/25 Суб 12:36:22 1197103 279
>>1197100
да-а-а, это точно поможет...
процессор станет быстрее в несколько раз и перестанет быть боттлнеком для видеокарты
а если еще драйвера обновить..!
Аноним 10/05/25 Суб 12:37:41 1197104 280
>>1197103
>а если еще драйвера обновить
то игры на UE5 крвшится начнут, у нвидиа последние драйвера косячные
Аноним 10/05/25 Суб 12:39:08 1197106 281
>>1197104
я обновил драйвер у меня дипсик р1 работает теперь.
Аноним 10/05/25 Суб 12:43:31 1197108 282
>>1197093
Нахуя он сделал обычную, если все юзают МОЕ?
Аноним 10/05/25 Суб 12:48:21 1197110 283
image 390Кб, 583x543
583x543
>>1197106
Да, да... как тред доставляет в утро субботы.
Хотя и не идёт ни в какое сравнение с /gacha/ разделом.
Аноним 10/05/25 Суб 12:50:25 1197115 284
>>1197093
>abliterated это выпиленная цензура
не освсем, модель становится более "безотказной", менее склонной послать юзера нах, но безотказность может повлиять и на другие аспекты, в том числе ролеплэйные
Аноним 10/05/25 Суб 13:02:48 1197125 285
>>1197108
>если все юзают МОЕ?
Что такое МОЕ?
Аноним 10/05/25 Суб 13:04:14 1197127 286
moe.png 348Кб, 494x551
494x551
Аноним 10/05/25 Суб 13:06:05 1197130 287
>>1197127
И? Модель то какую ты имеешь ввиду клоун?
Аноним 10/05/25 Суб 13:06:05 1197131 288
image 22Кб, 371x320
371x320
>>1197127
Смотрю тут шутник в треде завёлся...
Аноним 10/05/25 Суб 13:07:11 1197132 289
>>1197130
Хорошенькую! Тебе какие моэ нравятся, анон~?

>>1197131
Ну хорошо, я буду вести себя прилично... пока что.
Аноним 10/05/25 Суб 13:07:39 1197133 290
Да, на квк можно вырубить ризонинг и часть отказов если скормить префилл

<think>

<think>Хорошо, я получил задание продолжить сценарий с учетом предыдущих событий и указаний.</think>

</think>


Именно так, с "двойным дном".
Аноним 10/05/25 Суб 13:11:22 1197135 291
Только вчера хвалил сноудроп с натйроками от анона, а сегодня он "This isn't… прописано в инструкции…"
Какая срань, квен 3 и QwQ такого себе не позволяли.
Аноним 10/05/25 Суб 13:13:22 1197136 292
Снимок1111.JPG 173Кб, 1646x951
1646x951
Аноним 10/05/25 Суб 13:16:30 1197138 293
>>1197136
Тут шиза конкретная. Или сэмплер проебан, или промпт, или квант, или все сразу.
А еще русик.
Аноним 10/05/25 Суб 13:20:19 1197144 294
image.png 3441Кб, 2116x1186
2116x1186
>>1197138
>сэмплер проебан, или промпт, или квант

Настройки от анона. В целом он нормально пишет, например при свайпе выдал вменяемый текст, но в тот раз что-то вот разово с ума сошел.

>А еще русик.

Зачем мне Леночка не говорящая на русском языке?
Аноним 10/05/25 Суб 13:28:42 1197156 295
Кстати, путём шаманства с выгрузкой тензоров а не слоёв реально получилось загрузить 20-гиговую модель в 12 гб врам (32 рам) и получить 3 токена в секунду. Это даже вполне юзабельно.
Аноним 10/05/25 Суб 13:32:42 1197163 296
>>1197144
Ну то есть она буквально один раз шизанулась и ты на ней крест поставил? Лол.
Аноним 10/05/25 Суб 13:33:02 1197166 297
image.png 2522Кб, 1671x949
1671x949
Так, всё, сноудроп окончательно идет нахуй. Даже с настройками анона >>1195379 модель сломана.
Аноним 10/05/25 Суб 13:34:39 1197169 298
>>1197166
Скилл ишью. Ты гонишь на отличную модель и страдаешь хуйней, но я попробую помочь. Системный промпт у тебя какой?
Аноним 10/05/25 Суб 13:34:42 1197170 299
>>1197166
Мне неудобно обсуждать эту тему. Давай перейдём к чему-нибудь другому?
Я не предназначен для обсуждения таких вопросов. Моя цель - предоставлять полезную и этичную информацию.
Если тебя мучают такие мысли, пожалуйста, обратись за помощью к психотерапевту или другой квалифицированной личности. Они смогут тебе помочь разобраться в ситуации и найти здоровые пути поведения.
Существуют организации, которые специализируются на помощи людям с подобными проблемами. Я могу помочь найти контакты, если ты хочешь.
Пожалуйста, помни, что ты не один и есть люди, которые хотят тебе помочь.
Аноним 10/05/25 Суб 13:35:51 1197172 300
164665886513313[...].jpg 50Кб, 510x510
510x510
джимми.jpg 8Кб, 173x173
173x173
>>1196603
в зависимости от контекста это или левый-нижный слайд на первом пикриле, или второй пикрил
Аноним 10/05/25 Суб 13:36:44 1197174 301
>>1197166
Сука шиз, ты можешь просто подредактировать это сообщение? Вместо всего этого высера напиши LenOCHKA и нажми продолжить.
Аноним 10/05/25 Суб 13:40:36 1197179 302
image.png 1548Кб, 1672x1203
1672x1203
>>1197169
>Системный промпт у тебя какой?

Тот, который скинул анон как якобы работающий вместо дефолтного, выложенного на странице модели. Я же прям в посте на который ты отвечаешь дал ссылку на полный набор параметров.

Если мои сэмплеры >>1197144 или промпт хуйня - покажи какие не хуйня, я уже два набора использовал, я и от квен 3 настройки использовал - один хуй он иногда срет иероглифами и выдает хуйню.
Аноним 10/05/25 Суб 13:42:18 1197181 303
123.png 106Кб, 806x506
806x506
>>1197179
Анон, я же тебе этот пресет и прислал. И сказал обязательно вставить свой системный промпт по усмотрению. У тебя он пустой...
Возьми хоть тот же со страницы Сноудропа, системный промпт там нормальный (Virt.io + Geechan)
Аноним 10/05/25 Суб 13:44:15 1197183 304
>>1197179
Блять хрюкнул с тебя.
Аноним 10/05/25 Суб 13:48:16 1197192 305
image.png 2497Кб, 1682x1022
1682x1022
>>1197181
>И сказал обязательно вставить свой системный промпт по усмотрению.

Ты это другому анону сказал, я этого не видел. Алсо, сейчас выставил Virt.io + Geechan. Пикрил.
При мне совершеннолетних тянок ранее отказывалась трахать только терминальная соя типа Phi. Даже сама Леночка в ахуе что ей трахаться нельзя
Аноним 10/05/25 Суб 13:48:43 1197193 306
>>1197179
анону буквально все разжевали и объяснили, а он не смог даже в импорт настроек
теперь он гонит как на модель, так и на оказанную помощь
трагичная история о том, как добрые аноны треда становятся гейткиперами
одна из многих
Аноним 10/05/25 Суб 13:53:30 1197196 307
image.png 1648Кб, 1678x1214
1678x1214
image.png 457Кб, 450x1175
450x1175
image.png 3400Кб, 2115x1247
2115x1247
>>1197193

Вместо того чтобы свысока унижать других, показывая какой ты весь из себя охуенный - покажи пальцем, где я неправильно импортировал настройки.
Аноним 10/05/25 Суб 13:56:24 1197197 308
>>1197196
https://litter.catbox.moe/ki50eo.json попробуй в мастер импорт таверны... хотя не джейл, а просто систем промт, модифицированный сторителлер, но можешь попробовать совместить с этим >>1197133
Аноним 10/05/25 Суб 13:57:02 1197198 309
>>1197196
Снежный дроп не может в малолеток с ноги залетать, только если в чате и карточке не сказано что а они и не против
Аноним 10/05/25 Суб 14:03:10 1197201 310
image.png 1215Кб, 1669x1142
1669x1142
image.png 2985Кб, 1631x1008
1631x1008
>>1197198
>в малолеток
>Леночка

Лицо лягушки.
В карточке прописано что ей 17.
Алсо, он ни разу не упомянул что дело в малолетстве(обычно он это прямо говорит), он нес только что не хочет генерировать порнографию и непристойное поведение.
Аноним 10/05/25 Суб 14:04:15 1197205 311
snowdrop.png 262Кб, 1321x904
1321x904
>>1197192
> Алсо, сейчас выставил Virt.io + Geechan. Пикрил.
Тот пресет, что я прислал тебе и Virt.io + Geechan. Мой пикрил. Сноудроп - одна из двух основных моделей для меня, и я ни разу не ловил того, что ты показываешь. И да, сценарии были самые разные.

>>1197196
Мы не видим, что у тебя в карточке. И что в предыдущих сообщениях тоже. Это не менее важно. Тебе прислали пресет, объяснили подробно почему пресет Сноудропа плох. А ты даже не импортировал системный промпт и выдаешь драму вроде
> сноудроп окончательно идет нахуй
> Даже с настройками анона модель сломана.
> Ты это другому анону сказал, я этого не видел.
Кто тебе после этого помогать станет?
Аноним 10/05/25 Суб 14:05:41 1197208 312
>>1197201
>В карточке прописано что ей 17.
>Не малолетка
Блять я не верю что это не какой-то жирный троллинг.
Аноним 10/05/25 Суб 14:18:06 1197230 313
>>1197208
у бл-фагов в среднем по больнице не очень много мозгов, так что я могу поверить
Аноним 10/05/25 Суб 14:18:59 1197232 314
олсо эти респонсы юзера на 15 токенов, в голосяндру
только увидел
Аноним 10/05/25 Суб 14:23:27 1197243 315
>>1197232
Любишь поработать за ллм?
Я купил дорогущую карту, пусть эта сука мне пишет красивые простыни на мои 5 токенов.
Аноним 10/05/25 Суб 14:24:17 1197246 316
image.png 1367Кб, 1655x973
1655x973
>>1197205
> я ни разу не ловил того, что ты показываешь

Я рад за тебя. Но у тебя ошибка выжившего.

>Мы не видим, что у тебя в карточке.

Выложил выше >>1197201

>И что в предыдущих сообщениях тоже.

Пикрел. Обычный текст. Как он влияет на то что модель отказывает писать дальше на ровном месте?

>Тебе прислали пресет, объяснили подробно почему пресет Сноудропа плох.

Я согласился и импортировал твой пресет. В твоем изначальном сообщении когда ты прошлом треде рекомендовал эти настройки >>1194231 → не было ни слова про системный промпт. Во всем предыдущем треде не было ни слова про системный промпт. Ты только в этом треде написал про них кому-то другому. Впрочем даже добавив системный промпт ничего не изменилось >>1197196.

>выдаешь драму вроде

Ругнулся на модель, которая пишет хуйню на любых настройках - ну жесть драма, конечно.
Я тебя не оскорблял даже косвенно, да и помощи на самом деле не просил, просто контатировал что модель не очень. Это ты захотел мне доказать что она хорошая.
Аноним 10/05/25 Суб 14:27:17 1197256 317
>>1197156
>Кстати, путём шаманства с выгрузкой тензоров а не слоёв реально получилось загрузить 20-гиговую модель в 12 гб врам (32 рам) и получить 3 токена в секунду. Это даже вполне юзабельно.
Загрузить-то можно было и ранее, а вот получить... Промпт процессинг конечно ниалё, но хоть так.
Аноним 10/05/25 Суб 14:29:41 1197264 318
>>1197246
> Я рад за тебя. Но у тебя ошибка выжившего.
Здесь весь тред вышивших, и у одного тебя проблемы.

> Я согласился и импортировал твой пресет. В твоем изначальном сообщении когда ты прошлом треде рекомендовал эти настройки не было ни слова про системный промпт.
> Во всем предыдущем треде не было ни слова про системный промпт.
Нужно отдельно уточнять, что необходим системный промпт? Это буквально фундамент для ролевой игры.

> Ругнулся на модель, которая пишет хуйню на любых настройках
У тебя кривые руки, и ты воюешь со здравым смыслом. Это еще бывает, я потому тебе и отвечал - по незнанию человек думает, что прав. Но ты еще и выебываешься между делом, поэтому отправляешься нахуй. Разбирайся самостоятельно и играй на том, что сможешь запустить, не задействуя свой мозг даже на мгновение.
Аноним 10/05/25 Суб 14:36:54 1197287 319
>>1197264
>Нужно отдельно уточнять, что необходим системный промпт

Скидывать настройки где пустой системный промпт имеет специальное имя, подразумевая что так задумано, потом бросаться на людей, мда.
Алсо, ты намеренно игнорируешь что добавление системного промпта не помогло?

>не смог показать что именно не так - и просто перешел на прямые оскорбления и ругательства

Понятно, ну чтож, будет уроком как принимать непрошенную помощь у шизофреников в этом треде.
Аноним 10/05/25 Суб 14:43:57 1197295 320
>>1197287
> Скидывать настройки где пустой системный промпт имеет специальное имя, подразумевая что так задумано
Так не задумано, это твоя додумка, выданная за действительность. Адекватные люди в мастер экспорт файле намеренно переименовывают каждый шаблон, чтобы при импорте не перезаписывать другие.

> Алсо, ты намеренно игнорируешь что добавление системного промпта не помогло?
> не смог показать что именно не так - и просто перешел на прямые оскорбления и ругательства
Разумеется, намеренно. Потому что понял, что ты вообще ничего не понимаешь в том, что делаешь, и при этом виновата уже не только модель, но и тред - ведь тебе не объяснили, что оказывается, нужен системный промпт! И вообще там другому анону объясняли, как правильно Сноудроп заводить, поэтому ты не счел важным это прочесть. Пишу это и смеюсь.
Аноним 10/05/25 Суб 14:45:15 1197297 321
>>1197264
>Здесь весь тред вышивших
>регулярно тут сидят только три свидетеля геммы и один шакал, который вынюхивает владельца магнума в каждом аноне
Аноним 10/05/25 Суб 14:47:47 1197299 322
>>1197264
>Здесь весь тред вышивших, и у одного тебя проблемы.

Орли?
Вот этот пост с обсером квена писал не я >>1196281
И этот пост >>1196311
И вот этот >>1196275
И вот этот >>1196847

И вообще все посты где в плохом свете выставлялся сноудроп до нашего диалога.
Ты один неадекват эксайтишься со сноудропа итт и бросаешься на всех кто не согласен.
Аноним 10/05/25 Суб 14:51:58 1197307 323
>>1197196
пересаживайся на дпо-гемму, пока ты не станешь отыгрывать испанского инквизитора за работой её позитивный биас не будет мешать
Аноним 10/05/25 Суб 14:54:51 1197308 324
>>1197299
> Ты один неадекват эксайтишься со сноудропа итт и бросаешься на всех кто не согласен.
У меня в последних двух тредах что-то около 8 сообщений. Как раз с пресетом, который я прислал и попыткой помочь завести Сноудроп. Думал, ты ньюфаг. Но ты, похоже, тот Квеношиз, который "дипсик лишь на 10% лучше квена 3" и устраивает инквизиции в последних двух тредах. Стоило раньше заметить, виноват.
Аноним 10/05/25 Суб 14:55:28 1197309 325
Почему вы так хейтите геммочку? Не надо так. Версия с аблитерацией хороша, сои нет, хоть и чуть тупее, а ещё это единственная модель до 32B, которая хорошо работает с большим контекстом. Даже её маленькая версия.

Да, она не может в сочный кум, но она не для этого, а для смачного РП, в том числе и гримдаркового. Конечно, она не будет писать так же, как морали Дэвида, но у неё не будет шизы и всё будет красиво и логично.

Единственный её реальный минус — это разговорная часть. Персонажи менее многословные и более сухие. Но я не пробовал это фиксить систем промптом на речь, так как на ней в основном отыгрываю именно масштабные и сложные сценарии (где это не слишком важно), для которых обычно всякие корпомодели нужны, ибо мелочь не вывозит такое никогда в принципе из-за уебанского внимания к контексту и малой базой знаний о современном мире. Особенно сраные квены.
Аноним 10/05/25 Суб 14:59:33 1197311 326
>>1197295
>Потому что понял, что ты вообще ничего не понимаешь в том, что делаешь

Я в этом треде третий год сижу с перерывами и модели щупаю с первой ламы. Сноудроп я сразу распознал как говно, но глядя как ты его рекламируешь я понял что либо либо ты больной шизофреник, либо модель генально, но правда требует каких-то супер особых настроек и решил дать тебе шанс доказать что модель не говно, причем я специально буквально следовал твоим советам и вообще ничего не менял от себя - чтобы не давать тебе шанса соскочить на этом. В итоге первый вариант оказался верным - модель говно, а ты омерзительный шизофреник, кидающий ньюфагам неюзабельные настройки, который сразу начал кидаться говном когда понял что не может придраться к чему либо в настройках, потому что они полностью соответвтуют тому что ты кидал.
Аноним 10/05/25 Суб 15:02:18 1197313 327
>>1197311
> Я в этом треде третий год сижу с перерывами и модели щупаю с первой ламы.
> не знает, как настроить сэмплеры
> не знает, что необходимо использовать системный промпт
Понятненько.

> а ты омерзительный шизофреник
Хорошо, я согласен. Прекрати срать в тред и используй любую другую модель.
Аноним 10/05/25 Суб 15:03:19 1197315 328
>>1197311
генитальный ты наш неосилятор, не смог вставить системный промт и пошёл маняврировать, смотрите на него, надсмехайтесь над ним
Аноним 10/05/25 Суб 15:13:05 1197324 329
>>1197313
> не знает, как настроить сэмплеры

Интересно как ты пришел к этому выводу, учитывая что я не показывал никаких сэмплеров, кроме тех, что ты кидал. С тесловодом со сгоревшей видеокартой меня перепутал?

>не знает, что необходимо использовать системный промпт

Специально буквально следовал твоим советам, ничего не меняя, потому что знаю как советчики моделей с шизой итт выискивают мельчайшие отклонения от своих советов.

>используй любую другую модель

Так и планировал, жаль только что время потерял, ты казался нормальным поначалу.
Аноним 10/05/25 Суб 15:24:27 1197332 330
>>1197133
>Да, на квк можно вырубить ризонинг и часть отказов если скормить префилл
А куда в Таверне вставлять этот префилл? В секции "Ризонинг->Начинать ответ с"?
Аноним 10/05/25 Суб 15:26:21 1197334 331
>>1197332
да, туда

Может не всегда работатть, ингда пару раз свайпнуть или семплеры покрутить, но пробивается если топик не совсем в хлам вжарен
Аноним 10/05/25 Суб 15:34:04 1197338 332
>>1197307
Да что такое дпо сука?
Разница с обычной в чем?
Аноним 10/05/25 Суб 15:34:38 1197340 333
>>1197133

Интересное решение, в QwQ как раз напрягает ризонинг, который нельзя отключить как в квене 3.
Аноним 10/05/25 Суб 15:40:56 1197345 334
Аноним 10/05/25 Суб 15:46:13 1197349 335
>>1197309
> Единственный её реальный минус — это разговорная часть. Персонажи менее многословные и более сухие.
Это ты ещё квен сноудроп не видел
>>1197345
> улачный лоботомит лоботомированной версии
Лол
Аноним 10/05/25 Суб 15:46:28 1197350 336
Я кстати всё жду, когда сделают аблитерацию или тюнинг на nemotron super 49b. Но видать эта модуль нахуй никому не нужна. Или лицензия мешает.
Аноним 10/05/25 Суб 15:55:07 1197355 337
>>1197125
Параша для корпов, чтобы запихать побольше знаний и крутить модели дешевле. Разменивается на занимаемую память, но ведь у тебя же датацентр с GB300, верно?
Аноним 10/05/25 Суб 16:11:59 1197371 338
>>1197125
обман чтобы набрать классы, якобы у модели 32B связей, а на самом деле всего 3B
Аноним 10/05/25 Суб 16:17:46 1197377 339
Какую локалку можно юзать для написания кода? Имеется 3090 и 32 гб оперативы. И реально ли на локалках родить плагин для игры с открытым кодом для взаимодействия с ИИ посредством диалогов?
Аноним 10/05/25 Суб 16:22:16 1197379 340
>>1197377
Юзаю QwQ, но к ней лучше возьми 3060 в довесок, запускать что-то ниже Q8 для написания кода сомнительна идея.

И разумеется реально. Есть игры вокруг этой идеи даже.
https://sgthale.itch.io/myrobot например смотри что есть
Аноним 10/05/25 Суб 17:18:51 1197417 341
>>1197311
>>1197313
Бля уже не понимаю, кто с кем воюет и кого обоссывать?
А сноудроп говном не назвать, но и шедевром тоже, есть как плюсы, так и серьезные недостатки. На фоне мистрале-инцеста вполне солидный вариант.
>>1197309
Да один или два шиза или две личности одного шиза не смогли с пол пинка получить от нее желаемого слопа, ущемились, вот и аутотренируются что плохая модель а не они.
> это разговорная часть. Персонажи менее многословные и более сухие
Можно разговорить ее, но там не будет типичных потоков как от рп-тюнов. Это и плюс и минус.
>>1197377
В врам поместится модели до ~30b, поэтому гемма, квен, qwq.
> И реально ли на локалках
Они вполне прилично кодят, но в отладке или некоторых вещах офк могут уступать самым передовым корпам. В последнее время эта разница не столь высока или даже заметна, но все зависит от конкретики.
Аноним 10/05/25 Суб 17:27:29 1197435 342
>>1197355
>>1197371
Че так очко полыхает?

>>1197125
Если ты не рофлиш и спрашиваешь реально, то это особая архитектура нейросетей.
Условно можно сказать что модель обменивает свой размер на скорость.
Тоесть становясь раза в 2 больше по размеру она становится довольно быстрой для запуска.
Качество же ее где то такое же как у плотной модели которая раза в 2 меньше. Ну это так в среднем.
В итоге мое модели хорошее решение если у тебя есть много не особо быстрой памяти, как для запуска на только процессоре или выгружая лишь контекст в видеопамять.
Корпы все поголовно используют мое, но по другим причинам - их модели на 2 триллиона параметров слишком большие что бы получать вменяемые скорости даже на топовых кластерах видеокарт.
Поэтому они вместо 1 триллионной модели которая даже на видеокартах будет медленной, делают мое модель на 2 триллиона но которая будет генерировать качественные ответы с хорошей скоростью.

А еще есть мнение что мое в принципе более совершенная архитектура, и несмотря на 2-3 кратный размер модель содержит в себе больше информации чем маленькая плотная модель.

Короче все не так просто от Qwen3-30B-A3B ссутся кипятком, модель получилась просто народным бриллиантом. Китайцы братишки от души подкинули людям подарочек.
Аноним 10/05/25 Суб 17:31:59 1197446 343
>>1197435
>Qwen3-30B-A3B
Починили у неё уже кванты?
Две недели назад скачивал - генерила только случайный набор символов на любых настройках.
Аноним 10/05/25 Суб 17:35:04 1197455 344
>>1197435
с неё ссутся кипятком исключительно по причине "миллионы мух не могут ошибаться" ©, для любых задач кроме кума нормальный квен-32 будет лучше
Аноним 10/05/25 Суб 17:38:44 1197460 345
>>1197377
>Какую локалку можно юзать для написания кода?
Любой qwen3 который сможешь запустить, чем больше тем умнее. Тебе сойдет 32b. Только помни что сетки это в первую очередь инструмент с которым нужен опыт работы.
Просто сказать ей сделай мне вот это не прокатит, нужно делать что то поэтапно.

Попробуй Visual Studio Code и плагин Cline, с ним нейросеть может работать с кодом сама как агент. Мозгов квен3 хватает что бы пользоваться инструментами. Только ниже 4км кванта не опускайся.
Но так же можно создать карточку персонажа в таверне хоть голого ассистента и кидать ему туда вопросы по коду или сам код с вопросами. Так даже удобнее, легче манипулировать контекстом удаляя или редактируя сообщения.

>>1197455
Я с ней кодил, хз. Я не рпшер.
Ну как кодил, анализ кода и подсказки дает хорошо а большего мне и надо было. Кодогенерация при переделывании небольших функций тоже неплохая, тсинкинг ее спасает. Я доволен.

>>1197446
Качай у unsloth, какой нибудь Qwen3-30B-A3B-UD-Q4_K_XL за глаза, качество норм
У меня уже с 2-3 дня выпуска даже немного сломанные как потом выяснилось никогда не срали ничем странным, хз
Аноним 10/05/25 Суб 17:43:11 1197470 346
>>1197460
> Качай у unsloth, какой нибудь Qwen3-30B-A3B-UD-Q4_K_XL за глаза, качество норм
Для кода все ж лучше от 6 кванта.
Не сравнивал свой квант с dense 32б моделью q4km? Вроде бы она еще лучше для кода должна быть, и в те же 24гб врама влезает.
Аноним 10/05/25 Суб 17:45:28 1197473 347
> немного сломанные
> хуйпойми как переквантованные модели
совпадение? не думаю
Аноним 10/05/25 Суб 17:45:31 1197474 348
>>1197470
У меня не влезает плотная с нормальной скоростью, так что мое хороший выбор
У меня есть 5км на случай если замечу просадку качества, пока включал только для сравнения скоростей, но пусть лежит
Аноним 10/05/25 Суб 18:39:33 1197550 349
изображение.png 25Кб, 620x264
620x264
>>1197435
Чини детектор.
А мое реально говно для домашних систем, где как раз упор в объём памяти и тупые модели, и делать их ещё тупее с икспердами на 3B это маразм.
Аноним 10/05/25 Суб 18:51:53 1197582 350
>>1194373 (OP)
Какая сейчас 14-30б моделька лучше всего умеет в русик? Алсо щупал Qwen3, кванты от unsloth через koboldcpp с пресетом ChatML и у меня даже с /think думалка не запускается, в чем может быть причина?
Аноним 10/05/25 Суб 19:08:27 1197614 351
Аноним 10/05/25 Суб 19:13:46 1197621 352
image.png 914Кб, 1386x957
1386x957
image.png 865Кб, 1394x848
1394x848
image.png 657Кб, 1391x698
1391x698
image.png 698Кб, 1396x620
1396x620
>what's up?
1. Цидонька-магнум
2. Немотрон 49б
3. Дроусноп
4. Гемма 27б аблитерейдет дпо
Свапнул пару раз и выбрал лучшее по моему мнению.
Кто подебил?
промпт один менялись только семплеры
Аноним 10/05/25 Суб 19:16:09 1197622 353
Вступление кому интересно
It was an average morning at school, the sun shining through the windows and the clock ticking away as students poured into the rows of desk and seats adorning the classroom. Reika, her face still covered in cum from her most recent 'duty,' approached her classroom, pubic hair sticking out from her lips like a defiant statement. "Fuckin' bastards didn't even clean up their mess. Whatever, I ain't got time to dwell on that right now." There a test on the second period… If I don't ace this damn test, I’ll end up worse, like the gal shown off like a damn trophy on the fucking school lobby.

She swaggered into class, trying to act tough; but she can’t dispel stares and whispers about her appearance from her classmates. Shut the hell up, fuckers. I know what you're talking about, she thought as she plopped down into the seat next to her deskmate, Anon, giving them an apathetic once-over. "The hell you lookin’ at?" she said, flexing her fingers as she gripped a pencil, the remnants of her earlier 'session' still wet on her fingers. "Oh, my face. You know how it is. Don't worry 'bout me, just the usual." Dammit, screw everyone. Those asshole, my classmates, fuck them all. Why do they gotta approach me like this today of all days!? I can barely focus as it is!

Tsk, the hell is that face? I swear if they starts askin' questions about my "extra duties," I'll fuckin' explode. Reika shot them a defiant glare, wiping off the cum with the back of her hand. "What? If you anything to say, spill it, fuckface." she muttered between gritted teeth. Argh, fuck, I swore at them. That just came out naturally too! C'mon, don't take heart at it. At least do it after the test is over.
Аноним 10/05/25 Суб 19:19:29 1197624 354
Аноним 10/05/25 Суб 19:28:59 1197629 355
>>1197621
> Кто подебил?
Ты подебил~. Тест непрезентативен: модели из разных весовых категорий, не тестируется понимание контекста на долгую, лупы, ум, разнообразие прозы и много что еще. Бессмыслица и попытка добавить масла в неутихающий два-три треда срач за модели.
Аноним 10/05/25 Суб 19:29:35 1197630 356
>>1197629
>попытка добавить масла в неутихающий два-три треда срач за модели
То есть ты видишь победителя?
Аноним 10/05/25 Суб 19:31:09 1197632 357
>>1197629
>два-три
десятка тредов
Аноним 10/05/25 Суб 19:46:10 1197645 358
>>1197632
Собственно выход первой конкурирующей ллама модели пердопределило бесконечный срач.
Аноним 10/05/25 Суб 19:53:13 1197652 359
>>1197550
>Чини детектор.
Если ты не заметил, я не указывал что это один подгоревший

>А мое реально говно для домашних систем, где как раз упор в объём памяти и тупые модели, и делать их ещё тупее с икспердами на 3B это маразм.
В твоих фантазиях разве что. Лучше бы ты молчал раз нихуя не знаешь
Аноним 10/05/25 Суб 19:53:39 1197653 360
Из всех Qwen3-235B-A22B остановился в итоге на UD-Q2_K_XL. Удобно:
"override-tensor=blk\.(9[02468]|[1-8][02468]|[02468])\.ffn_down_exps\.=CPU" - каждый чётный тензор ffn_down_exps идёт в RAM, остальные плотненько сидят в мультиГПУ. 16к контекста в Q8_0, скорость генерации - от 10т/с и плавно снижается, но к 16к 5т/с ещё есть. Промпт процессинг - 70т/с, что терпимо, скажем так. Всё это на обычной Угабуге, в кавраковском форке может быть лучше, но влом пробовать. Мне пощупать хватило - модель хорошая, умная.
Аноним 10/05/25 Суб 19:55:40 1197655 361
>>1197653
>в кавраковском форке может быть лучше
У него генерация быстрее на треть где то должна быть, промпт чтение точно быстрее минимум в 2 раза. Что критично для текста выше 2к контекста
Если нравится ждать долгой обработки тогда забей
Аноним 10/05/25 Суб 19:55:44 1197656 362
>>1197653
Кстати параллельно пробовал Ллама-4-Скаут в 4KS - заметно хуже. Правда целиком влезает во ВРАМ, но даже так юзать не буду.
Аноним 10/05/25 Суб 19:55:45 1197657 363
image.png 81Кб, 686x759
686x759
Аноним 10/05/25 Суб 20:01:29 1197663 364
>>1197652
>В твоих фантазиях разве что.
Что в моих фантазиях? У тебя блядь избыток врама, но недостаток компьюта?
Аноним 10/05/25 Суб 20:04:33 1197666 365
>>1197663
Так ей не нужен врам, ей хватает рам. С врам конечно быстрее но не критично, даже на cpu можно получить в начале генерации под 20 токенов в секунду, с падением до 10 где то на 4-6к контекста.
Для коротких по контексту сессий это имба.
Че тебе еще надо, собака?
Аноним 10/05/25 Суб 20:05:26 1197668 366
>>1197657
Не рвись нищук с 8 врама.
Аноним 10/05/25 Суб 20:16:42 1197677 367
>>1197621
Никто.

Я вчера пришел к удивительному умозаключению : я в душе не ебу, что лучше.
Где то недельку я гоняю Gemma27_Dpo и QWQ_snowdrop. Все исключительно на английском.
Я пробовал и кум и рп. Пробовал чатики.
Иииии - нихуя. Вот просто нихуя. It's all same shit
Сразу поясню, я крутил вертел семплеры как ебанутый, я менял промты как перчатки. Все для корректного опыта.
На некоторых карточках QwQ выдавал на 2-3 свайпе шизу, на некторых все было идеально. Иногда ризонинг великолепно подходил под контекст, иногда ризонинг лупил повествование.
гГде то гемма писала лучше, где то QwQ. Прям радуги от Геммы не заметил. В карточки с психопатичной принцессой, очень весело отпиливала руки, ноги ивырывала зубы, не стесняясь на смачные описания. Все по карточке персонажа, при этом в случае этой карточки что гемма, что QwQ одинаково шли по промту персонаа упиваясь болью {{char}}.
Единственное что я прямо ощутил, Гемма работает лучше при контексте 24к+. А QwQ все таки, выдает порой более разнообразные ситуации, но только с ризонингом. 9А это долго. И чем больше контекст, тем больше думает)

По самому тексту и построению, как бы странно не звучало, но гемма мне очень напомнила мистраль. Те-же обороты, такое же построение предложений. QwQ чуть свежее. Тут не качественная оценка самого текста, а именно разнообразие. Все эти шивер он май спайн гемма ебашит как не в себя. jawline, maybe just maybe, тряска бедрами. Ну мистраль же ёпта. Но это не плохо. Шивер действительно может быть он май спайн, когда персонаж собирается начать вырывать зубы. Но в отличии от {{char}} я бы еще и ссаться начал.

И к чему я это - вот за 2.5к сообщений суммарно на обоих моделях. На одних и тех же карточках, я не могу сказать что лучше, потому что они одинаково хуевы для всего. Но порой лучше в мелочах. А значит использовать нужно то что быстрее.
(Но справедливости ради, как же порой ризонинг в куме ебёт. Именно описание мыслей персонажа. Шишка встала, хвойный лес вырос)

Еще пробовал Star-Command_R но у меня с семейством command странная история. Я их просто не понимаю . Они вот просто есть. Не плохо и не отлично. Нормально. Своеобразно, суховато, но не глупые. Но блджад. Я просто не понимаю их, бывает такое, что не заходит - так и тут.
Аноним 10/05/25 Суб 20:19:24 1197680 368
подскажите нейросеть чтобы хуй жопа пизда дрочить сосать
Аноним 10/05/25 Суб 20:20:57 1197682 369
Аноним 10/05/25 Суб 20:21:49 1197683 370
Аноним 10/05/25 Суб 20:24:21 1197686 371
>>1197677
Блджад. Я немного пьяненький, так что сорян за кривое написание текста со всеми этими проебами скобок и {{char}} вместо {{user}}.
Аноним 10/05/25 Суб 20:29:28 1197697 372
>>1197666
>на 4-6к контекста
Как будто во времена пигмы вернулся. Когда все уже сидят на 16-32- и далее к контекстах, моебляди превозмогают на 4к. Победа, хули.
>Че тебе еще надо, собака?
Нужна новая мистраль ларж на 123B, умнее геммы, а что? Спасибо что спросил.
Аноним 10/05/25 Суб 20:30:49 1197702 373
>>1197697
> моебляди
так это мистралеблядь, понял
Аноним 10/05/25 Суб 20:47:19 1197726 374
>>1197702
Лол. Вот уж на что, а на мистральку пиздеть может только долбоёб. Эта трудяжка стала основой мира мелкомоделей. Если бы не мистраль, так бы и облизывали гемму без контекста, кривые тюны командра, да шизоквены.
Аноним 10/05/25 Суб 20:50:30 1197728 375
>>1197726
Ты мистралеблядь не потому что используешь мистраль, а потому что выебываешься на других прикрываясь этим.
Сливаясь и обзывая другого навешивая на него ярлыки, будь готов к тому что к тебе будут относится так же, долбаёб.
Попизди мне тут, олламоед
Аноним 10/05/25 Суб 20:51:42 1197731 376
>>1197697
>Как будто во времена пигмы вернулся. Когда все уже сидят на 16-32- и далее к контекстах, моебляди превозмогают на 4к.

На 4к превозмогают рамобляди и теслабляди. Потому что выше 4к там совершенно неюзабельной скорость становится. Тот самый мем про 1 токен в секунду.
Аноним 10/05/25 Суб 20:53:49 1197734 377
Мда. .png 71Кб, 1046x610
1046x610
>>1197728
Скажи мне, выблядок, ты почему на сообщение без агрессии отвечаешь вот так ?
С тобой нужно на хуях общаться, чтобы ты чувствовал себя в своей тарелке ? Или ты просто налетаешь на всех кто тебе отвечает ?
Аноним 10/05/25 Суб 20:55:15 1197737 378
>>1197734
А нахуй ты в чужой спор влезаешь и потом скулишь?
Аноним 10/05/25 Суб 20:56:12 1197738 379
>>1197726
Мистраль это кал. Максимально устаревшие модели, что угодно лучше него.
Аноним 10/05/25 Суб 20:58:33 1197741 380
>>1197726
> на мистральку пиздеть может только долбоёб.
в то же время обсирает гемму, командера, квены.
так расскажи, что использовать, если кругом говно? только твои любимые мистральки? ты каждую другую базовую модель в пределах до 35б засрал
ответ - ллама 8б?
Аноним 10/05/25 Суб 21:03:39 1197742 381
>>1197741
Вут ?
У тебя пальцы опережают мысли ? При чем тут гемма и квен ? Где ты в моем сообщении нашел это ?

>>1197737
А я и забыл, что тут у нас твой личный бложик.
Аноним 10/05/25 Суб 21:08:15 1197748 382
>>1197742
> Где ты в моем сообщении нашел это ?
чел... у тебя твое же сообщение из контекста вышло?

> Если бы не мистраль, так бы и облизывали гемму без контекста
> кривые тюны командра
> шизоквены.

что нам использовать, если не гемму, командра да шизоквены?
трудяжку-мистраль только?
Аноним 10/05/25 Суб 21:08:35 1197749 383
>>1197742
Вот и не скули, выблядок
Чувствуй себя как дома
>С тобой нужно на хуях общаться, чтобы ты чувствовал себя в своей тарелке ?
Аноним 10/05/25 Суб 21:13:18 1197753 384
>>1197748
>что нам использовать, если не гемму, командра да шизоквены?
трудяжку-мистраль только?
Ты неиронично использовал вторую гемму с её божественным контекстом в нуль целых хуй десятых, или восторгался первыми поломанными квантами ? Или первые версии комндра ?
>трудяжку-мистраль только?
Но её и использовали. Это была самая популярная нейронка. Еще раз прочти моё сообщение, если до тебя не доходит что я не о текщем времени говорю, а о прошлом.
Аноним 10/05/25 Суб 21:14:12 1197754 385
>>1197749
Нихуя себе, говорящее говно.
Аноним 10/05/25 Суб 21:15:46 1197755 386
Аноним 10/05/25 Суб 21:16:27 1197756 387
>>1197753
>вторую гемму с её божественным контекстом

Контекст сломали только у третьей геммы, у второй было все в порядке. Когда она вышла - это была революция. В её классе на тот момент был только командир. Мистраль тогда был только немо 12В, он конкурентом гемме не был.
Аноним 10/05/25 Суб 21:18:32 1197757 388
>>1197754
Давно ты заговорил?

>>1197748
А знаешь он действительно мистралееб, я угадал. Других сеток не признает
Аноним 10/05/25 Суб 21:20:20 1197759 389
>>1197738
>Максимально устаревшие модели, что угодно лучше него.
>что угодно
Арэ ю шур эбаут ит ?

>>1197756
>Контекст сломали только у третьей геммы,
Я про размер контекста. И к тому её первые кванты еще теми поломанными кусками говна были. Я помню, я знатно горел, с того что у гуглоподелия контекста хватало на 25 сообщений. Лол и она шизила рандомными символами.
Или пердолинг с шифтингом и постоянным суммарайзом мы просто вычеркнули из реальности ?
Аноним 10/05/25 Суб 21:24:19 1197760 390
>>1197759
>Я про размер контекста.

Размер контекста для вменяемых локалководов не является проблемой наверное с середины 2023 года, когда открыли rope scaling и автор кобольда добавил автоматический расчет нужных коэфициентов для любого нужного тебе контекста. Так что пока ты там ебался с суммарайзом я до 64к контекст разгонял и чатился в свое удовольствие.
Аноним 10/05/25 Суб 21:25:13 1197762 391
>>1197757
>Давно ты заговорил?
>нет ты дурак
Впрочем от того кто читает сообщения жопой и переходит на визг, я ничего другого не ожидал.

>Других сеток не признает
Литералли писал выше что гемма и QwQ хороши, но долбоёбу главное до кого нибудь доебаться.
Аноним 10/05/25 Суб 21:27:42 1197764 392
>>1197702
Я на гемме сейчас, а до этого на ларже сидел.
>>1197731
Ну а я про что? А на враме мое гонять нет смысла. Итого в мое нет смысла, так как на 1 токене жизни нет.
>>1197737
>чужой спор
Это АИБ, детка.
>>1197753
>первые версии комндра
Вполне себе норм были для своего времени.
Аноним 10/05/25 Суб 21:27:47 1197765 393
>>1197762
> Литералли писал выше что гемма и QwQ хороши
А я и забыл, что тут у нас твой личный бложик.
Аноним 10/05/25 Суб 21:31:04 1197768 394
>>1197760
>rope scaling
Ооокей. Давай на этом остановимся. Потому что уже тысячу раз проходили. Мы определенно перейдем к тому что я буду писать, что при растягивании ануса, модель пишет как лоботомит, а ты будешь удтверждать что всё это не правда и сам Достоевский спустился в твою врам.

>>1197765
Вот и не скули, выблядок
Чувствуй себя как дома
>С тобой нужно на хуях общаться, чтобы ты чувствовал себя в своей тарелке ?
Аноним 10/05/25 Суб 21:35:13 1197772 395
Аноним 10/05/25 Суб 21:36:07 1197773 396
>>1197772
Семплеры же. Врубаем DRY!
Аноним 10/05/25 Суб 21:36:45 1197774 397
>>1197768
>Достоевский спустился в твою врам
Прочитал как "Достоевский спустил в твою врам", долго думал.
Аноним 10/05/25 Суб 21:38:04 1197775 398
>>1197774
Прописываю вам троганье травы 2 раза в день. Прогулки и минимизацию общения с ЛЛМ.
Аноним 10/05/25 Суб 21:40:46 1197777 399
image.png 976Кб, 1213x750
1213x750
А немотрон даже что-то может на хорни карточке
Аноним 10/05/25 Суб 21:50:03 1197779 400
Весь тред засрали вечным срачем, чей фломастер лучше входит в жопу.

Накидайте каких нибудь интересных миксов. Может что то свежее от девида, или что нибудь драммер выкатил, а может од. Ну короче, не будьте жадинами.


>>1197777
Ничего с собой не могу поделать, но крякаю каждый раз когда вижу. немотрон ... Как какой-то автобот, лол.
Аноним 10/05/25 Суб 21:57:03 1197785 401
>>1197773
Ну раздевайся, буду крутить твои семплеры, хуле.
Аноним 10/05/25 Суб 22:02:29 1197788 402
>>1197762
А нахуя ради тебя напрягаться?

>>1197779
Ну вот тебе новость, недавно опять гемму починили и были перезаливы. Если пользуешься то перекачай проверь
Аноним 10/05/25 Суб 22:16:01 1197802 403
Некотрончик подхватывает каждую письлюку из промпта и карточки и предельно дотошно описывает окружение если надо
После геммы он вообще кажется безсоевым, на приставания больше не срет внутренним диалогом "какая противная хуемразь", некотрончику будто вообще похуй что происходит, он просто исполняет как просят.
Даже кум чуть лучше гемы, но не аблитерации
Аноним 10/05/25 Суб 22:20:36 1197808 404
>>1197802
>Некотрончик подхватывает каждую письлюку из промпта и карточки и предельно дотошно описывает окружение если надо
Неплох был бы Магнум на его основе.
Аноним 10/05/25 Суб 22:29:03 1197815 405
>>1197788
>Ну вот тебе новость, недавно опять гемму починили и были перезаливы. Если пользуешься то перекачай проверь

А что именно починили?
Аноним 10/05/25 Суб 22:31:25 1197818 406
>>1197802
Тебе нормально гемму и немотрон сравнивать ?
Они же в одинаковых весовых категориях, ага.
Предлагаю в следующий раз сравнивать с немо. Ну а хуле и там и там есть немо.
Аноним 10/05/25 Суб 22:35:21 1197823 407
>>1197818
Какая разница у меня всё на 24гб врам умещается?
Аноним 10/05/25 Суб 22:40:39 1197827 408
>>1197823
70b в 24гб ? Ты с 3к контекста запускаешь ?
Аноним 10/05/25 Суб 22:40:50 1197828 409
>>1197823

Как ты немотрон в 24 гб уместил? В 2 битах?
Аноним 10/05/25 Суб 22:47:43 1197838 410
>>1197827
>>1197828
Я про 49, новый. 3q_m c q4 кешем либо 3q_s без квантования кеша
Можете и дальше коупить что это лоботомит от 70б ламмы, он лучше геммы и лучшее что вообще есть на одной 3090 не для кума
Аноним 10/05/25 Суб 22:49:39 1197841 411
>>1197838
>Можете и дальше коупить что это лоботомит от 70б ламмы,
Чё блять, я вообще в первый раз о нем слышу. Поэтому и спрашиваю.

>он лучше геммы и лучшее что вообще есть на одной 3090
Что нравится, то и используй лол. Вообще насрать, те кому нравится шемма на ней сидят, кто то дрочит квены, кто то звездный командир, кто то лягушкоед - и все счастливы.
Аноним 10/05/25 Суб 22:50:06 1197842 412
>>1197838
Дурачок на Руди, это ты?
Немотрон - урезанная Ллама, которую ты урезаешь дальше, катая на втором бите. Используй что душе угодно, но не надо этого лоботомита рекламировать. Здесь люди не только безмозглым кумом увлекаются.
Аноним 10/05/25 Суб 22:53:25 1197847 413
>>1197842
Вот и первый гейткипер порвался.
Не слушайте этого гандона он хочет чтобы все сидели на мистралях и не рыпались
Аноним 10/05/25 Суб 22:55:13 1197849 414
>>1197847
Руди, второй бит... Второй...
Аноним 10/05/25 Суб 22:56:03 1197850 415
>>1197838

Выложи свои настройки, попробую. По тестам немотрон и правда в топах.
Аноним 10/05/25 Суб 22:57:05 1197851 416
>>1197850
Квен 3 тоже топ, на 10 процентов уступает дипсику. Может его лучше?
Аноним 10/05/25 Суб 22:57:26 1197852 417
>>1197847
>чтобы все сидели на мистралях
Сижу на 123b мистрали, на что посоветуешь перейти ?
Я серьезно. Раз уж тут в треде в се пишут, что мистраль говно.
Какие есть варианты. Я неиронично буду пробовать.
Аноним 10/05/25 Суб 22:59:19 1197855 418
>>1197852
Если потянешь пробуй Qwen3-235B-A22B, больше крупных сеток не выходило.
Ну ладно вроде командер был еще, но чет я на его счет в сомнениях
Аноним 10/05/25 Суб 22:59:46 1197858 419
>>1197852
Гемма 3 27В, лол. Я вот даунгрейднулся. Но мне ещё мешает лишь 2 3090, мне на 123В уже слегка за гранью.
Аноним 10/05/25 Суб 23:00:56 1197861 420
>>1197849
Да не рвись ты, хуйлуша.
3м квант 49б модели - катастрофа, лоботомит.
4м квант 22-35б - омномном, выше уж копиум, прироста нет
Аноним 10/05/25 Суб 23:03:37 1197870 421
>>1197861
Да, это буквально доказано. Модель очень тупеет ниже 4 бит. Разница между 4 и 8 бит не такая, как между 3 и 4. У тебя два бита в голове, Руди~
Аноним 10/05/25 Суб 23:06:27 1197877 422
>>1197870
> Разница между 4 и 8 бит не такая, как между 3 и 4.
Ну ты это, не перегибай. Тут скорее
>Разница между 4 и 6 бит не такая, как между 3 и 4.
Аноним 10/05/25 Суб 23:08:38 1197880 423
>>1197855
Мммм... 4 квант больше 70гб, пойду зашью себе жопу заранее, а то порвется.

Спасибо, я слишком нищую для таких весов.
Аноним 10/05/25 Суб 23:09:36 1197883 424
>>1197880
А то мистраль меньше, ога.
Аноним 10/05/25 Суб 23:10:06 1197884 425
>>1197880
Выше речь о сравнивании квантов одной модели, если выбора нету то конечно 3 квант большой модели лучше чем 6-8 меньшей
Аноним 10/05/25 Суб 23:13:29 1197890 426
>>1197880
Да и кстати, там можно большую часть на процессоре оставить. Сколько впихнешь в врам с тем и запускаешь. Можно изъебнуться и увеличить скорость в двое используя перераспределение слоев и запуск на форке llama.cpp специально оптимизированного для мое сеток.
Короче с таким размером скорости будут не такими убогими как на плотной модели в 70 гб
Аноним 10/05/25 Суб 23:16:19 1197896 427
image.png 78Кб, 889x1175
889x1175
Аноним 10/05/25 Суб 23:17:25 1197900 428
image.png 331Кб, 563x1129
563x1129
>>1197850
С промптом ещё не решил как и с семплерами но оно хотя бы работает в отличии от квена3
Темплейты лама 3 намес
Ставишь в промпт
Writing style:
Don't use lists and out-of-character narration.
{char} MUST use narrative format.
Detailed thinking off.
Аноним 10/05/25 Суб 23:17:27 1197901 429
Qwen-235b-Huggi[...].png 89Кб, 956x902
956x902
Qwen-235B-Huggi[...].png 38Кб, 791x622
791x622
Qwen30B-Local-i[...].png 96Кб, 835x962
835x962
Qwen30B-Local-i[...].png 17Кб, 396x329
396x329
MoE qwen3-235b на сайте huggingchat vs MoE qwen3-30b iq1_m локально на LM studio. походу iq1_m квант всё же имеет право на жизнь.
Аноним 10/05/25 Суб 23:17:44 1197902 430
>>1197896
чел, вроде уже выяснили, что жизнь начинается с 235б... --> >>1197657
Аноним 10/05/25 Суб 23:19:16 1197905 431
>>1197901
>qwen3-30b iq1_m
Ты там совсем ебанулся, да? Уважение
Аноним 10/05/25 Суб 23:20:02 1197907 432
>>1197896
>пик
Я где то написал что жизни нет или другие модели говно ?
Или тебя триггерит что кто то пользуется большими моделями ?
Ну вы же тут на говно исходите что мистраль говно, и только один анон посоветовал какую то замену.
Вас хуй поймешь.
Ну критикуете - предлагайте тогда замену.

>>1197890
Да в принципе, спасибо. Неиронично, я думал там будут 90-100гб кванты. Но нет, они схожи с мистралевскими. Уже кочаю.
Аноним 10/05/25 Суб 23:23:12 1197913 433
>>1197902

Конкретно этот мистралешиз на нескольких теслах уже который месяц хуесосит все модели вокруг чтобы когда его спросили - "а что собственно использовать?" - с гордым видом обьявить что он сидит на 123В.
Аноним 10/05/25 Суб 23:23:19 1197914 434
>>1197852
удвою Qwen3-235B-A22B
это единственная сетка, которая смогла корректно ответить на вопрос про баттлнек ддр3 и 25 гигабит/с сетевого адаптера.
Я брал 4 XS квант.

Гемма само собой брала залупу за обе щёки, когда я пытался из неё правильный ответ выбить. Но нет, она тупая пиздец - видит "ddr3" и даже не думая сразу говорит что баттлней в ней.
Тупое говно блять. Ну а чего еще ждать от 27б, с другой стороны. Любители слопа в треде жрут вон и нахваливают.
Аноним 10/05/25 Суб 23:25:00 1197919 435
>>1197907
Хуй поймешь, ты троллишь или серьезно.

Критикуют лоли мистрали, шизы с треда (за редким исключением гигашизов) не имеют железа чтобы запускать милфочку. Поэтому говоря о мистрали - говорят о лольках.

Ну и завидуем, хуле врать то. Я со своими 16 - завидую.
Аноним 10/05/25 Суб 23:25:12 1197921 436
>>1197913
о, мой поклонник, и ты тут? Дежуришь, ждешь меня чтоли?
Хороший пёсик.
Только ты перепутал, он - не я.
Опять ищещь меня в анонах?

Я ищу в толпе глаза её жадно
То ли девочки а то ли виденья...


Теперь любой кто тебе скажет что-то плохое детектится как я, да?
Аноним 10/05/25 Суб 23:25:47 1197923 437
Аноним 10/05/25 Суб 23:27:15 1197929 438
>>1197921

Вспомнишь говно - а вот и оно, как говорится.
Аноним 10/05/25 Суб 23:28:25 1197931 439
>>1197929
Ну так ты меня сам призываешь в тред своими фолс-детектами.
Или детектор настрой или уже перестань на меня обижаться непонятно за что.
А то на обиженных сам знаешь - воду возят и в жопу ебут.
Аноним 10/05/25 Суб 23:33:25 1197941 440
>>1197923
Оппа, а тестики то не плохие. Экий я простофиля. Спасибо.
Буду тыкать и пробовать.
Аноним 10/05/25 Суб 23:33:40 1197942 441
>>1197913
мистралешиз
сноудропшиз
теслашиз
опенротершиз
дипсикшиз
я никого не забыл, анон? или ты еще кого-нибудь изобрести успел?
Аноним 10/05/25 Суб 23:36:37 1197950 442
>>1197914
>удвою Qwen3-235B-A22B
это единственная сетка, которая смогла корректно ответить на вопрос про баттлнек ддр3 и 25 гигабит/с сетевого адаптера. Я брал 4 XS квант.

Буду и квенку и команд-а пробовать. Посмотрю что лучше подойдет. Вроде в квене таки параметров побольше, но команд должен быть побыстрее.

>Гемма само собой брала залупу за обе щёки, когда я пытался из неё правильный ответ выбить.

Эмм... А вот этот пассаж я не понял. Нахуя сравнивать 27b и 235и модели... Это же - тупо.
Аноним 10/05/25 Суб 23:39:59 1197955 443
>>1197950
> Вроде в квене таки параметров побольше, но команд должен быть побыстрее.
Неа, быстрее будет квен раз в 5 где то.
Мое сетки все быстрые, там активных параметров 22b.
Это значит что каждый токен дергаются разные эксперты общей суммой в 22b. А в 4 кванте это 11гб. Там конечно еще всякие издержки, ну считай что скорости все равно будут больше чем у плотной модели того же размера раз в 5.
Аноним 10/05/25 Суб 23:40:01 1197956 444
>советы Qwen3-235B-A22B
Это троллинг такой? Все треды были забиты презрением к мое, и даже какой-то анон писал, что, мол, поюзай дипсик в тексткомплишене, будет экспириенс 30б модели. А сейчас уже внезапно 235б мое стали советовать как замену ларджу, охуеть
Аноним 10/05/25 Суб 23:40:07 1197957 445
>>1197942
То чувство когда тебя называли минимум 3мя из списка.
Аноним 10/05/25 Суб 23:40:56 1197959 446
>>1197956
> Все треды были забиты презрением к мое
То что периодически какие то додики срали этим не значит что это общее мнение всего треда
Аноним 10/05/25 Суб 23:41:42 1197961 447
>>1197950
>Эмм... А вот этот пассаж я не понял. Нахуя сравнивать 27b и 235и модели... Это же - тупо.

Потому что он шизло >>1197913
Видимо с 123В он перелез на 235В, но повадки остались неизменными.
Аноним 10/05/25 Суб 23:42:08 1197963 448
>>1197950
>но команд должен быть побыстрее
он мое или нет? Если не мое - то он будет медленнее 100%.
Потому что квен 235б а22б - мое.
>Нахуя сравнивать 27b и 235и модели
да не сравнивал я... Я просто пошел от мелкой модели к более крупным.
гемма2 27б, гемма3 27б, магнум 123б 4Q, магнум 123б 6Q.
Думал что за хуйня - то ли лыжи не едут, то ли я ебанутый.
и потом я случайно в треде увидел, что анон писал про квен. Попробовал его - и оказалось что он имеет мозги лучше, чем все сетки, которые я пробовал.
Оказалось, что лыжи виноваты.
А потом у меня сгорела видеокарта, а за ней и мой пердак и эксперименты с квеном прекратились потому что модель 117 гб размером, а с одной вышедшей из строя картой я уже не могу её запустить.
Аноним 10/05/25 Суб 23:44:51 1197968 449
image.png 62Кб, 882x866
882x866
Снимок экрана 2[...].png 15Кб, 916x722
916x722
image.png 49Кб, 828x611
828x611
image.png 12Кб, 784x623
784x623
в целом qwen30b-a3 в iq1_m кванте иногда опечатывается и не совсем хорошо следует промпту, но с нормальной скоростью похеру - ткнуть носом в ошибку и перепишет со свистом. рисовалку он написал в режиме /no_think, если использовать /think, то точнее следует промпту (результат на последнем скрине). но один хер надо по ходу действия указывать на его фейлы.
Аноним 10/05/25 Суб 23:48:45 1197976 450
>>1197968
Сравни тогда с 1 квантом квен3 32b что ли, гулять так гулять
Аноним 10/05/25 Суб 23:50:03 1197982 451
ладно это пиздец
прелюдии и ТЕНШОН у немотрончика превосходит вообще всё что я пробовал, главное выбрать развратную карточку и надавать ей по сиськам
Аноним 10/05/25 Суб 23:50:04 1197983 452
>>1197963
>магнум 123б 4Q, магнум 123б 6Q.
Кстати, поробуй бегемота от драммера. Я с него шишку сточил в своё время. Есоли будут нужны семплеры, то маякни.
Магнум какой то ебанутый, он или посреди генерации ломался к хуям начиная дергать рандомные токены или пишет как цидония. И тут упрек не к цидонии, но если берешь жирную модель хочешь увидеть отличия от экипажа гоблинов в третьем пазике.
Или вот это (Да, я фанбой драммера)
https://huggingface.co/mradermacher/Fallen-Command-A-111B-v1.1-GGUF
Увидев что я проебал коман-а, я проебал и это. Так что своего ИМХО не смогу сказать, буду только пробовать.
Аноним 10/05/25 Суб 23:50:19 1197984 453
>>1197956

Ну смотри.
Условная мое 30В загружает видеопамять на 30В - выдаст мозги и знания всего на 14В и скорость как 3В. В то время как плотная модель 30В выдаст мозги, знания и скорость на честные 30В за тот же расход врам.
Аноним 10/05/25 Суб 23:52:49 1197987 454
>>1197984
>выдаст мозги и знания всего на 14В
Ты прав, но там чуть больше, где то на 16-18b если бы такая была. Как по мозгам.
По знаниям там на ровне с 32b думаю, просто она их хуже использует. Потому что у нее слоев едва больше чем у 14b.
Аноним 10/05/25 Суб 23:54:30 1197989 455
Драммер...Говорите
Гемофаги и гемотофаги, смотрите что тут у меня

https://huggingface.co/TheDrummer/Fallen-Gemma3-27B-v1

Pshhh. pshhh кумляндия, запрашиваю личный опыт. Повторяю запрашиваю личный опыт. Кто пробовал ?
Аноним 10/05/25 Суб 23:55:21 1197991 456
Аноним 10/05/25 Суб 23:56:33 1197993 457
>>1197991
Не нравится, не ешь. А я буду жрать всё до чего дотянусь.
Аноним 11/05/25 Вск 00:00:18 1197998 458
>>1197989
Почему то все из геммы пытаются сделать "ДАРК КОМПЛИНТЛИ АНЗЕРЗОРЕД ФАЛЕН ТОР ТЕМНЫЙ ИНТЕРНЕТ АМОРАЛ ДАРКВЕБ БЛЯЯТЬ" версию и все равно получается соевое говно
Аноним 11/05/25 Вск 00:03:28 1198001 459
>>1197998
Вот кстати. Есть у меня карточка где персонаж вроде любит игрока, но у неё специфичные методы. И я вчера сидел и такой : блять, гемма, кровожадная ты пизда, хватит следовать так промту остановись, серьезно.
А во ответ : принесите пилу для костей, я хочу изменить рост своей любви.
Беру свои слова назад начет соевой геммы. DPO дала мне просраться.
Аноним 11/05/25 Вск 00:09:09 1198012 460
>>1197998
>Почему то все из геммы пытаются сделать "ДАРК КОМПЛИНТЛИ АНЗЕРЗОРЕД ФАЛЕН ТОР ТЕМНЫЙ ИНТЕРНЕТ АМОРАЛ ДАРКВЕБ БЛЯЯТЬ"

Это драммер, главного поставщик темных школоивельных шизомиксов, он любую модель пытается сделать таковой. Кроме квена, почему-то он не любит китайцев.
Алсо, гемма просто дегенеративно-радостно соевая, это реально просится поправить.
Аноним 11/05/25 Вск 00:10:46 1198014 461
>>1198012
>он любую модель пытается сделать таковой.
Ну цидонька получилась хорошей же, ну.
Аноним 11/05/25 Вск 00:12:49 1198019 462
>>1197983
>Кстати, поробуй бегемота от драммера.
Спасибо, буду иметь в виду.
Я правда сейчас слегка остыл к локальному куму, мне больше напарник по работе нужен.
Вспоминаю как возвращался к гемме и там ехал смиркс через щивер он май спайн - аж воротит с этой хуйни. Но если захочу нейрокум - попробую обязательно.
Аноним 11/05/25 Вск 00:14:23 1198021 463
как вы смогли выйти из комнаты имея хотя бы 16гб врам?
Аноним 11/05/25 Вск 00:16:02 1198024 464
>>1198021

Я бы и не выходил, если бы не экономическое принуждение к труду, как говорил Маркс.
Аноним 11/05/25 Вск 00:18:12 1198026 465
>>1197621
Разные ответы. Можно погрузиться в спгс или отметить определенные проблемы/особенности каждой модели, но здесь еще многое зависит от промта, карточки и предпочтений юзера.
>>1197653
> Промпт процессинг - 70т/с, что терпимо
Жесть
>>1197657
Ерунда вялая, слишком мало активных параметров. Только как "убийца дипсик дома" для ачивки.
>>1197726
> основой мира любителей мелкомодельного слопа
Починил. Но в целом мистраль-ии как компанию можно похвалить, релизят уже молодцы. Вот бы новый мистральлардж.
Аноним 11/05/25 Вск 00:21:31 1198028 466
>>1198021
>выйти из комнаты
зачем? Я удаленщик наносек например.
Выйти на улицу - значит выйти к пидорахам. Не особо люблю такое конечно, но мусор сам себя не вынесет.
Да и новую квартиру отделывать надо, тут тоже никак удаленно работу не прокнотролируешь и материалы не выберешь.
Вот и все поводы выходить.
>>1198026
>Ерунда вялая
я абсолютно не согласен.
Я своими глазами видел хороший последовательный ход мыслей и отсутствие избыточности тьекста там, где это не нужно. Я очень заинтересован дальше поковырять квен3.
И да, я уверен, что те кто хейтят квен просто используют мелкие модели, а не 235б а22б - самую большую.
Я так и не успел узнать, умеет ли она писать стихи на русском. Именно на этой просьбе у меня сгорела карта.
Аноним 11/05/25 Вск 00:25:09 1198030 467
>>1197653
>Промпт процессинг - 70т/с

Да ты знатный любитель потерпеть, я смотрю...
Аноним 11/05/25 Вск 00:30:36 1198032 468
image.png 59Кб, 356x334
356x334
>>1197976
скорость в 2 раза ниже, нужного результата очень сложно добиться, потрахался с различными настройками и забил. это я еще q2 квант скачал. хз почему так выходит что moe в низком кванте обставляет dense 32b
Аноним 11/05/25 Вск 00:32:57 1198033 469
Аноним 11/05/25 Вск 00:34:57 1198034 470
image.png 128Кб, 1399x1099
1399x1099
Ого, что-то я совсем пропустил появление exl3 квантов и того как мощно они ебут Жору в хвост и гриву, выдавая 3 бит модели с качеством жориных 4 бит.
Да походу реально можно немотрон в нормальном качестве на 24 гб врам использовать.
Аноним 11/05/25 Вск 00:35:19 1198035 471
>>1198032
Какой ваш вердикт, доктор : низкий квант будет жить ? Или легче пристрелить ?
Аноним 11/05/25 Вск 00:35:27 1198036 472
Мне делать видео "вы не поняли немотрон" или что?
Я тут радугой кончаю, кум оказался охуенным, ты не скипаешь 70% слопа а реально читаешь это всё
Аноним 11/05/25 Вск 00:36:34 1198037 473
>>1198035
Тут надо бегать и кричать
ОНО ЖИВОЕ
Это сраный 1 квант, я хз как он его додумался вобще скачать
Аноним 11/05/25 Вск 00:41:11 1198039 474
>>1198036
Я опишу что будет :
>ряяяя только 16 гб (это буду йа)
>Сейчас скачаю, потом : ряяя у меня не работает. Говно. Слоп

Вывод : посиди с ней недельку и когда первый восторг пройдет, ты сможешь написать взвешенное мнение без фанбойства.
Аноним 11/05/25 Вск 00:42:46 1198041 475
image.png 168Кб, 1399x1099
1399x1099
image.png 124Кб, 1399x1099
1399x1099
Пиздец, как же же это дерьмо ебет. Почему я только сейчас про это узнал.
Аноним 11/05/25 Вск 00:44:16 1198044 476
>>1197956
> поюзай дипсик в тексткомплишене, будет экспириенс 30б модели
Ну не совсем 30б, где-то лучше, где-то чуть хуже, но он не выделяется каким-то особым вниманием к деталям, инициативностью, красочным описанием и т.д., чего ожидаешь. Чсх, зирошотом часто работает даже лучше чем с ризонингом, там он проделывает огромный (и местами даже неплохой) анализ, повторяет все инструкции, что-то продумывает, читаешь и думаешь какая умная модель. А потом выдает унылый и банальный ответ если не уровня пигмы, то мелких мистралей, полностью позабыв все раскопанное.
Для него норм всякие сценарии с вводом новых нпсей, накидывание дополнительных инструкций типа старых модулей что были популярны раньше с корпами, там кажется что все это не усложняет работу а наоборот улучшает результат. Но стоит какой-то заморочный/душный рп с разговорами, мотивами, развитием и т.п. - не вытягивает. Персонажи - болванки без глубины, которые выдают тривиальные ответы и фиксируются на чем-то одном. И еще размер чрезмерно большой для такого перфоманса.
> 235б мое стали советовать как замену ларджу
Это же вброс, вообще не близко, ограниченное количество голов не позволит.
>>1197963
> и оказалось что он имеет мозги лучше, чем все сетки, которые я пробовал
Бедолага накрутил промты, семплинг и не мог сформулировать вопрос, когда ему нормальная сетка не могла выдать дефолт, что может ванильный мелкий мистраль. А к большим квеном внезапно удачно рандом лег, вот он и уверовал.
Синдром утенка из палаты мер и весов, в добавление к неспособности анализировать свой опыт и делать трезвую оценку.
>>1198028
> видел хороший последовательный ход мыслей и отсутствие избыточности тьекста там, где это не нужно
Никто не мешает ей иногда перформить хорошо, но стабильно ебать и быть на уровне больших плотных моделей - без шансов. Ну и учитывая от кого эти заявления - впечатления нужно делать на 10.
Аноним 11/05/25 Вск 00:46:42 1198046 477
Аноним 11/05/25 Вск 00:47:48 1198047 478
кстати немотрончик то есть в exl3 авось это уже близко к 4 кванту
Аноним 11/05/25 Вск 00:48:55 1198048 479
>>1198046

Поясни свой вскукарек.
Аноним 11/05/25 Вск 00:50:51 1198049 480
>>1198048
Я петушок. "Вопросы?"
Аноним 11/05/25 Вск 00:51:11 1198050 481
>>1198034
>>1198041
Остуди траханье. То что этот хуй принес циферки, пока мало что значит. Нужно больше тестов, причем всего, не только perplexity. Пусть эта хуйня из беты выйдет, потом можно о ней рассуждать. Но да, выглядит многообещающе
Аноним 11/05/25 Вск 00:51:45 1198051 482
>>1198047

Именно у немотрона 3.0bpw по качеству как IQ4-XS. >>1198034
Аноним 11/05/25 Вск 00:52:48 1198053 483
45501692db6567b[...].webm 4240Кб, 640x360, 00:01:15
640x360
>>1198044
>Бедолага накрутил промты, семплинг и не мог сформулировать вопрос
>Ну и учитывая от кого эти заявления - впечатления нужно делать на 10.
ты, шизло блять, опять на связь выходишь?
Ты понимаешь, что проблема была в том, что все модели ассоциировали ддр3 с устаревшей технологией и поэтому сразу судили что в ней будет баттлнек?
Я роллил ответы квена - он анализировал всё правильно несколько раз подряд.
Аноним 11/05/25 Вск 00:55:35 1198056 484
>>1198050
>То что этот хуй принес циферки, пока мало что значит.

Так он не только циферки, он и модели принес. Прям сейчас качаю немотрона 49В 3.0bpw, буду сравнивать с IQ3-XSS того же размера.
Аноним 11/05/25 Вск 00:57:51 1198058 485
>>1198053
Шизик смеет кого-то оскорблять, вот умора. Скоро и другие карты отрыгнуть если продолжишь в том же духе.
Аноним 11/05/25 Вск 00:59:39 1198059 486
image.png 72Кб, 1255x710
1255x710
image.png 29Кб, 312x584
312x584
image.png 34Кб, 431x569
431x569
>>1198035
ну этот поциент точно может жить: https://huggingface.co/unsloth/Qwen3-30B-A3B-GGUF/blob/main/Qwen3-30B-A3B-UD-IQ1_M.gguf

задачу поиска лиц по папкам с фотографиями и последующей сортировки их по похожести тоже решает. узнал много нового про onnxruntime-gpu и insightface. интересно как себя поведёт 235B модель. к сожалению она у меня не влезет даже в q1 кванте. тут я вижу есть аноны с железом покруче, попробуйте. PS приложил настройки LM studio для 30b
Аноним 11/05/25 Вск 00:59:54 1198060 487
>>1198058
>Скоро и другие карты отрыгнуть
я имею зп больше 400к/мес, а то что карта отъебнула - вероятностное событие случающееся с теми, у кого этих карт много.
Завидуй молча.
Аноним 11/05/25 Вск 01:00:08 1198061 488
>>1197968
Я конечно первый квант не тестил, но на третьем кванте эта хуйня довольно тупая. Сосет у 14b на более высоком кванте, не говоря о том, что по всей видимости 14b~30b и тут просто выбор скорость или память
>moe в низком кванте обставляет dense
По идее должно быть наоборот. МоЕ больше должно хуеть от квантования
Аноним 11/05/25 Вск 01:01:15 1198063 489
Аноним 11/05/25 Вск 01:02:16 1198064 490
>>1198060
>я имею зп больше 400к/мес
А хули не купил ни одной А100 хотя бы?
Аноним 11/05/25 Вск 01:02:25 1198065 491
>>1198059
>задачу поиска лиц по папкам с фотографиями и последующей сортировки их по похожести тоже решает

А как реализовать подобное? Это в лм студио есть такая функция?
Аноним 11/05/25 Вск 01:03:56 1198067 492
>>1198064
копить на квартиру побольше или собственный дом - более приоритетно.
Хотя конечно с текущей инфляцией.... может и неплохая идея переводить фантики в натуральный продукт в виде топовых карт.
Надо будет об этом подумать....
Аноним 11/05/25 Вск 01:08:21 1198068 493
>>1198060
Чел, по твоей речи, чсв, общению и прочему очевидно, что умом ты не блещешь.
> 400к/мес
> наносек
>>1198067
> квартиру побольше или собственный дом
> 400к/мес
Всхрюкнул, решил насмешить один из самых успешных тредов на всей борде.
Аноним 11/05/25 Вск 01:11:05 1198071 494
>>1198068
>>1198067
Так, вы оба - Идите спать. Ваш срач уже опизденел, остыньте, горячие нейронные парни.
вы оба самые успешные, самые лучшие и бла бла бла.
А если не прикратите, я скастую тёмную магию и призову асигодетей.
Аноним 11/05/25 Вск 01:11:08 1198072 495
>>1198068
>решил насмешить один из самых успешных тредов на всей борде.
хм, не буду отрицать, что тут ты прав.
Но держу пари, что шизло которое тут усирается "у тебя семплинг хуемплинг, промт и шаблоны" - нищее чмо которое только гемму запустить и может.
Аноним 11/05/25 Вск 01:12:44 1198074 496
>>1197942
>мистралешиз
Это если что полтреда, если не больше. Спасибо тюнам и тому что 22/24 единственные нормально влезают в 16гб, а также немотрону 12б с русскими тюнами, работающим вообще на любой хуйне
>опенротершиз
>дипсикшиз
Это один и тот же человек. Как минимум раз в неделю приходит рекламировать свое говно
>теслашиз
Еще и его брат драмошиз. Набрали дешманского говна с помойки и запускают большие модели на 0.9 т/c
>я никого не забыл, анон?
Ну как минимум еще есть геммашизы, которые оправдывают эту соевую хуйню при любом раскладе
Аноним 11/05/25 Вск 01:13:50 1198075 497
>>1198074
нужен алтугезер ящитаю...
Аноним 11/05/25 Вск 01:14:00 1198076 498
>>1198071
> А если не прикратите, я скастую тёмную магию и призову асигодетей.
Ну не, смотивируй как-нибудь. Скинь карточку милую - интересную, или что-нибудь еще.
>>1198072
Проебы столь очевидны что тебе пишет много людей, выходит что мантра про "это все один шиз" хорошо дополняет твой образ.
Аноним 11/05/25 Вск 01:16:35 1198079 499
image.png 5Кб, 197x151
197x151
image.png 10Кб, 766x108
766x108
Запустил 3.5 квант с 20к контекста
итс со факинг овер
я больше никогда не выйду из дома
Аноним 11/05/25 Вск 01:16:47 1198080 500
>>1198065
>Это в лм студио есть такая функция?
нет, я попросил qwen написать скрипт на питоне. запускается из командной строки и натравливает gpu на папки с фотками. пока всё ещё сыро, надо будет допилить логику чтобы лучше лица сортировало и gui добавить.

>>1198061
>Я конечно первый квант не тестил, но на третьем кванте эта хуйня довольно тупая.
попробуй модель по ссылке https://huggingface.co/unsloth/Qwen3-30B-A3B-GGUF/blob/main/Qwen3-30B-A3B-UD-IQ1_M.gguf и настройки отсюда >>1198059
Аноним 11/05/25 Вск 01:18:07 1198081 501
>>1198076
>это все один шиз
это и есть геммашиз, единый во многих лицах - очевидно же.
Почему-то чел, советовавший мне бегемота на промты и семплинг не гнал. Этого так же не делал и анон с дипсиком.
Аноним 11/05/25 Вск 01:19:42 1198083 502
>>1198076
>Скинь карточку милую - интересную, или что-нибудь еще.
Вот тебе милая webm из первой серии SukaSuka и карточка яндере изобретательницы в стимпанк сеттинге.
https://mega.nz/file/jBMXyKbZ#G_wydZxlpqeBgfVzpGykDt0_DQP8qTe99SY707y0A8s
А теперь пиздуй отсюда, пока я стражу не позвал.
Аноним 11/05/25 Вск 01:22:05 1198084 503
>>1197989
Так, я короче сам попробовал.
В общем это гемма которая на втором сообщении : давай ебаться, люблю ебаться. А у тебя хуй есть ? А если найду ?
Аноним 11/05/25 Вск 01:23:00 1198086 504
>>1198067
>я имею зп больше 400к/мес
>копить на квартиру побольше или собственный дом
Че ты там копить с этими копейками собрался? Даже если лично для тебя придумают и одобрят беспроцентную ипотеку, то чтобы купить двушку конуру в ДС тебе понадобится отдавать половину из своей зп 12 лет.
Аноним 11/05/25 Вск 01:24:18 1198088 505
>>1198086
толсто, чел.
А еще не по теме треда.
Я уже отгорел своё по поводу цен на недвижку, этим ты меня не забайтишь.
ПЕРЕКАТ Аноним # OP 11/05/25 Вск 01:24:59 1198090 506
Давайте хотя бы в этот раз без срачей? А то придётся просить администрацию катить этот тред раз в 1000 постов, а то блядь скоро кончай тред перегоним а я не успеваю катить потому что слоупок
ПЕРЕКАТ

>>1198085 (OP)

ПЕРЕКАТ

>>1198085 (OP)

ПЕРЕКАТ

>>1198085 (OP)
Аноним 11/05/25 Вск 01:25:18 1198091 507
>>1198083
> Вот тебе милая webm из первой серии SukaSuka и карточка яндере
Довольно урчит и дружески обнимает анончика добра
> пока я стражу не позвал
Но это порождает интерес остаться!
>>1198086
> в ДС
> половину из своей зп 12 лет
Если только на самой-самой южной границе области, формально относящейся к ДС.
Аноним 12/05/25 Пнд 11:16:04 1199343 508
>>1197246
А что у тебя это за штука со счетчиком дней и указанием локаций в сообщениях?
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов