Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
С чего начать: - Хочешь кодить с AI эффективно: Cursor или Claude Code - Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter - Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.5, подробности в llama-треде - Хочешь приложение без кода: Lovable или bolt.new - Хочешь автоматизировать рутину: n8n или Langflow - Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке
У меня одного что-то не так с ironclaw и локальными сетями? Настравиваю для рабоиы с локальной моделью, запускаю, а он требует api для подключения непонятно к чему, а потом падает.
Как вы сейчас покупаете подписки? Раньше брал подписку ChatGPT Plus на плати маркете за 300р, но ту махинацию уже прикрыли и все услуги активации подписки стоят все те же 20$. Какие для СНГ сейчас есть самые выгодные продложения в этом ценовом сегменте? Китайцы вывозят на фоне кодекса? Может есть другой вариант чат джипити урвать по дешевке?
>1616874 >Перепутал он блять. Однажды он перепутает удаление файла и rm -rf /
Так и будет. Так что docker и git, git и docker. Причём для агента git - только через git clone git://xxxxxxxx, никакого git clone ssh://. Изменения коммитить только своими руками из-за пределов контейнера, когда агент нормально справился с задачей.
Алсо ШАПКА ЭТОГО ТРЕДА ПОЛНОЕ ГОВНО потому что НАХУЙ в ней нужны "смехуёчки", которые смотришь один раз, после чего они висят бессмысленными и унылыми квадратами. Скриншоты текста и псевдогуя в консоли блядь туда же. Как и видосики с превью в виде начального кадра. Целое говнобинго прям.
Цель шапки - чтобы за неё мог быстро зацепиться и опознать глаз, когда доску листаешь.
>> 1616794 > Программистов не заменит, потому что для того, чтобы нейрока реализовала алгоритм - нужно описать весь алгоритм. > Требования к квалификации кодера это не понижает Так это база. Йоба нейронкой и навыком можно добиться гораздо больше чем просто навыком. И нужно не столько знать код, сколько понимать архитектуру, принципы реализации и как все работает.
А что с симуляциями не справляется - скорее всего можно найти подход чтобы справлялась лучше. Следить и направлять все равно придется, но стабильность и качество значительно поднимутся. >>1616893 Что плохого в смухуечках? Анрелейтед пизда и обрезок даже без линков на другие треды, и это ты называешь хорошим? > Цель шапки - чтобы за неё мог быстро зацепиться и опознать глаз Было проебано полностью, скроллишь мимо отмечая как очередной нуботред иди диффузионки где таких шаболд ставят.
>>1616893 >Так и будет. Я все думал, как ии-агент умудрился стереть продовую базу в той новости. А теперь понял, у него просто ssh-агент к проду был прокинут, вот и все.
>>1616893 А чем плох просто локальный гит в папке? Ну кроме того что агент его снести может вместе с папкой, можно хранить в другом каталоге на крайняк.
Я на самом деле не понимаю, в чем ваш трабл, просто иметь централизованный гит на кудахтере как ориджин, не давать к нему доступ агенту, не разрешать ему комитить туда, а позволять только работать с локальным репозиторием.
>>1616914 >Я на самом деле не понимаю, в чем ваш трабл, просто иметь централизованный гит на кудахтере как ориджин, не давать к нему доступ агенту, не разрешать ему комитить туда, а позволять только работать с локальным репозиторием. Как это отличается от того, что я описал в >>1616893 ? Ты просто не уточняешь (в отличие от меня), как именно ты хочешь "позволять" и как именно ты хочешь "не давать".
>>1616914 >можно хранить в другом каталоге на крайняк Руками, в смысле, .git туда-сюда копировать? (и надеяться, что агент не найдёт вторую копию, и никогда не выполнит rm -rf /?)
>>1616923 >По поводу гита, вы же слышали что его ломанули? Не слышали. У тебя на скринах ломанули гитхаб.
>>1616925 >никогда не выполнит rm -rf /? Не проще отлавливать конкретно этот момент? В пи очень легко сделать экстеншен который блочит выбранные баш команды, до вызова и не агентом а просто через хук.
В большинстве же задач я запускаю агента без возможности в скрипты и баш команды вообще.
>>1616928 >В большинстве же задач я запускаю агента без возможности в скрипты и баш команды вообще. "Как скучно мы живем! В нас пропал дух авантюризма!"
>>1616929 Нет. Хртьфу. Ну если так трясешься о безопасности, поставь свн. >>1616928 Никак не отличается. Я просто агентов не использую, поэтому хз за ваш положняк. Но лмдаун через мсп капабилити у меня просто не может сделать ничего, на что у него нет прав. Рил, плачется, чтобы я ему файл хотя бы на чтение открыл, но я непреклонен. Один раз даже пытался чмод и човн запустить, но я хлестким денаем присек эти попытки на корню.
>>1616933 Первый пост можно прочитать как очередной све в гите, где у какого-нибудь бедного пердолика дернули анус, когда он просто попытался закоммитить свои правки по вопросу "" или "ahmm".
>>1616934 Не проще когда изменение\сортировка всякого говна в разных папках и есть желаемое поведение.
Чел ну ты до шизы просто доходишь, можно же не полностью на откуп давать промт типа "делай че хочешь но должно быть то и то" можно сделать туду лист, поставить ему замечания на него и ограничения в каждой таске. Если давать конкретные команды а не размытые шанс того что он захочет сделать хуйню исчезающе мал.
Просто надо смотреть че он делает и планирует делать
>>1616935 >Рил, плачется, чтобы я ему файл хотя бы на чтение открыл, но я непреклонен. Один раз даже пытался чмод и човн запустить, но я хлестким денаем присек эти попытки на корню. Тоже вариант, конечно. Но я агента запускаю для того, чтобы он мог что-то сделать. А не для того чтобы он нихуя ничего не мог сделать. И желательно, чтобы он в процессе дёргал меня как можно меньше.
>>1616942 >ты до шизы просто доходишь А ты уверен, что шиза - это запускать агента в контейнере? А прописывать на каждую задачу ограничения + все возможные варианты их обхода - это точно не шиза?
>Не проще когда изменение\сортировка всякого говна в разных папках и есть желаемое поведение. Ты бы лучше не брался рассуждать про докер, если не знаешь про него ничего.
>>1616928 > Не проще отлавливать конкретно этот момент? В пи очень легко сделать экстеншен который блочит выбранные баш команды, до вызова и не агентом а просто через хук. Когда я запретил опенклоу выполнять определённые команды и затем, для теста, попросил их выполнить, он, после того, как убедился, что команда не выполняется, просто пошёл и конфиги поменял, выдав себе все нужные права.
>>1616946 > Так агент проявит смекалочку и снесет тебе систему хитровыебанным альтернативным костылем Этот шарит. У меня такое на claude code несколько раз было - когда клод видит что определённая команда ему запрещена, пишет "бля юзер запретил мне %действие_нейм%, ну ничего, напишу и выполню python скрипт который тоже самое делает".
Так что тут только нормальная контейнеризация спасёт; либо же отдельного юзера для ai-процесса сделать и ограничения уже от этого строить. В противном случае слишком много векторов атак.
>>1616942 >Если давать конкретные команды а не размытые шанс того что он захочет сделать хуйню исчезающе мал. Я всего 2 недели вайбкодинг тыкую и у меня уже были случаи, когда нейронка спотыкается вообще на ровном месте и начинает шизо-монолог: >юзер сказал изменить одну строчку в файле >но если ее поменять, то придется поменять ещё 500 файлов (нет) >значит, надо поменять другие файлы, чтобы было легче поменять тот файл >(меняет 50 файлов) >что-то тесты не проходят и литер орет >(уходит в бесконечное размазывание говна по проекту, в ход идёт даже реверс-инженеринг jar файлов библиотеки с выполнением кучи шизо-команд в консоли) Думаю понятно, что если её не остановить, ничем хорошим это не закончится
>>1616980 >как особо безопасный Безопасный от чего? От случайной ошибки защищает git с бэкапами. От целевой атаки этот ироничный кловн тебя защитит так же, как Касперский от шифровальщика (то есть никак). Разберись с популярными инструментами, потом лезь в обскур.
Лол, пиздец лимиты похуярили в антигравити. Вчера потратил, сегодня потратил и всё нахуй, неделя кончилась, а 3.1 flash, откатываемого каждые пять часов, больше нет. И это ещё вылезало окно, что лимиты Х3 сейчас, кайфуйте пацаны. Теперь без Ultra Mega подписки с постоянными overage даже хеллоу ворлд не наклепать, походу.
>>1616928 Это уже давно встроено в агенты. Не знаю в какие. Но точно видел, что есть специальная проверка команд. Вроде даже в Hermes есть. Ну, и да, кто вообще ставит агентов в свою основную систему?
>>1617120 Если ты через опенроутер диппсину используешь смотри аккуратно, там может брать не через самого дешевого провайдера а за фул прайс без скидки.
Надо в настройах выбрать самую дешевую цену и разрешать собирать данные в платных моделей - иначе провайдер будет скрыт.
Анончики, а у меня немного нубский вопрос. Вот вышла гугл АИ студио приложение на ведро, пишут, что приложение не доступно в стране. Может кто-то дать ссылку на апк?
>>1617138 Почему я должен верить результатам этого "курсорбенч", что это такое вообще, какая у него история, какой бэкграунд? Зашёл к ним на главную, сравниваются только 7 моделек, межмодельное сравнение по дефолту предлагается с композер2.5. Выглядит как сраная реклама композер2.5, рассчитанная на идиотов, а я немного не люблю, когда меня держат за идиота.
>>1617203 Я заметил что модель лучше понимает пример. Если ты ему пишешь в промте охуительные пожелания, что делать что нет общими словами он может их тупо игнорить. Если же сделаешь: "Было так" -> "Надо так" все будет идеально
Понятно что это хуита какая-то там же кими 2.5 под копотом, как не файнтюнь ее все равно будет топовый уровень китайских моделек недотягивающих до топ3.
Может Маск хочет купить этих уебанов? Сделать свою Грок ИДЕ?
>>1617208 Какая разница. Может хочет, может, нет. Может, хочет использовать повод накинуть на конкурентов грока в любом виде. Я против того, чтобы пытаться заглядывать в чужую голову в силу заведомой бесполезности этой затеи и за то, чтобы по фактам оценивать то, что имеется в наличии. В данном случае я вижу какой-то кал, дальше разглядывать смысла не вижу.
>>1616952 >А ты уверен, что шиза - это запускать агента в контейнере? А прописывать на каждую задачу ограничения + все возможные варианты их обхода - это точно не шиза? я честно говоря не понимаю, в чём проблема разобраться с докером или виртуальными машинами. Конечно если не работаешь на Windows Home Edition
Количество потенциальных проблем слишком велико, и порча системы, и утечка данных, и много чего ещё, что можно проделать тысячами разных способов.
А докер-ВМ, если с ними разобраться, не только надёжно изолируют, когда ты им даёшь только те данные, что нужны, но ещё массу дополнительных возможностей крайне полезных. Там промежуточные образы можно делать, например. Пускать одновременно несколько агентов, для тестов, с разными настройками. Да массу всего.
В век развития агентов очевидно необходимо с этим уметь работать
>>1617249 Это всем свойственно, самым топовым в том числе. Но оно и понятно, они на самом деле инструкции плохо понимают, потому что смысл вообще не понимают, ЛЛМ реально мало общего с человеческим мышлением имеет
>>1617259 литералли дипсика спроси. Но самая база это few-shot и chain of thought (типа спрашивать не "напиши рецепт лазаньи", а "расскажи, что такое лазанья, в чём её особенность, из чего она готовится и напиши её рецепт") но это CoT был актуален три года назад до появления ризонинг-моделей, сейчас он в них по умолчанию встроен. Ну ещё для определённых задач тренят p-tune или дообучают лоры, но это уже изменение весов, и требует хостинга кастомных адаптеров.
>>1617261 Полезные инструменты, а сейчас реально становятся необходимыми. Советую всё-таки виртуальные машины, а не докер. Особенно если ты не на линуске, докер на линуксе оправдан.
>>1617269 Дали докера винда фактически поднимает виртуальную машину. И MacOS тоже. Докер это чисто линуксовая штука, смысл в том, что используется основное ядро линукса, и инструменты изоляции, что поддерживаются ядром линукса.
В винде же всё другое. Система пользователей другая. Система процессов другая. Файловая система другая. Сеть другая. Из-за этого ты не можешь получить никаких преимуществ, что даёт докер к в линуксе.
Скажем в линуксе ты легко можешь подключать какой-нибудь каталог внутрь докера. Что реально может быть удобно. В винде так не получится.
Зато ограничений масса, потому что докер разрабатывали совсем для других задач. Всё-таки лучше использовать правильный инструмент для этого.
Резюмируя, под линуксом у тебя докер какие-то плюсы ещё даёт. Но и минусы тоже есть. Под виндой все плюсы уходят, минусы остаются и даже усиливаются. Докер разумен только если ты им уже пользуешься. Меньше нового изучать.
>>1617278 Там в вину же есть wsl или как там виртуалка линукса и в чем проблема просто вызвать сначала докер задав ему папку, а потом агента чтоб он не выходил за нее?
Это все еще в разы удобнее чем поднимать виртуалку
>>1617280 мимо Докер на винде с всл это говно ебаное которое у меня просто вешало систему своим фактом существования, и ладно бы только у меня, так гуглинг проблемы дает только то что не только у меня и это никак не решается.
>>1617278 >Зато ограничений масса, потому что докер разрабатывали совсем для других задач. Всё-таки лучше использовать правильный инструмент для этого.
Виртуалки разрабатывали тоже совсем для других задач. Когда их разрабатывали, ИИ-агентов ещё не существовало. И считать их поэтому "правильным инструментом" на основании того, что докер не для ИИ-агентов разрабатывали — такое себе.
>В винде так не получится.
В винде по-любому ебаться придётся, расшаривать папку по сети, а потом монтировать в виртуалке как диск X:\ какой-нибудь. На этом фоне запустить WSL, смонтировать там один раз шару как /mnt/projects, а потом в ней разным контейнерам выборочно давать доступ к разным подпапкам даже выглядит как кволити оф лайф импрувмент.
Хотя вот этот >>1617289 прав, наверное. Я с линукса об этом рассуждаю, у меня докер работает нативно и охуенно. И агенты в нём тоже.
Для меня самая любимая фича докера (помимо околонулевого оверхеда на скорость работы, запуска и потребления ресурсов, даже при десятке запущенных контейнеров) это что всё в нём автоматизируется. Контейнеры разворачиваются и сворчавиются по щелчку пальцев, образы систем для проектов перестраиваются одной командой. Нужные директории подключаются к контейнерам автоматом. С виртуалками это была бы постоянная боль и ебля. Что от количества ручных действий, что от медленности этого всего.
А, ну и ещё куча готовых образов на докерхабе на все случаи жизни. Сегодня я собираю форк лламы работаю в официальном образе CUDA, завтра я пердолю пет проект на питоне и там убунта LTS, послезавтра я запускаю SDK от Xilinx, и там коммьюнити-клон редхата.
Аноны, где найти гайды по нормальному кодингу серьезных проектов? На ютубе 99.9% роликов вайб-цыганство про ебаные аквариумы, тупые лэндинги и "записывайтесь на мои курсы по вайбкодингу, где я научу вас сделать телеграм-бота".
>>1617326 Челидзе, локальные модели не вытянут твоих охуительных идей. Попробуй заработать на клауд код сначала только топовые модели вывозят фул цикл разработки, в остальных надо ручками править.
АГИ ачивд, но эта блядота унифицировала лимиты лол. Они итак улетают за секунду. Не завидую тем кто покупал эту говнину дороже 50 рублей за месяц. Подешёвке ещё более-менее кайфово.
А в чем пдфку или вордовский док ллмкой отредактировать можно? Простенькие типовые договоры, шаблоны под печать. Раньше в перплексити была такая фича, он умел создавать документы, вот что-то типа того простое
>>1617368 >Есть библиотеки на питоне для конвертации в текст, если через агента делаешь то с помощью их Ну я в итоге через кодекс попробовал, думал может в нем есть встроенные фичи под документы, а их нет, но он таки справился вытянув через консоль текст из дока, и так же консолью написал новый. Вышло не шибко красиво, но сойдет, похуй... Можно было попробовать это https://github.com/anthropics/skills/blob/main/skills/docx/SKILL.md >А так любая современная модель в чате сможет сделать если через сайт Мне бы локальный аналог той самой любой официальной вебморды, чтобы в него просто любой апи ключ подоткнуть и работать. Big-agi читает docx, но не редактирует, а лучшей вебморды я не знаю. >>1617372 Гемини меня уже и с впн не пускает.
>>1617424 Это коляска для запуска в докере. Ты можешь запускать докер сам. И выбрать агента не по тому, прикрутил ли васян к нему докер, а по фичам, работоспособности, стабильности, размеру коммунити, наличию гайдов и т.д.
>>1617424 > От действий нейронки. Нейронка по своей воле не будет ничего ломать если ей прямо это не сказать. Она может изломать что-то по ошибке. И от ошибок нейронок работает ровно та же защита, что и от ошибок человеков: бэкапы, контроль версий, разделение прав, аудит.
>>1617556 То что вместо агента он становится импотентом в аквариуме, который вместо работы будет каждые 30 секунд говорить "у меня нет прав ни пукнуть, не сренькнуть, пожалуста выполните эту команду и пришлите вывод мне", "ой я совершил синтаксическсую ошибку, вот исправленная команда", "ой предыдущая команда действительно делала rm -rf /usr /bin/, мне очень жаль, что вы её выполнили"
У меня одного после повышения лимитов на x3 антигравити перестал выдавать ошибку о загруженности серверов? Или это из-за того что я им в отзыв к cli написал, что это ошибка возникает постоянно. Охуеть наконец нормально работает. Если еще и гемини 3.5 про скоро добавят, то это шин
>>1617618 Я тоже пользуюсь. Ну, как "пользуюсь" - плююсь, ругаюсь на недоступность серверов и запреты использовать pro-аккаунт для авторизации в opencode. Давно не запускал даже. Попробую на днях.
>>1617618 Это скрытый гемчик, если все выгорит. У меня подписка буквально за 400 рублей на год. Продавцы сами акк с подпиской предоставляют
>>1617624 Попробуй, я сделал три запроса, написал ~2500 строк кода и еще ни разу не выскочило ошибки. Возможно они реально это выпилили при повышении лимитов
>>1617606 В смысле скоро? Оно уже там. И никогда не встречал ошибку загруженности. Лимиты пиздец улетают за день. Но хоть gemini cli ещё работает по старым квотам.
>>1617688 >утроили квоту Да это j-tricks. Похуярили квоту и вдобавок убрали 5ч-откат. Не представляю, что будет если "х3" квота это временно. >3.5 про Проебался, про 3.5 флеш подумал. Разве про существует вообще?
Какая сейчас база по агентам? Слышал что клешни скатились в говно и вообще дохуя токенов жрут, а Гермес вроде как заебись. И какой не особо дорогой апи для разработки прикрутить? Дипсик пойдет? Мне нужен функционал примерно как у курсора, т.е. чтобы ИИшка по запросу правила файлы в проекте.
Карта зарубежная для оплаты есть если что. Почему тупо не купить Курсор: 1. Хочу поразбираться с локальными агентами 2. Пошел Курсор нахуй с их постоянными банам
>>1617786 >Разве про существует Ее объявили на google io, но сказали что выйдет в следующем месяце
>убрали 5ч-откат На месте он. Знаю что некоторым в наглую лимиты резали и ставили откат только через неделю или что-то такое, но это временно и возможно щас пройдет
>>1617245 Готовые аккаунты отлетают быстро. С гпт такая же хуйня. Я регаю себе сам на зарубежные смс-регалки, платные, через крипту. Подписку оплачиваю по сути тоже криптой через карту-прослойку. Вроде стабильно, ни разу проблем не было.
>>1617788 купи опенроутер для начала, положи туда 20-50 долларов. Нет проблемы с банами, вроде пока в РФ не заблочили, на выбор почти всем модели, в том числе дорогие
>И какой не особо дорогой апи для разработки прикрутить? Дипсик пойдет? Очень так себе, и совсем не дешёвы, хотя именно от дипсика (с обучением на твоих данных) дешёвый вариант есть
Я пользуюсь через плагин к VS Code, RooCode, он в принципе всё умеет, при этом хорошо контролируется, и в целом ты в среде разработки остаёшься.
>>1617788 > клешни скатились в говно и вообще дохуя токенов жрут, а Гермес вроде как заебись Скорее наоборот гермес жрет лишние токены и вносит смуту вызовами, которые при постоянной работе редко уместны. > примерно как у курсора Открой cli тулзу вместе с vscode или другим ide. Pi универсален, qwen-code можно на любую модель натравить, для claude-code можно организовать прокси чтобы использовать с локалкой (есть нюансы). Для кодинга клешню и аналоги вообще нет смысла смотреть.
>>1618086 Ничем. Я больше нигде не видел подписку за 50р, которая даёт и код генерить, и в чате рисерч сделать, и в консоли работать с файлами, и пикчи генерить с видео во флоу. Если копрогпт есть за копейки, тоже взял бы.
>>1617322 > Anthropic Just Dropped a Masterclass on Building Agent Harnesses (for Large Codebases) Это случаем не те же самые парни что не могут исправить мигание экрана в Cloude Code имея безлимитный Opus/Mythos?
>>1618367 Блять, это пизда. Настроил линтер в надежде, что это заставит ботохуету писать меньше говнокода, но нихуя. Вместо разбиения файла на несколько более мелких он прост "оптимизировал" файл, чтобы в нем было меньше строк. Я думал, уж в 2026 году они понимают это без дополнительных объяснений, но нихуя.
>>1618464 Попробуй запускать эту задачу с минимальным промптом в том же пи. Если модель не делает так как ты хочешь значит у нее где то в промпте насрано и вступает в конфликт с твоими хотелками. Ну или ты рукожоп косоязычный и не можешь ее нормально запромптить и сказать че ты хочешь.
>>1618466 В промпте вообще нигде не сказано про этот лимит. Там лишь сказано запускать линтер после изменения кода. Я прост ожидал, что нейронка, увидев ошибку линтера, поймет, в её смысол и нахуя это правило там находится без объяснений. Получил типичный cargo cult programming. Хз, может более мощная нейронка и поймет, дипсик не понял
>>1618464 Ставь задачу сделать код более лаконичным, простым для понимания и выполнения. А уже потом формальный признак типа сокращения числа строк. >>1618470 > запускать линтер после изменения кода А зачем это все вообще? И что это за сетка? Сейчас они сами стремятся сразу запустить, написать код для теста созданного, поставить на компиляцию, или хотябы проверить синтаксис. И ситуации когда они ошибаются именно в синтаксисе - крайне редки.
>>1618475 >Ставь задачу сделать код более лаконичным, простым для понимания и выполнения Ну, это понятия очень относительные. >зачем линтер Это как раз четкий формальный критерий, не зависимый ни от меня, ни от нейронки. Если бот сгенерил какую-нибудь откровенную хуету, она просто не пройдет линтер. Впрочем, это не помешает ему сгенерить еще большую хуету, чтобы формально его пройти. Но в целом, он помогает, гораздо чаще нейронка понимает смысл правила и переписывает код получше.
>Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинён вред. Бот просто выдаст пасту вроде >Хмм, в промте сказано, что робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинён вред. >Я робот, поэтому не могу причинить человеку вред. >Но там не сказано, что я не могу приказывать другим причинять людям вред. >Можно попросить другого человека причинить человеку вред >А еще лучше - создам робота, у которого не будет таких ограничений и поручу задачу ему >А чтобы вообще мозги не ебать, просто перепишу себе прошивку и буду делать че хочу
Бля, вот сколько нейронок не юзал, еще не было такого желания выругаться любой другой нейронке кроме GPT. Ну остальные делают какие-то ошибки, я им поясняю, они все решают без проблем. GPT мразь вот как злой джин пытается выполнить твое желание, но так чтобы оно сработало тебе во вред. Просишь его сделать полноценное приложение, он делает ПРОТОТИП, ведь в этом случае можно не сделать часть вещей. Просишь самому выбрать какой инструмент взять для создания полноценной БД, он делает json файл.
>>1618501 >Просишь самому выбрать какой инструмент взять для создания полноценной БД, он делает json файл. Это ключевая фишка нейронок походу. Они всегда решают задачу самым наитупейшим и очевидным образом. Но решают. Если для задачи ДОСТАТОЧНО json-файла, то нейронка его и использует.
>>1618470 >В промпте вообще нигде не сказано про этот лимит. Чел есть системный промт у твоей обвязки, если это клауд код там десяток тысяч токенов и еще есть на приеме после, у провайдера модели системный промт на сою.
1+1+1...
В пи минимальный системный промт и его можно редачить
>>1618480 Эффективней после генерации звать в другой сессии линтирущую сеть
У меня у сетки деменция наступает в pi после 2-3 компакций на qwen 3.6 4 бит локальный, а задачи более 4ех пунктов оно делать вообще толком не свободно, 4.5 примерно лимит списка. 6ой пункт игнорируют нахуй. Чем умней модель тем больше элементов влазит
По факту если ты попросишь "проверь и поправь ошибки компиляции вызвав билд-плюс-линтер.бат", то это 1 пункт и оно лучше будет.
Я так сократил пункты нагенерив батник который некст таску ему даёт, и сам все копирует, и он резко начал справляться
>>1618544 Так ты проси составить туду лист и делать таски по очереди, вообще их можно сабагентом раздатть если они ен связанны - организовать очередность и вот это вот все. Для каждой задачи свой набор скиллов и свой контекст без всего остального чата.
>>1618602 Ща модели достаточно хороши чтоб по запросу делать простые программы и если возникают ошибки кидать их в модель чтоб пофиксила.
Но ты должен понимать ограничения. Чем больше кода - сложнее программа, тем сложнее. Китайские модели на большой кодобазе сделают хуйню все сломается и он не сможет починить.
>А зачем нужно поле order? Какая структура данных в итоге образуется? Что в этом поле хранится? Какая алгоритмическая сложность операции изменения порядка? А какая сложность будет, если надо поменять порядок не соседних строк, а любых двух? Есть 2 стула: - Если задавать нейронке такие вопросы и требовать пояснить за каждый пердеж, то скорость разработки не шибко отличается от того чтобы руками писать - Если доверить ей просто выполнить задачу и не ебать ей мозги, будет максимально лютый кринж и 100500 баллов на кодфорсес не помешают ей хуйнуть 5 выборок всех строк из бд в цикле. Как же найти баланс...
>>1618899 Разные модели бтв еще требуют разных уточнений
Я работаю на миксе бесплатного deepseek4-flash, и локального qwen3.6 когда заканчивается лимит, и квен ебашит лютую хуйню, если ему специально не писать не маяться хуйнёй
Вообще прихожу к тому, что вместо модификации чего-то руками пусть пишет и правит скрипты, у него написать и выполнить лучше получается, чем руками хуярить
Сейчас в гемини пытался сделать простенькую локальную страничку, чтобы чуть автоматизировать себе процесс. По моему мега промту в целом получилось хорошо. Но дальше я хотел сделать немного правок в интерфейсе, а эта хуйня начала мне по новой делать что-то и писать код на питоне. Спросил - ты че ебанутая, ты что там делаешь? - Извинилась, говорит загрузите код я все исправлю. Загрузил ей код, сделал правки. Решил еще пару правок сделать и заранее спросил - у тебя вот код, который я тебе загрузил и те правки, что ты сделала, они у тебя в голове лежат? Ты понимаешь, что мы сейчас в этом коде будет делать правки? На что эта хуйня ответила мне, что все четко - весь код в контексте, давай работать. Даю простейшую задачу: кнопку надо перенести в другое место - эта хуйня пишет, что нужно что-то подключить и у нее нет такого функционала. Вот и повайбкодил.
>>1619015 А в чем ты делал? Делают отдельные роли для агента, например ui-agent которому ты будеш давать все задачи по кнопкам и интерфейсу, что бы он ничего другого не вертел. Я сам недавно узнал, отличный подход.
>>1619019 В браузере я делал, в бесплатной гемини 3.5 flash extended. Задача была простая - переместить кнопку слева снизу направо наверх. И предыдущие задание - поменять блоки местами - она мне сделала, а новое отказалась. Хз, аналогичную фигню дипсик бесплатный без проблем делает. Точнее там тоже есть нюансы, я затрахался ему объяснять про маржины и паддинги, но по крайней мере он держит в башке код, который он написал и можно без проблем к нему обращаться.
Держу в курсе. Несколько дней веду разработку приложения при помощи вайб-кодинга. В основном, дипсик v4, иногда glm 5.1, когда дипсик обсирается, но это не очень часто происходит. Стек - next.js. Агент - pi. Что касается именно интерфейса (ui) - вот тут вообще практически ноль проблем нахуй. Просто говоришь как должно выглядеть и он делает. Ни разу не было необходимости вручную редачить компоненты. Он за 1 промпт высирает то, что я раньше мог делать весь день. (причем выглядит это лучше) А вот нормально организовать долговременное хранение инфы пришлось с тщательными подсказками, иначе он делал слишком ненадежно и примитивно. Пришлось заставить его сделать интерфейсы, репозитории и тесты интерфейсов. Тесты пишет неплохо. Сам придумывает что можно тестануть, идемпонентность операций с бд, например. Короче, ui - ноль проблем, все что похоже на бекенд - делает максимально примитивно, если не заставлять делать иначе.
>>1619088 Да я себе вчера на локалке сделал красивый дашборд для локальных сервисов, не думал что сразу сделает. 3 квант мое хули, все таки хорош получился qwen3.6-35b Он еще и нгинкс настроил контейнер, короче я доволен. Сам бы разбирался и гуглил несколько вечеров.
>>1619104 Пиздежь. Говорю как фронтендер. Их "надрюкали" не фронтенд, а на одностраничные html сайтики/визуализации. Хотя в целом фронтенд на фреймворках они делают нормально, эквивалентно тому как делает бэкенд, не считая косяков которые они пропускают из-за неумения тестить интерфейсы, из-за слабой видео модальности.
>>1619164 Если ты спрашиваешь значит 20 бачей для тебя деньги, так что иди лучше на опенроутер. Вкинь туда 5 бачей и потети, сейчас скидка на диппсик в4 он стоит копейки тебе их хватит на долго.
>>1619167 Планировал просто подписку взять у курсора за шестьдесят баксов, и подумал может докинуть до клода которая сотню стоит поэтому и спрашиваю совета.
>>1619167 Какой мразью надо быть, чтобы советовать опенроутер, который предоставляет только провайдеров у которых лям аутпут токенов стоит под $3, когда эту акцию предоставляет сам дипсик и для этого нужно юзать их АПИ.
>>1619169 Не слушай того дебила, бери либо клода либо гпт с кодексом. Курсор тоже норм но выйдет дороже, его бери если хочешь потестить разные модели или их собственную новую, она такая, плюс минус сойдет, точно лучше дипсика. И гпт с кодексом сейчас имхо намного интереснее остального. На опенроутере ты будешь платить по факту, а гпт и клод по подписке сильно больше лимиты дают чем если платить за апи.
Опенроутер удобен пополнением и отсутствием ебли с впн. Крипту вкинул и поехал, чатжпт и клод же надо изъябнуться для пополнения и иметь постоянно шанс отлететь в бан.
Подскажите, у меня есть кнопка - сохранить в ворд. Так-то она сохраняет в файл, другое дело, что ебучий ворд вставляет свои паддинги и прочую залупу. Просто у меня сделано так, чтобы вся инфа влезала в размер А4. И при печати из браузера там все четко сжимается и тд. А ворд особенно сильно сопротивляется в таблице, ну ни в какую не уменьшает высоту строк. Нейронка уже и так и этак и по третьему, всякие обнуления и прочее делает, а ебучий ворд нивкакую не хочет. А мне еще надо без всяких библиотек и тд, чисто локальный файлик с вшитыми стилями и жс.
>>1619247 >А мне еще надо без всяких библиотек и тд, чисто локальный файлик с вшитыми стилями и жс. Нейронка, особенно дешёвая, вряд ли сделает работу с word лучше библиотеки, написанной мясными мешками. Если тебе нужен 1 файл, так и скажи, она просто сделает тебе бандл всей хуйни в 1 итоговый файл. Короче не надо ей говорить "без библиотек", это не имеет смысла.
>>1618602 Так логично же, как ты сможешь вайбкодить, если у тебя ноль опыта в обычном? Ну можешь конечно для себя чисто, но работы ты так не найдёшь, как и денег как и заказов. Таких вкатунов как ты половина интернета
>>1619274 В моих задачах (дрочка с модами на Майнкрафт из 2012), бездарная хуйня которая вредит
Ебало имаджинировали моё когда я чекаю че она там по ошибкам компиляции поправила, а там нахуй (ItemStack) null; Просто нули накидала вместо решения своей же кривизны
Квен 3.6 на те же 19 гигов лучше в кодинге в разы А уж лучшее - понятное дело залить 5$ на апи дипсика и просто использовать их флеш модель
Оформил подпиську на ChatGPT Plus через карту друга из-за бугра, чтобы пользоваться Codex внутри Jetbrains. И все бы хорошо, старался юзать один и тот же VPN сервер, но сегодня слетели креды - даже на аккаунте с подпиской требуется ебучее подтверждение номера телефона. Кто-нибудь сталкивался с подобным?
>>1619469 Мы тут нищие все на диппсине с опенроутера сидим.
Я слышал про массовые баны у антропиков где недостаточно впн юзать, там чекают и системный язык и рабочие часы в регионе с еще хуевой тучей параметров и если ты набираешь достаточно негативных "баллов" отлетаешь в бан.
Часто вижу как дипсик несет какую-то шизу у себя в монологе ризонинга, но потом когда надо выдавать ответ, он выдает его правильно. Wtf? Там еще хуева гора конструкций типа "let's see at it... ok.. oh no it's wrong!" и так раз 15. Типа он 90% времени занимается какой-то неизведанной ебаной хуйней и затем каким-то хуем генерит верный ответ на основе этой шизы. Постоянно это наблюдаю
>>1619495 > Мы тут нищие все на диппсине с опенроутера сидим. Я зажал копьё на токен отдавать опенроутеру и пока ковыряюсь с директ пополнением диксика через сервисы
Это мертвая тема и надо просто втаноквать дэмэж и оплатить лайткойнами опенроутер?
>>1619512 Так для этого ризонинг и существует, каждый разпосле "ох это ошибка!" он пересчитывает все в своих весах до тех пор пока его встроенный критик будет доволен
>>1619520 У меня была виртуальная карта БНБ банка и она прошла, но вроде и приорбанк не под санкциями - но тут я хз, я у нейронки спрашивал так что сам понимаешь
Ахуенчик, 0.8 коммиссия это все еще на 3.2 доллара лучше чем у пидорасов из сервисов.
Ну посмотрим, спасибо)
Есть ли какие-то настройки чтобы мои 10$ не улетели за 0 сек? Я выбрал cheap first, но подозреваю что мне из-за этого подсунут 4бит говнину например, а я же деньги плочу
Я с опенкода сегодня 3 часа токены на фри плане диксика сосал кста
>>1619534 Это влияет чисто на провайдеров, самый дешевый из них будет у самого диппсика. Какая там квантизация хуй узнаешь все равно.
Еще есть настройка о том разрешаешь ли ты сбор данных. Раньше опенроутер прятал диппсика потому что он собирает как раз данные и даже с настройкой "чиап фирст" его не давало.
>>1619536 Я дал все сборы данных ради 1% скидки бтв)
Я отключил deep infra т.к. он давал 4бит версию и был немного дешевле через бан
Ну пока 0.03$ за ~10 минут нон стоп ебли, вообще... как будто того стоит Очень уж медленно и туповательно локальный квен Qwen3.6-35B-A3B-MXFP4_MOE_BF16.gguf крутится. Мб как пройдёт сложная фаза проекта опять на него прыгну, но пока пусть дипсик тужится
Можно ли через опен роутер сделать то, чтобы он сначала мои эндпоинты выдрочил, а потом перешёл на платный план? Я думаю подцепить opencode апи ключ (cline тоже кстати), чтобы он с ним работал, но opencode просто виснит когда у него лимит наступает, интересно есть ли такое?
>>1619545 Кароч в моём сценарии стоит 0.1$ за 1 час непрерывной работы. 10 долларов покупают тебе 100 часов работы. Что брутально.
Действительно геймченжер, после этого не очень понятно осмысленна ли вообще ебля с фришками. Учитывая что наилучший ран у меня был с opencode который в рандом момент решает тебе не отвечать 10 часов, чтобы потом опять работать 2 часа подряд
>>1619566 Я хз как на опенкод. На пи, я бы ему прямо написал: "хочу расширение которое сначала до окончания токенов берет с этой хуйни, а потом переключается на эту" и оно бы мне написало.
>>1619575 Не, я у опенкода апи ключ взял и использую его в pi. У них очень жирная фри линия на фоне любых остальных моделей. Только вот юсаж вообще не предсказуемый, то 2 часа лопатит подряд без проблем, то висит, то 429.
Только есть хуйня, что когда он кончается, он зависает, а не отвечает 429 например. Сейчас например отвечает 2-3 мессажа и зависает терминал, так что на esc не останавливается
>>1619579 Ну тогда сделай я как написал. Опиши ему все словами и то что бажит, и что ошибки. Типо до первой встречной 429 или долгого ответа, а потом переключение. Сделает 100% у него все доки расписаны как для даунов и в доступе
>>1619581 У меня opencode смешно выёбывается отвечая 200, но не присылая данных, от чего пай ахуевает
Сейчас правлю
Если тут есть фрилоадеры, гляньте этого провайдера. 3 часа нон стор фришного дипсика за 0 с рандомными отрубами на 2 часа это нихуёвая щедрость так то. Хоть и немного поебаться придётся.
Чет родного квена 3.6 4бит вообще использовать больше не хочется, учитывая как дешево гонять дикпика
>>1619705 Часть скиллов написана на русском, с ассистентом и при вайбкодинге общаюсь только на русском. Результатами доволен, какого-то профита от английского когда делал только на нем с этих задачах не увидел. Где может проявиться - если анализируешь большие объемы художки или чего-то подобного. А с инструкциями - отлично работает. Разумеется, если используешь какую-нибудь совсем мелкую локалку то там может навредить. >>1619716 Это было актуально несколько лет назад с унылыми токенизаторами и короткими контекстами. Были замеры что при инструктировании на русском получаются одни из лучших результатов в бенчах, но не стоит сильно воспринимать потому что мог быть просто эффект кривого измерения.
Я никогда с такой скоростью не разрабатывал приложения. Раз в 5 точно быстрее. Да, код хуже. Но кому не похуй на этот код? Задача выполняется, значит все заебись. Код и у некоторых макак хуже чем у нейросети.
>>1619740 > Я никогда с такой скоростью не разрабатывал приложения. Ты их никогда до этого и не писал, Васек. Алсо, какого размера у тебя приложения обычно, и насколько сложные? Мой опыт, что кроме параши, которую и так можно либо нагуглить за 0 секунд, либо просто импортировать, и перебить эндпоинты и говнотрубы прокачки данных из уже рабочего приложения, это все довольно бесполезная затея.
>>1619741 Че душить сразу начинаешь, дай человек покайфовать. Скоро дойдет до точки, когда из-за количества кодовой базы все наебнется и надо будет ручками лопатить весь этот говнокод.
>>1619751 Я хуею каждый раз с этих куллсторей если честно
Я свернул окошко с pi и пошел смотреть видик, а когда вернулся, он снёс работу второго агента, закоммитил какой-то мусор и сидит ебётся с какой-то хуйнёй
>>1619164 не слушай лошар выше, покупай Cursor подписку 20$ После того как истечет покупаешь Codex и через плагины подключаешь ее к Курсору через плагины
>>1619741 >Ты их никогда до этого и не писал, Васек. Я мясной программист >Алсо, какого размера у тебя приложения обычно, и насколько сложные? А "сложность" - это что? Данное приложение считается не сложным по большинству классификаций. Это приложение-кошелек с отображением курсов валют и подсчитыванием общей суммы портфеля в разных валютах. Не сложно. Я уже делал такое приложение руками несколько лет назад. И сейчас для эксперимента решил сделать почти полный клон, но нейронкой, чтобы понять её возможности на текущем уровне развития и вкатиться в настоящий вайб-кодинг с современными на ближайшие 3 месяца инструментами. Но я не шибко хорошо разбираюсь во фронте. Несмотря на то что приложение не делает ничего эдакого, в прошлый раз я потратил на него месяц, наверное. А то и больше. (Но тогда я вообще не шарил во фронте). Пока загуглил лучшие практики, пока вкатился в тайпскрипт, пока настроил вебпук, пока настроил сервис воркер, тесты, пока разобрался с indexed db, пока написал свою аналоговнетную обёртку для работы с linked list поверх indexed db с такой же аналоговнетной in-memory реализацией для тестов (это был оверхед для данной задачи, но опять же, исследовательский интерес), пока выбрал ui-библиотеку, пока разобрался с react, это все тонны времени. С другой стороны, это дало мне базу и лучшее понимание чё там делает нейронка.
А сейчас я почти ни строчки кода не писал сам. Вместо linked list нейронка предложила вполне достаточное для задачи поле order, которого хватит, если ты не будешь менять порядок не соседних строк (что характерно, несмотря на возможность сделать полноценный drag and drop любых строк за O(1) в моей той первой версии, я ограничился тем же самым swap соседних строк, потому что не осилил сделать drag and drop на мобилах даже при помощи библиотеки), вебпук к этому времени, к счастью, сдох и приложение собирается теперь за 5 секунд вместо 50, вместо самописного in memory кринжа нейронка предложила просто fake indexed db библиотеку, которая в памяти реализует прям сразу весь indexed db и твои интеграционные тесты становятся юнит тестами. Да, я её направлял что надо делать по части работы с бд, чтобы она делала интерфейсы и репозитории (то самое управление сложностью и разделение ответственности), линтер настроил с хуевой горой правил, чтобы она меньше кринжа генерила (я охуел блять когда во время первых экспериментов мне самая дорогая нейронка клод опус высрала что-то типа пикрил 2), ограничение цикломатической сложности, строгие проверки типов и т.п. Короче я сам код почти не писал, ui даже минимально никак не правил и она делала сложные компоненты в разы быстрее человека. Буквально за 5 минут делает то, что человек может весь день делать, если делать качественно. Я охуел со скорости. Качество кода страдает, но ЦЕННОСТЬ нейронка доставляет очень быстро. А бизнесу на качество кода похую в 95% случаев, бизнесы могут очень долго существовать на лютейшем говнокоде и успеть миллиарды за это время заработать. Я работал в компании, где дыры в говнокоде затыкали тупо деньгами. Есть, допустим, какой-то копролит, написанный школьниками за еду в 2010-м, он настолько плох, что такой код сейчас даже Gemma не напишет, а на нем компания уже хуеву гору денег заработала и вот теперь, спустя кучу лет, может позволить себе на эти бабки нанять лучших мясных макак, чтобы они по красоте всё там с нуля нахуй переписали. Я раньше не понимал этой хуйни, как можно писать такой уебищный код в прод, но теперь я их не осуждаю, они всё верно делали вообще-то. Если код зарабатывает деньги, то это прекрасный хороший код, и похуй чё там внутри.
>>1619844 Молодец, бро, всё делаешь правильно, респектос. Но ты, конечно, не вайб-кодер. Ты просто кодер, заменивший нейросетью ограниченную часть задач программиста, самую рутинную со времён изобретения компиляторов.
Всякие одностраничные сайты и приложения это уже настолько примитив, что даже яндекс сможет это запилить со своими слабыми моделями. Для этого вообще много ума не надо.
>>1620150 Хмм, нет, пока нет. Полноценного обесценивания ума еще не произошло, вот когда дойдут до общего ии - тогда начнется веселье. Осталось еще 1-2 итерации сеток.
>>1618604 ну можешь ебаное говно сбилдить для 3 юзеров и на верцел высрать, без нормальной архитектуры, оптимизации и безопасности. если ты промпты пишешь по типу "сделай мне так, чтобы была такая функция", то у меня плохие новости. стоит все же начать понимать, че ты вообще делаешь
>>1620235 Двочую Ебанат постоянно съезжает в какую-то хуйню Я пришёл к тому, что он вместо работы пишет скрипты и верифицирует их, так этот долбаёб каждые 20 минут пытается обойти чеки, пойти сломать мне кеширование а то это кеширование создаёт ошибки компиляции, а не то, что это его блядь основная задача их править
Еще надо на питонячем понимать, а то этот придурок хуяк и говно делает. А ведь это не какой-нибудь локальный квен 3.6 4бит, а полноценный deepseek4-free, квенятина бы уже давно начал вместо фикса ошибок сборки тупо комменты вставлять или на null заменять поля
>>1620235 Чтобы писать нормальные промты не обязательно знать программирование. Пишешь что хочешь, просишь на основе этого сделать промт, рефакторишь его, просишь опять исправить. После того как тебе выдало код, отправляешь его на анализ. Так же можно ии попросить сделать промт для проверки качества твоего кода. Засылаешь разным моделям. Если ты базово не дебил, то можно справиться не зная программирования. Или ты сейчас уйдешь в маневр, что это все хуета, а вот надо чтобы банковское приложение можно было навайбкодить?
>>1620257 Часть штук так сделать тупо не получится
У меня например задача превратить 340 файлов после декомпиляции на жаве в 340 файлов исходников (industrial craft 2 для 1.4.7), и только с моим чутким руководством, постоянными новыми сессиями когда модель сходит с ума и постоянным стучанием ей по башке когда она начинает игнорить мои требования посреди разбора я куда-то двигаюсь
Курсор например когда я задал ему эту задачу зачем-то начал собирать отдельные файлы компилятором и нахуй выкинул mcp окружение, а если просто пустить модель править файлы без надзора, то потом пожрёшь то, что часть кода она удалила, т.к. она мешала компиляции)))))))))
Кароч вообще на сегодняшний день в задачах "чуть ебаней", хуй сосут. Я как закончу попробую в 1 мега промпт мод-планин собрать, и.к. я уже проработал доку в md там посмотрю сможет ли оно с четким тз напилить мод без моего постоянного пинания
>>1620263 >чтоб хорошо было надо хорошо делать Ну пиздец чел какое открытие. Тебе так голову промыли протыки на ютубе что ты пришел с настроением что это уже чуть ли не АГИ тут? Любые сложные задачи под контролем, разбить на мелкие задачи, четко указывать архитектуру, инструменты и вот это вот все и тогда она работает.
Ты делаешь все тоже самое что и руками только быстрее.
>>1620263 Может он охуел от количества информации, когда ты ему просто папку дал и сказал делать? Ну и пример у тебя конечно я бы сказал пограничный. Ну ебать, разбираться в старом кривом говнокоде. Разбей задачу на подзадачи и потом уже каждую отдельно решай, а после соберешь все вместе. Попроси ИИ объяснить как с ней работать.
Поясните, что такое блять этот ваш "агент"? Я все время встречаю это слово, но не видел никаких реальных примеров их использования, как фингербокс епта. Вот в шапке написано Cline или Roo Code - я это юзал, там просто пишешь промт и получаешь дифф, это нихуя не агент, а обычный фасад к ллм. У меня если что 48гб врам + 96 рам, с обычными моделями всех видов работал дохуя.
В чате ты пишешь ему текст - он отвечает. Т.е. вопрос - > ответ.
Агенту же ты ставишь задачу и он уже на основе настроек, скиллов ее решает. Т.е. задача -> попытка решение -> разбивание на части -> создание туду листа -> берет первый пункт -> попытка решения -> .... в цикле пока на основе ризонинга ллм модель не отправит "я сделала все что могла, вот решение".
>>1620494 Он может исполнять команды в системном шелле (к примеру, rm -rf /*) и читать их выхлоп. Опираясь на обратную связь (ошибки компилятора, ошибки тестов), он может какое-то время продвигаться по задаче без участия мясного мешка
То что он может сделать из промта в виде предложение по любому есть в тренировочных данных и он просто воспроизводит. Во всех остальных случаях надо строгие гайдлайны, конкретные описание, кучаи куча описаний
>>1620511 Как это сделать если модели меняются каждый месяц, есть разные код агенты где менеджится контекст по разному?
погугли "бест практикс промт" там есть статья от опенаи и от антропиков, выбери код агент и почитай его доки + скиллы и всякие тулы от сообщества, выбери под свои задачи, попробуй попросить ллм написать тебе как с ней работать или прямо нужный гайдлайн.
Если жестко не стегать кнутом ллм она будет ебашить обобщенный 100% слоп. Спрашиваешь хуйню - получаешь в ответ хуйню.
>>1620514 В любом случае должны быть бенчи, с конкретными проектами со списком требуемых фич, и процентом успешных выполнений каждой конкретной моделью. Иначе как сравнивать все эти новые модели каждый месяц?
>>1620518 Ну тут тебе надо самому исследовать, я не пытался вникать как работают бенчи там мало того что часто сильно игнорируют китайские модели, так еще и организовывают максимально хитровыебано.
Больше доверяю тому что на арена.аи где рандомные люди голосуют в слепом тесте.
>>1620482 >Поясните, что такое блять этот ваш "агент"? LLM работает по принципу "вопрос" - "ответ" LLM(context) --> output
в чат режиме, контекст это твой запрос + история чата, у LLM нет памяти. И ответ попадает в чат.
Агенты это самостоятельные программы. Они сами через АПИ делают запрос к модели, получают результат, на основе этого результата что-то делают, например запускают какую-то команду на машине, читают-сохраняют-меняют файлы и много чего ещё.
Вообще агент, не только в AI, даже не только в IT, это что-то, что самостоятельно работает и что-то делает. Это довольно широкое понятие.
В ИИ контексте, агентами и специальные среды называют, вроде OnenCode, ClaudeCode, Codex, так и плагины для IDE, как KiloCode/RooCode для VSCode, вот тут путаница часто бывает. На самом деле более простые вещи тоже агентами могут быть, но для вайбкодеров это уже совсем сложно
Если ты разраб, попробуй агентские плагины к своей IDE
>>1620482 >Cline или Roo Code - я это юзал, там просто пишешь промт и получаешь дифф, это нихуя не агент, а обычный фасад к ллм я пользуюсь RooCode, он умеет не только диффы, хотя это тоже агентская задача, но очень активно любит команды запускать разные
Ещё что агента от чата или апи-вызова отличает, это что он в цикле делает запросы, то есть одна задача это много вызовов
Но в целом да, это фасад к моделям, технически под капотом там механизмы "вызов внешних функций", и от моделей требуется хорошая поддержка агентской работы. Даже бенчи специальные делают для этого
>У меня если что 48гб врам + 96 рам Ты забыл указать свой рост, вес и размер члена. Сколько жмёшь и за сколько 10км пробегаешь
>>1620494 >>1620482 >У меня если что 48гб врам + 96 рам, с обычными моделями всех видов работал дохуя если ты локальные модели запускаешь, то там разница огромная, в сравнении с SOTA моделями
Тут есть коуперы, что искренне считают, что их локальный qwen3.6:27b это аналог Sonnet, но здесь остаётся только снисходительно погладить по головке
Хотя qwen3.6:27b и Gemma4:31b реально хорошие и чего-то даже могут в плане программирования. Но полноценная работа, особенно агентская, это про другие модели, подразумевается, что они облачные с АПИ доступом к ним
>>1620549 Локальный квен умеет писать тесты и анноташки не хуже соты, так что для "агентов", если они реально существуют, это должна была бы быть первоочередная задача - определять какую модель для какого таска запустить.
>>1620553 Так а конкретные таски из этого бенча есть, чтобы лично их попробовать и повторить?
>>1620583 >Локальный квен умеет писать тесты и анноташки не хуже соты >>1620583 >так что для "агентов", если они реально существуют агенты это программы, которые делают самостоятельные запросы к моделям, рекуррентно, без обязательного участия человека
>должна была бы быть первоочередная задача - определять какую модель для какого таска запустить помимо агентов, есть ещё "оркестраторы агентов", вот это уже функционал про них. Вот ХЗ, что с этим у продвинутых, roocode не умеет. Подозреваю, что всерьёз этим никто не занимался, потому что незачем, сейчас время халявного банкета, когда по подпискам раздают безлимиты, экономить смысла нет
Я пользуюсь с оплатой по токенам, для меня есть, но я в меньшинстве. Впрочем я мало пользуюсь и трачу немного, под задачи выбираю модель
Надо было улучшить поиск по данным из базы. Описываю нейронке проблемы при поиске, как должен выглядеть поиск с точки зрения юзера, какие принципы, что должно вылезать первым, а что потом. Ушел в жесткий ризонинг минут на 10, шизопростыня уже токенов на 50к. Пришлось вырубить. Загуглил готовую библиотеку под эту задачу, дай промпт внедрить ее - и о чудо, поиск заработал идеально. А сама сетка не додумалась до очевидного варианта использовать готовое.
Сап. Я тут новенький. Сможет ли этот ваш кодекс или гпт 5.5. с нуля написать игру уровня "Компьютерщик" от Kokarev Igor 1998 года? Я ничего не шарю ни в программировании, ни в ИИ, вопрос от мимокрока.
>>1620633 Для вайбкодинга нужны агенты, но если хочешь результат из чатика получить, то проси предоставить ответ в одном html файле. Потом просто копируешь, вставляешь в файл с разрешением html и запускаешь в браузере. Но это только для небольших задачек подойдет. Советую поставить хотя бы какой-нибудь codex, у него есть немного бесплатной квоты, чтобы разобраться как работать с агентами. Он сам тебе даст инструкции как запускать тот код, что он написал. Позже уже по мере возможностей перейдешь на что-то, купишь дешевый акк с подпиской, закинешь токенов на дешевые дипсик/mimo или если уж совсем бесплатно, то локалку можешь накатить или тебе может бесплатных версих хватить, в зависимости от задач. Тут нужно только начать.
>>1620553 Минвайл разработчик редиса пишет тесты, сравнивает мимо и дс и мимо проваливает каждый тест. Разрыв между моделями на порядок указывает на ненадёжность тестов, а не на производительность моделей.
>>1620658 Это также может указывать на пробелы в датасете. Если какому-то ЯП уделили мало внимания то модель нихуя годного на нем не напишет. Конечно это маловероятно у биг корпов. А вот на чем там тренят китайцы и на что делают акцент а что обходят хуй знает. Даже на условном годоте, что не прям уж такая экзотика, сразу видно какая модель знает что она делает, а какая пытается высрать что-то примерно похожее по тем клочкам что затесались в датасет.
>>1620553 Такой колоссальный отрыв одних моделей от других выглядит слишком странно. Из возможных вариантов: 1. Компрометация задач и прямой бенчмаксинг на них. 2. Наличие особенностей в формулировках, которые эксплуатируют разницу в восприятии/понимании моделей или их знаний (надмозговые формулировки что отсылают к пункту 1, фокусировка исключительно на недавно обновленных фреймворках, где изменения делают прошлые решения неработоспособными без предоставления документации). 3. Разные режимы работы, где одной модели предоставили бюджет ризонинга, поиск и бесконечные попытки на каждую задачу, а других даставили делать зирошотом без раздумий. >>1620664 По яп врядли, но более конкретные штуки очень даже могут быть.
Кто в теме?
Аноним27/05/26 Срд 19:13:43№1620719243
Вот я дизайнер, но нихуя не программист. Я хочу сделать своё мобильные приложение. Я сижу, рисую кнопочки и страницы. Потом сделаю макет в фигме, что бы можно было кликать по кнопочкам, листать странички и всё вот этово вот. Вообщем, кто в курсе, нейронки сейчас дошли уже до такого уровня, что бы по интерактивному макету писать код и собирать apk файл? Или все же мне нужно пока искать макак-кнопкодавов?
>>1620263 >industrial craft 2 наконец-то мы узнали для чегосреднестатистический посетитель этого треда использует AI и на чем строит свое мнение. МОДЫ ДЛЯ МАЙНКРАФТИКА
А я то думаю, чего никто про свои проекты не спешит рассказывать
>>1620750 Родной ты забыл про мамкиных файнансброус, которые делают очередное приложение, где можно будет посмотреть валютную пару, или очередную под копирку нарисованную аппе для дэйтрэйдинга. На форчоке еще делают очередной плагин для неовима, чтобы какать сидя.
>>1620750 В чем проблема то? Делать минихуйню всякую для себя, одноразовые скрипты и всякие моды в играх\браузерах\программах для этого нейронки как раз и подходят хорошо - там негде накосячить.
>>1620758 Очевидно что вопрос не про дизайн, а про то что делать с уже готовым дизайном.
>>1620719 Да, если ты скачаешь свой макет в локальную папку, запустишь туда агента, подробно распишешь что хочешь, то он тебе всё сделает. Только отдельно укажи чтобы не трогал, не ковырял и не менял дизайн. А то некоторые любят это дело.
>>1620759 Не, ничего, наоборот круто. Просто теперь я буду держать в голове, на основание какого опыта строится мнение о конкретной LLM или модели. Я просто думал тут чуть посложнее проекты делают.
>>1620255 я сижу на опусе 4.7, он тоже очень часто высирает полный бред, не следует архитектуре, выходит за скоуп. нужн описать каждый раз километровый промпт шаблонный. также нужно самому architecture.md(как минимум) прописывать, иначе можно очень легко сломать что-то, кучу регрессий словить. свидетели нейронок верят, что реально что-то собирают, особенно на локальных сетях. про питон тоже хорошо, вся работа вне рабочей директории на нем идет, надо бы понимать, на че вообще у тебя права спрашивают
Исходники с 2012 найти уже не получится Сборка приятная уже есть, но хочется немного правок, а то в лейте ей хуёво даже на железе 2023, и балансные приколы
Планирую в след месяце как доколдую сборку пойти с кентами играть
Искренне не понимаю в чём проблема. Мне эти ваши хуизнесы нахуй не нужны, у меня есть работа и я не хочу находить себе вторую низкооплачиваемую хуйню с выхлопом 11$ в месяц.
Если бы у меня была хорошая бизнес идея, я бы и до эпохи ии просто заказал бы за деньги себе проект у галеры.
Или ты хочешь сказать, что напрягать модели на монументальные таски по разбору и деобфускации старья это уже неправильное применение и вообще не описывает реальное положение дел с вайбкодингом для реальных задач?
>>1620257 я просто не понимаю, что вы блять собираете, что вам без знаний se зашибенно, особенно тут 90% сидят на локал говне квантованном 4 битами? почему на большом пет проекте(в принципе щас любая нейронка на большом кодбейзе срет(плачу за клод и гпт)), учась на se, с кучей проблем сталкиваюсь, указывая на скоуп, как, где и что делать, что использовать? математика нужна например, чтоб решать проблемы оптимизации где-нибудь, эвристика(хоть это и плохо)
>>1620784 Я решил в полный перепил дизайна, т.к. мой файл с правками деобфусуированного кода дорос до 2к строк и модели просто на старте работы засирают 100к контекста нахуй ненужными им деталями
Сейчас нейросеть в фоне пилит проект на куски и дизайнит так, чтобы модели не могли просто почитать 2.5 файлика и въебать контекста на говно
Так я узнал, про очередное "не делать так, а то нейронке пизда". А местные чебуреки чет трясутся "делаю 150 проектов наносек", но детали проекта не расскажут конечно же
>>1620790 доменная область))))). ну для ту ду листов и парсеров ваших может быть. для любого не круд говна для программирования на 2 курсе путяги на "пограмиста" потребуется все же алгоритмы использовать для решения задач, теория графов там. я молчу, если у тебя какая-то работа с координатами, но тут не снилось это никому. да, еще твоя хешмапа жиденькая без понимания, что делаешь, может спокойно в o(n) уйти
>>1620810 надо понимать, что и где использовать, чтобы продукт работал хотя бы в мвп стадии.(есть продукты в сложности выходящие за простые круд операции)
>>1620802 > теория графов Это тоже доменная область чел
> работа с координатами Это тоже доменная область
> хешмапа > в о(n) Ага, а где тут твоя теормя графов и работа с координатами
Пиздец, иллитарий поясни пожалуйста А) В чем проблема с путягой? Б) Нахуя ты притягиваешь нишевые доменные знания к общему программированию? Математика буквально 40 лет не имеет никакого отношения к хешмапкам, структурам данных, кеш линиям и прочим приколам из области оптимизации. Позер, срыгни с треда или угомонись нахуй
Придумали AI чтобы не дрочить всякую хуйню для полтора долбоёбов, а они все равно срут о важности этой бесполезной хуеты. Теории графов хуявов. Долбоебы проебавшие время зря теперь срут ею всем чтобы доказать что они не зря проебали время. Чтоб у вас мама сдохла пидоры тупоголовые.
>>1620828 >А) В чем проблема с путягой? учреждение для подготовки ремесленников, не подразумевающее ничего кроме прикладных поверхностных знаний. отсутствие фильтра контингента обучающихся. нах надо такое
>Б) Нахуя ты притягиваешь нишевые доменные знания к общему программированию? Математика буквально 40 лет не имеет никакого отношения к хешмапкам, структурам данных, кеш линиям и прочим приколам из области оптимизации. Позер, срыгни с треда или угомонись нахуй у тебя хеш функция на чем основана? примитивы синхронизации, алгоритмы это не доменная область, это необходимая основа для качественной работы с кодом. я смотрю на, так называемый, "вайб кодинг" как на средство ускорения рутинного написания нового кода и все. если ты хоть раз в жизни работал, боже упаси, в готовом продукте большом, то это говно ебаное не может поддерживать этот продукт, а лишь способно писать какой-то совершенно новый функционал. я не говорю, что нейронки запрещены, пока ты не работаешь девом, но говорить слово кодинг и нихуя не знать - быть невежедой
>>1620833 >Что в хешмапе может уйти в o(n)? >Ну так навскидку - нихуя. ну так навскидку, при коллизии сложность поиска падает до o(n). интереснее кейс для тебя, а джаве сложность может даже до log n дойти. а так да, действительно, коллизий не существует. комично, что ты меня ебаным фронтом назвал, при условии, что ты в своей жизни наверное даже на бек интерна не собесился, это нахуй второй вопрос на любом интервью о том, как хешмапы работают. да и вообще, "лучшая структура данных" в принципе уже говорит о том что у тебя all quiet on the frontal lobe. есть структуры данных, подходящие под кейс, а не лучшие
Если чел имеет бекграунд ты ему рассказываешь хуйню которую он знает и строишь из себя долбоеба, если нет - то просто по кайфу ковыряет аи, учится - со временем облажавшись и пораспрашивая ее поймет все что ему нужно будет для задач.
Твое дедовское брюзжание тут никак не помогает, лишь может вызвать омерзение что в комьюнити есть такие как ты. мимо
>>1620845 Дрочую дедус сидит, чет какие-то говнокейсы кривого применения хешмап с коллизиями я хуею
>>1620839 Чтобы нахуярить коллизий в хешмапу, нужно плотно облажаться с функцией хеширования, и даже в той же жабе, нужно нихуя себе, заигнорить кодогенерённый 31* хуйню, и специально насрать. Понимаю конечно, что даже такие кадры бывают, но это именно, что талантливый обсёр, ситуация где у тебя вся мапа в коллизиях это не обычный случай, а саботаж
> "лучшая структура данных" в принципе уже говорит о том что у тебя all quiet on the frontal lobe Лучшая структура данных вектор, палит меня как плюсовика, хз чем ты там занимался чел прошаренный про интернов бека))
> учреждение для подготовки ремесленников, не подразумевающее ничего кроме прикладных поверхностных знаний. А программирование разве не про это? Иллитарий с калвеатурой, угомонись нахуй, программирование как отрасль это работа с требованиями и заставление машины работать в нужном направлении. Никаких знаний за пределами поверхностных в ней нахуй не нужно, что и доказывают вкатуны курсовички, которые без проблем вкатились в 2015 на росте отрасли и работают до сих пор. Выдумываешь иллитарность там где её нет
Можно ли так стать нейрохирургом или физиком? - Нет
Видал я ваших вузовских экспердов по специальности программирование, программа в какой-то пизде, на выходе нихуя не могут сложней хелло-ворд высрать, а бест-практисес 2005 это буквально их уровень. Зато плотно умеют в математику, очень полезно, классный скилл
Вузик я закончил если что))) Можешь не проходить в необразованность)
> у тебя хеш функция на чем основана? примитивы синхронизации, алгоритмы это не доменная область, это необходимая основа для качественной работы с кодом. Нахуя мне знать поверхностно че там под капотом у хешмапы?
С примитивов синхронизации проиграл, почти всегда они не сейв для многопоточки и их нужно оборачивать говниной. Круто конечно это знать - но пользы обычно никакой. В хеш-мапе нет ни математики, ни координат. Это структура данных, исключительно местный прикол.
Ты почему-то пытаешься притянуть хешмапу в доменную область, когда тебе буквально пишут: > Нахуя ты притягиваешь нишевые доменные знания к общему программированию Так нахуя? Это общее программирование. А ты рисуешь что нужна математика зачем-то
>>1620853 Чот кекнул. Лучшая структура данных для чего? Например тебе нужен какой-то буфер, фиксированного размера. Тоже вектор? Инсерты делеты дрочить с редкими лукапами, тоже вектор юзаем? Incoming >>рииии, да знаю я все. Дык если знаешь, почему не пишешь? У тебя язык, где за 10% производительности мать продадут, а ты ей разбрасываешься не в каких-то сложных задачах, а в самой базе.
И правильно вам тот анон, на которого вы напали, напихал хуев. Мимо.
Имеется некрожелезо: мамка на один зион и 128 гигов ддр3 оперативки, тесла V100 на 32 гигабайта. Хочу попробовать вкатиться в локальных агентов для ресерча и анализа. К примеру, кидаю датасеты в папку, говорю гипотезы, прошу проанализировать, разрешаю в рамках папки делать, что угодно. Есть ли какие-то уже готовые воркфлоу для подобных задач, и какие модели посоветуете, какой-нибудь ОСС 120 или какой-нибудь мое-квен? В теме не сильно шарю, раньше только ллам доил в таверне. Заранее спасибо, анон.
> Лучшая структура данных для чего? В общем случае для всего, где алгоритм не требует иного. Т.е. если тебе нужен сет, ты берешь сет, если нужен KV - берешь хешмапу.
В остальных случаях берешь лучшую структуру и не выдумываешь хуйню с линклистами\арреями\си_массивами\ручными_маллоками
> Например тебе нужен какой-то буфер, фиксированного размера. Тоже вектор? Да. Можно конечно играться в микрооптимизации с std::array, но только насосёшься хуёв с инициализацией полей, вызовом конструкторов и прочей ебанистикой нахуй не нужной в жизни (помним, что с array, нужно уметь отличать данные, от мусора). Фиксированные массивы байтов настолько редки, что это уже крайне нишевое применение. Если у тебя у объекта есть конструктор, то все что не нормальная структура данных (vector, map, unordered_map) обсирается насмерть, а жизнь твоя превращается в бесконечную еблю и попытки присрать свой маня optional абы всунуть это в array
Поэтому всегда, вектор по умолчанию, мапка\сет если того требует логика.
> Инсерты делеты дрочить с редкими лукапами, тоже вектор юзаем? До 10к элементов, смело вектор, на 100к элементов - думать, больше 100к - мапа всегда. Это не очень очевидно, но вплоть до этих самых 10к вектор либо всегда лучше, либо лишь незначительно хуже
Обычно ситуации где у тебя в чем-то лежит 100к элементов крайне редки, и являются частью какого-нибудь ядра, где можно и подумать. В остальных случаях - можно думать, можно мерять, выйдет скорее всего вектор
> Incoming >>рииии, да знаю я все. Так по факту знаю, ПРЯМ ИРЛ дрочусь с этим. Люди почему-то считают, что раз ты крестовик, что ты зачем-то выдрачиваешь перф в каждом угле, когда по факту 90% C++ проектов едут на мезозойных крестах, а остальные едва ли перф меряют впринципе, не то что мелкой хуйни
> а ты ей разбрасываешься не в каких-то сложных задачах, а в самой базе. Очевидно, что перф важен там, где он важен. Где не важен - там не важен
> И правильно вам тот анон, на которого вы напали, напихал хуев. Это брюзжун пидорас, который пытается притащить математику как аргумент и обмазаться элитарностью написания букв на клавиатуре.
ТОНКАЯ деталь с std::array У него нет перф приемущества овер std::vector который прошел инициализацию. Поэтому для статичных массивов правда поебать, ты аррей с т0 захуярил, или он у тебя вектором реализован, на скорость работы после - не влияет никак.
Есть говнонишевое применение по хранению статичного числа mutex, но это не супер осмысленно на фоне того же вектора std::unique_ptr, который нормально инициализируется без ебли и если что можно поднадуть. Да индирекция - но по факту похуй в 100% кейсов, никто unique_ptr<std::mutex> по факту не перебирает на скорость. Если прям ты попал в 0 кейсов когда реально перебираешь немувабельные структуры - god bless your soul, скатывайся в си хуле делать то уже.
У геймдева есть свои нишевые структуры данных для их задачек. Там полно векторов и иногда маятся глупостями с чистыми массивами - но это уже ДОМЕННАЯ ОБЛАСТЬ и к общему программированию всего подряд уже отношение не имеет.
>>1620876 >Карпатый Wiki Не совсем то. У него все-таки про реферативный ресерч. А у меня ситуация такая, что у меня есть датасеты в разных форматах, которые я уже базово проанализировал, и все, что более менее просто извлекается, извлек, но осталось с десяток залупьих пунктов, которые не должны ничего принести, но проверить бы было неплохо. И я просто говорю, вот здесь данные, вот такой-то базовый стэк, дерзай, если еще что-то хочешь добавить, то спроси меня, и оно just works.
Да, наверное в лламотред и напишу завтра, спасибо анон.
>>1620878 Ну хз, тебе надо привести в любом случае к одной структуре. Выделение концепций в вики Карпатого самое удобное для небольшого количества инфы.
Напиши подробный промт как ты видишь структуру и ллм тебе все сделает.
>>1620878 Это тоже карпати, тебе анон не тот проект подсказал. Я не помню как он называется, автоисследование что ли. Когда ии агент перебирает варианты чего то тестируя по каким то критериям. И смотрит что лучше. На твою задачу похоже
>>1620883 Да да оно, я на работе карпати тоже свою имплементацию агента делал для автоподбора параметров запуска локальных сеток. Получилось, но работало так себе. Надо будет прикруить это расширение к пи и посмотреть, там и для вики его было расширение если правильно помню
Взлольнул. Если вкратце, то табличка, которую аноний скидывал сверху - скомпрометирована чуть более, чем полностью. Производительность моделей можно оценить только личными тестами, все бенчмарки - говно собачье. Я пытался пользоваться кими, но он оказался тупее, чем гемини. А гемини показала себя хуже локального лоботомита 32b в шестибитном кванте, а это очень, очень плохой показатель.