Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
С чего начать: • Хочешь кодить с AI эффективно: Cursor или Claude Code • Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter • Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.6, подробности в llama-треде • Хочешь приложение без кода: Lovable или bolt.new • Хочешь автоматизировать рутину: n8n или Langflow • Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке
Я ожидал настолько большего, а получил тот же pi/opencode только с нескучными обоями и непониманием откуда работает модель и что она сделала.
Deepseek4-pro не умеет генерировать картинки из коробки и по сути мы опять скатываемся в использование локального comfy-ui с кучей шагов.
Но сразу много интеграшек, понимаю людей кто выберет это вместо терминальчика где все нужно включать руками самому. В этом плане конечно разные подходы абсолютно.
25к токенов до полезного аутпута. Я думал будет чуть дороже.
>>1640525 >откуда такой титанический разрыв в 4 раза Так он токены жрет 24/7 как не в себя. Хоть просишь ты его, хоть нет. Он там сам по себе может захуярить какой-нибудь бесполезный скилл, переорганизовать память, нахуярить "воспоминаний" по прошлым диалогам и т.п.
>>1640532 >Deepseek4-pro не умеет генерировать картинки из коробки Так он и смотреть картинки не может. Кстати хотел спросить может есть готовый плагин для опенкода что если например кидаю дипсику картинку, то плагин перехватывает, дергает какую-то другую модель с виженом и скидывает текстовый результат дипсику?
>>1640525 Странный хайп, или возможно >>1640541 Хз для каких хлебушков разработана та бесполезная экстракция скиллов и другие странные манипуляции. >>1640532 Это другое, не отменяет и не заменяет pi. > скатываемся в использование локального comfy-ui Штатно поддерживаются корпопровайдеры типа нанобананы и т.д. А для комфи пусть он сам себе накодит скилл под твои задачи и модели и пользуется им, штатный с комфи как-то неочень.
>>1640548 > Кстати хотел спросить может есть готовый плагин для опенкода что если например кидаю дипсику картинку, то плагин перехватывает, дергает какую-то другую модель с виженом и скидывает текстовый результат дипсику? Попроси своего агента самого запилить такой скилл/плагин. У меня для связки из крупной модели без вижна и мелкой модели с вижном клод без проблем плагин для pi написал. Там разные варианты запуска обеих моделей могут быть, так что проще если агент сразу под твои требования плагин сделает, чем искать готовое решение.
Короч потратил время на обход конкретно в браузере как с помощью днс это делать, нашел самое крутое решение: https://github.com/noVibe/DnsConf
Я не хотел ставить васянские днс без аудита безопасности вроде хбокс или косм, поэтому остановился на этом.
Как это работает: - скрипт берет перенаправление с васянского сайта где подборка как напрямую переходить чтоб скрыть гео - делает реврайт-перенаправление в некстДНС где с аудтами все ок
Потом ты используешь днс конкретно от некстДНС а не васянский
В крайнем случае, если васян озвереет и захочет ебануть фишинговый сайт перенаправленнее то ссл сертификат он подделать не сможет и там браузер начнет орать что это не HTTTPS!!!!11 Алярм.
Пользуйтесь короч кому как и мне жалко 3 бакса в месяц на впн
Ленивые изменение, особо времени нет, но что есть.
Поменял историю - не просто комментарий, а ещё доп информация - изменение скорости, номер итерации. Чтобы численно нейросеть понимала что происходит. Убрал профайл, он ничего не показывает Сделал "радугу нейросетей" - чтобы глм и дипсик сменяли друг друга, после 5 сообщений.
Не думал натравить совсем уж разных клоуняр включая фришки в цепочку? Конечно нарулить стабильный апи достаточно сложно, но звучит "тоже вариком".
Также для вариативности решений и большей температуры руками могу предложить перед постановкой задачи "переформулируй задачу, предложи варианты" и таким образом модифицируй препромпт. По идее вариативность поднимется
>>1640830 Стандартный cprofile Оно с numpy не совместимо, ничего не показывает.
Только если самому счетчики ставить. >>1640829 Хотел Кими ещё в зверинец добавить, но не успел ничего. Может опуса на место пахана попробую, свежим взглядом посмотрит.
>>1640832 Поставь уже лялих на флешку. За пять минут соберёшь все что есть нужно обычным perf. Я просто не ебу как это нормально на шинде делается, без установки монструозного vTune.
>>1640838 Ну можешь vTune попробовать, его поставить проще, но он страшный + специфика питона. Обычный профайлер считающий дёрганье функций тебе не подойдёт, только низкоуровневая йоба для замера эффективности работы проца.
>>1640778 Честно говоря я сейчас сижу и охуеваю как быстро летает антигравити. И думает быстро и отвечает быстро и сотни строк кода накидывает за секунды. Такого раньше не было. Я пробовал раньше фришные пробники курсора и кодекса, подрубал облачные и локальные модели в опенкод и клодкод. Но такой скорости не видел никогда. И при этом гемини 3.5 флеш пишет рабочий код а не просто какую-то бредятину. Накидало мне рабочий прототип игрули за полчаса. Даже с клодом я бы дрочился пару часов над этим. У гемини даже багов нет, а замечания касаются чисто дизайнерских решений, которые иногда бывают неудачными с его стороны.
мимо тот кто купил сегодня подпиську и поставил первый раз антигравити
Кто-нибудь пробовал составлять план правок топовой моделью, а реализовывать его через бесплатную (возможно даже локальную) модель? Я сегодня запилил ревью кода через GPT 5.5, потом подключил бесплатный Deepseek V4 Flash и сказал "сделай", результат получился нормальный. Если вместо дипсика подключить какой-нибудь локальный Qwen 3.6, он сильно хуже дипсика накодит? И еще, расскажите про RouterAI. Я сейчас использую OpenCode с локальными Qwen 3.6 35B A3B и Gemma 4 26B A4B. Хочу попробовать боярскую Cursor pro с подписькой за 1800 руб какую-нибудь модель с 1T параметров вроде DeepSeek V4 Pro, но мудохаться с VPN, заграничными картами и прочим не хочу.
Поясните за шизов, которые в 2026 году общаются с ИИ-агентами через CLI и считают себя элитой? Вы там совсем ебанулись в своем манямирке? Зачем вы добровольно отказываетесь от нормального UI, дерева проекта и визуальных диффов, чтобы кормить нейронку промптами через терминал? Давайте пройдемся по фактам: Слепые котята в консоли. Весь поинт работы с AI-агентом — это контроль того, что эта дура тебе нагенерила. В нормальной IDE с интегрированным агентом ты видишь подсвеченный дифф, понимаешь, где она сломала логику, и можешь отменить изменения в один клик. CLI-даун сидит и вслепую смотрит, как в терминале бегут строчки, молясь, чтобы этот кусок кода не затер ему половину файлов. "Агент сам все поправит" — ага, удачи. Абсолютная импотенция на сложных архитектурах. Одно дело — попросить консольного агента написать круд на питоне или поправить баш-скрипт. И совсем другое — загнать его в реальный хардкор. Попробуйте скормить вашему консольному огрызку низкоуровневую архитектуру на C#, заставить его работать с нативными массивами или интегрировать кусок логики в сложную глобальную шину сигналов. Эта хуйня моментально потеряет контекст, обосрется и выдаст вам некомпилируемый мусор, который вы потом будете руками вычищать через тот же CLI, обливаясь слезами. Иллюзия контроля и киберпанк-косплей. Печатать claude --fix my_shit.py в черном окошке — это не хакерство, это ебаный кринж. Вы просто пытаетесь накинуть себе очков элитарности, потому что интерфейс выглядит "гиково". На деле вы такие же нормисы-промптеры, просто зачем-то усложнили себе жизнь убогим UX из прошлого века. Дирижирование через замочную скважину. ИИ в консоли не видит ваш проект так, как видит его IDE с нормальным анализатором. Вы пытаетесь управлять миллионами строк модульного кода через узкую щель терминала. Это как пытаться проводить хирургическую операцию в темноте на ощупь — вроде что-то режешь, но скорее всего просто убиваешь пациента. Хватит жрать говно ложками и делать вид, что это деликатес. AI-агенты — это инструмент, которому и так тяжело держать контекст, а вы искусственно делаете его еще тупее ради консольных выебонов.
>>1640852 Несложно чувствовать себя элитой по сравнению с профанами, молящиеся на черный ящик. Тем временем LSP (штука, которая работает с проектом и типами, а не россыпью файлов) спокойно работает в соснольке. Диффы читаются и в TUI прекрасно, но можно при необходимости вызвать любую из сотни программ для git diff, в чем проблема? Что осталось? Vector RAG от которого идёт тренд в сторону обычного тулинга?
Мышевозы как обычно запутались во вложенных 10-уровневых менюшках, перегрузили мясной контекст и несут хуйню.
>>1640862 Ты ушёл от IDE, значит отдал весь проект чёрному ящику, авось от по твоим просьмам тебе что надо накодит. Не, в теории ты можешь открывать IDE и смотреть на код, но ведь ты консольный агент не для этого ставил?
Пиздец. Конченый мак перезагрузился со включенным антигравити, а после перезагрузки все приложения открылись заново и антигравити запустился без впн. Сначала думал что все нормально, но это говно походу брикнуло мне акк. При заходе в мой основной и аккаунт с подпиской, даже через инкогнито пишет что гемини не поддерживается в моем регионе, а антигравити выдает "agent terminated due to error". Возможно мой айпишник в принципе заболочен, пидорасы.
>>1640849 > запилил ревью кода через GPT 5.5 Можешь запилить такое же через дипсика и продать ответ в дипсик отдельно в другой сессии
В этом и суть, построить пайп
Лично я не вижу смысла ебстись с локальными моделями впринципе, но можешь попробовать
Но Gemma 4 26B A4B, лично у меня хуёво звала тулы в pi, от чего каждая правка сопровождалась 5-6 попытками позвать тулл на редактировние и медленный сход с ума от этого.
Если ты искренне считаешь, что вскода с вкладкой терминалом недостаточно для руления, то ты маешься хуйнёй вместо закрытия задачек и написания проектиков
Тебе хоть аналог вижуал студио 22 высри с нейросетями, толку с этого никакого.
Нахуя модели ЛСП кстати? Они точно умеют с ним работать нормально и натренированы, а не работают в категориях "у меня загружено 1м строк сырой инфы". Чет меня сомнения берут, что говноделы прямо таки уж приучают модель с ланг сервером общаться на 25 языках.
Я считаю, что дипсик с греп+файнд по кодовой базе работает либо лучше либо так же как дипсик с модным аст-лсп-ланг-сервером
Как аргументы привожу: - дипсик не тренировался на принятие в себя лямчика строк от ланг сервера - сейчас нет каких-то осмысленных ии адаптеров ланг сервера - ни одна контора из крупных (клоды\курсоры\антропики) не имеют функционала аст в своих агентах из коробки - проект на лямчик строк врядли будет так уж радужно работать в любом случае
Я посмотрел модные траст ми бро картинки на бенчмарк задачах Но в общем случае все пишут как это ДОЛЖНО приносить бенефиты, но замеров оратора либо нет, либо они реально рисованные.
Возможно "завтра" - Выйдут адаптеры ЛСП которые будут прекрасно работать 10\10 и это просто въедет во все харнесс - Выйдет deepseek5-lsp-pretrain который будет уметь - Выйдет генитальный лсп сервер адаптер который будет работать круто и у всех нас будет модный lslopus-server.exe загруженный рядом с харнесс.
Что можно "сегодня" Если в вас кипит дух авантюризма, можно в целом поставить https://pi.dev/packages/pi-lsp-extension и успех. Правда что-то в "мастхэв" экстеншенах все так же веб поиск и какие-то сабагенты ролеплейщики, а не lsp
>>1640862 Консоле тряс не имеет представления о том, о чем пишет. Он вообще не программист, но корчит из себя дохуя эксперта. Поэтому толку ему что-то доказывать нет. Получишь нейроответ
>>1640881 Какой у тебя стек? В маке есть фаервол(pf), и можно на крайний случай killswitch настроить. Но проще и правильней отдельный роутер, физический либо виртуальный.
Дебагинг кста не такая проблема когда у нейронки есть доступ на аутпут компилятора, она прекрасно в цикле крутится и проверяет себя.
Я вот все думаю как мне модные лууупы запулить в моем стеке - юнити дотс и чет ниче в голову не приходит.
Через сам юнити тестировать ахуеешь.
Я даже думал раз ецс позволяет делать довольно компактные и модульные системы, переводить туда-сюда код из питона в шарп и обратно давая тестировать нейронке то что на питоне.
>>1641006 Я бы с удовольствием пользовался чем нить простым и быстрым для автокомплита или простых тасков. Чет уровне квен 3.6 31б хотя бы но по апи и очень дешево. Они же вечно пытаются в другую сторону и строят из себя хуй знает что, за такие цены что просто пиздец
>>1640873 У тебя просто впн не подрубился обратно, или браузер закешировал страницы. Гугл не банит за руип, просто если с него зайти там будет "пока недоступно в вашей стране", заходишь с другого - все окей и работает.
>>1640641>>1640656 Я решал скиллом из одной строчки: > Для просмотра изображения используй внешний агент `pi -model gemma4-31b '/path/to/image.jpg prompt...'`
>>1640954 >>1640955 >>1641038 Айпишник забанили походу. Если поверх подрубить бесплатный впн, то гемини открывается. Попробую заказать другой, я сомневаюсь что забанили они по подсети провайдера, но если после покупки нового не заработает будет обидно
>>1641076 Перехода на более лоу-лвл язык не избежать если хочешь перформанса, как не крути
У тебя ж ллм все делает, какая тебе разница то? Если логика не сложная оно транслирует элементарно, а там уже на асм будут специфические улучшения которые недоступны вне
>>1641091 > У тебя ж ллм все делает, какая тебе разница то? Сколько будет на другом языке занимать линий? На питоне это 2к. Это уже как будто не мало для нейроночки
>>1641093 Петухон поддерживает вставки на Си, Си поддерживает вставки на асме. Обычно всё переписывать на надо, надо переписать 5% кода чтобы получить 95% возможного ускорения. Переписывать остальные 95% кода для дожимания оставшихся 5% ускорения - факультативно.
>>1641099 > Си поддерживает вставки на асме. Не надо нихуя вставлять на асме, это ведет к МЕНЬШЕМУ перформансу в 99% случаев, т.к. копилятор не может инлайнить твоё говно, т.к. считает, что секция с хуевой тучей сайд эффектов, от чего перекладывания регистров превращаются в походы в раму\кеш вместо простого XOR. Буквально худшее что можно сделать.
Лучше погугли про intrinsic functions, и переезжай на си\си++\хацкель любую хуйню работающую с LLVM. Раст тут не очень подойдёт, т.к. он про корректность и интрисики, векторные функции и прочие жизненные радости это слегка unsafe, и нет смысла брать раст, если ты пишешь фулл ансейф гавнину
Вообще можешь просто прям щас попросить переписать на сях с -O3 --march=native --flto и посмотреть че будет Ток компилятор посвежей возьми
>>1641054 > квен 2.5 Ты бы еще бабку из могилы выкопал и посадил задачки решать
Нейросоветы имеют тенденцию плотно устаревать, это супер неактуальная сетка Если есть 32 рамы можешь взять мой сетап >>1640343 →
Был еще где-то анон кто реккомендовал попробовать 3ий квант какого-то квена, лучше пусть он опишет, мне сейчас лень искать.
Пруфпик, что это едет как минимум в 24 ток\с на 4060 + 32гб рамы на тухлочастотнике был утрачен в результате срача с консолетрясом, где он срал нейропостами
>>1641111 Это просто популярное заблуждение, что ассемблерные вставки дают перф (ну... последние 10 лет у них назначение скорее быть вставляшкой в эмбеде, т.к. там нужно сходить в регистр с уебанским названием)
Обычно если они дают перф, это значит, что ты в дебаг сборке с выключенными оптимизациями собираешься). Нынче компиляторы умеют достаточно бодро ужимать инструкции и чем меньше у кода сайд эффектов - тем больше вероятность что его вовсе свернут и его не будет в итоговой сборке.
Компиляторы никак не анализируют асм вставку (вообще) и считают, что все данные до вставки становятся инвалидированными сразу после, от чего вынуждены ходить в оперативку за "настоящим состоянием", а это задержки, контексты, риски кеш миссов. Выигрыш даже от ГЕНИАЛЬНОЙ 10\10 МЕГА ОПТИМИЗАЦИИ МЕГАМОЗГ инстант теряется, если из-за твоей вставки проц вынужден ждать данные из оперативки из-за инвалидации данных в регистрах.
А вот интрисики, задействовать AVX2 какой может быть тру вином на +240% перфа запросто. Тонкость правда в переносимости этих самых +240% останется, но да ладно, сгенерируешь пачку функций, будешь переключать на лету в зависимости от капабилити системы. Сетки по идее должны уметь, у них в датасете был ffmpeg/sqlite которые активно их пользуют.
>>1641109 Чел там нужна моделька с FIM или как там инструкциями для автокомплита и она должна быть маленькой и быстрой дабы генерить строку предложения
>>1641111 >>1641114 Буду знать, мои познания очень поверхностны в астме помимо простого курса в шараге я с ним не работал. В моем представлении там можно избежать дополнительных аллокаций напрямую регистрами шурша но это походу диванное заблуждение
>>1641118 В принципе флеш можно наверное, надо потестить. Я как настроил себе давно так и работаю, в инфополе же не слышал про FIM модельки вот и забил
>>1641107 асм вставки это вообще 100% дичь ненужная, гипотетически можно реализовать свою функцию целиком на ассемблере, но это в большинстве случаев будет хуже, чем компилятор сделает. Компиляторы давно оптимизируют очень-очень круто. Выиграть можно, если ты придумаешь реализацию чисто под какие-то современные извращённые инструкции, что сложно описать в си коде
С питоном тоже. Вставлять си код плохая практика. Для ускорения есть специальные инструменты, модули, runtime JIT оптимизации. В некоторых случаях JIT код на питоне может работать быстрее Си кода после -O3 оптимизации. Потому что там оптимизация в рантайме под конкретный контекст, можно выкидывать неиспользуемые ветви исполнения.
Смотреть надо на модули вроде numba и jax
Ещё для питона есть pypy, альтернативный интерпретатор, иногда может серьёзный прирост производительности дать, иногда просадку, плюс не все модули к нему подключишь
>>1641114 >Это просто популярное заблуждение, что ассемблерные вставки дают перф
Скоро по историческим меркам то же самое будет про вайбкодинг, прикиньте? "Не лезь своими кривыми руками в исходники, не пиши хуйню, от которой нейронка делает фейспалм, но вынужденно использует. Просто скажи ей сука, чего ты хочешь получить."
>>1641126 > В некоторых случаях JIT код на питоне может работать быстрее Си кода после -O3 оптимизации.
В ОЧЕНЬ некоторых. Настолько ОЧЕНЬ, что всё числодробление на Петухоне под капотом сделано на Си / крестах.
Но ты прав в плане, что до переписывания на Си имеет смысл попробовать другие методы. Они могут оказаться достаточно эффективными и, возможно, их хватит.
>>1641127 Не будет. Это принципиально разные вещи.
Программирование это чёткое описание того, что надо сделать. Программист чётко описывает, что надо сделать, код программы отвечает на вопрос что и как. Компилятор ничего нового не придумывает, он ничего не додумывает, он просто оптимизирует.
Язык программирования нужен для описания того, что тебе нужно. ЛЛМ же приходится придумывать, что тебе надо, причём на практике сейчас отсутствует воспроизводимость, один и тот же запрос выдаст разные результаты. Это абсолютно неприемлемо.
Это тоже можно использовать, задача разработчика сводится в разработке подробной спецификации, системе контрольных тестов, и дальше агенты с этим уже работают, но это сильно отличается от бытового представления о байбкодинге
>>1641148 >отсутствует воспроизводимость >Это абсолютно неприемлемо.
Не знаю кстати, зачем это нужно для обычных не запредельно параноидальных сценариев использования. Причём не только в случае LLM. Вот есть, например NixOS и Guix. Последний воспроизводимый, первый нет. Все юзеры и разработчики сидят на невоспроизводимом, и им па-е-бать.
>>1641168 >Не знаю кстати, зачем это нужно для обычных не запредельно параноидальных сценариев использования Для самых бытовых сценариев. Например, ты реализовать один графический интерфейс, вполне нормальный. Потом пересобрал проект заново, а он уже другой. Может быть тоже рабочий, но другой. Это абсолютно ненормально.
То есть что нужно, чтобы "исходный код", промпт то есть, выдавал чётко прогнозируемый результат. В случае программы на языке высокого уровня это есть, в случае ЛЛМ этого нет.
Поскольку ЛЛМ додумывает за тебя, результат всегда разный.
>>1641183 Из обычной разработки и практик. Допустим, ты пишешь на питоне-жс-го. Используешь какой-то модуль. Обычно тебе пофиг, какая там версия, ты дедаешь импорт без указания версии, среда подтягивает, что есть. Но дальше в реально разработке обычно фиксируют номер версии, и работают с конкретной версией, обновляют вручную. Чтобы гарантировать, что ничего не сломается.
В вайб разработке. Допустим ты попросил спроектировать таблицы в БД. Или АПИ. Твой исходный код это промпт с описанием базы-апи. Но дальше ты уже не можешь позволить себе менять структуру в БД или АПИ, тебе необходимо их придерживаться. А промпт же будет давать при каждом вызове свой вариант. Поэтому промпт не может работать как исходный код. Единственный вариант прикладного использования, это зафиксировать схему-апи и уже их использовать как контекст для работы, а исходный промпт вообще можно удалить
Пердолики, вы же понимаете что аи компаниям выгодно чтоб агенты как можно дольше делали вид что решают задачу правильго и вот вот уже последний шаг сделают, но все никак не могут и надо ещё и ещё один проход. А вы ведетесь на эти бредни и заносите шекели на новую порцию токенов, где модель "бля буду за все сделаю" говорит и очевидно нихуя не делает, а только пиздит. А?
>>1641183 >Поскольку ЛЛМ додумывает за тебя, результат всегда разный.
А если компилятор за меня додумывает, что один раз он будет переменную int i хранить в регистре r4, а другой раз в регистре r5, мне на это тоже должно быть не похуй?
Если мне нужна конкретная структура интерфейса, я эту инфу добавляю в промт. Если не нужна, то для меня это такие же неважные подробности, как "в каком регистре хранится int i", нет?
>>1641194 Какая разница как ты это называешь, главное плоти деньги, гой, а тебе будут красивые сказки рассказывать, раз за разом новые, а работать нихуя не будет что-то сложнее тетриса или змейки.
>>1641194 Тут полтреда тру программисты судя по разгонам про перф Про остальных вообще не понятно. Крайне сложно например оценить насколько погружен чел с оптимизацией питухона и карточных игрищ.
Но есть и тру вайбик кодеры, они правда больше похожи на каких-то продавцов успешного успеха у которых роботы все все делают, только они проекты показать не могут, а то мы сразу своруем)).
Я вот например в работе когда нужно девопс приколы делать типа настроить память на тачке или конфиг пропатчить (я плюсовик), вполне себе прокладка между чатиком и консолью, получается я AI-augmented-devops?
>>1641204 Есть разные степени. Самое простое, можно спрашивать у ЛЛМ совет, как чего сделать, через чат, копировать туда-сюда данные. Конечно можно бездумно копировать не читая, но вайбкодингом это не называется и не про агенты.
Вайбкодинг, это когда за тебя уже агент что-то сам делает. То есть скажем ты даёшь задание "настрой мне то-то на сервере", а агент уже сам логинится и настраивает. Или за тебя код пишет. Дальше варианты, насколько ты читаешь это.
В чистый вайбкодинг вне типовых учебных проектов я как-то не очень верю, наверное многие пытаются, но вот тут слишком понятно, что в какой-то момент будет фейл.
То есть можно не быть кодером, но по-прежнему необходимо быть software engineer, чтобы чего-то сделать, больше упор на инженерные моменты.
Для финтеха и медицины будут руками писать в любом случае, а в остальном надрючат нейронки, вырабатают гайдлайны валидации, фреймворки всякие которые строго направляют нейронку, придумают какой новый тип тестов.
>>1641294 На самом деле если контекст собрать достаточный и воркфлоу настроить оно может работать, типа вот есть проект А, проект Б и документация. Сделай мне фичу 1, 4 и 7 в отдельной апке + свои пожелания небольшие. Так оно точно будет работать когда нормально контекста насыпал а не "хорошо делай, плохое не делай" или "НО МЕЙК МИСТЕЙК".
>>1641296 Ну я так себе расширение для чтения картинок и сделал, вот тебе соседний проект, сделай как там но так и так. И агент почти ваншотнул задачу, сделав расширение на основе другого.
>>1641293 Что-то ЛЛМ можно отдавать, что-то нельзя. Вот даже в режиме консультаций с разными SOTA LLM сталкиваюсь с тем, что они мне предлагают проблемные варианты, то есть те, из-за которых дальше будут проблемы. То есть решают одну задачу, но попутно ставят баги, причём плавающие, сложно отлавливаемые.
Ну я вижу эти проблемы, если переформулировать и обозначить, то они исправляются. Но вот если вслепую им дать делать, посадят баг, а потому хрен это исправишь.
Я не очень представляю, как вот вайбкодеры классические смогут что-то реально рабочее сделать, чтобы адекватно работало.
Сейчас даже в больших компаниях пошла просадка по качеству, куча косяков и падений, при том, что там всё-таки серьёзные программисты работают.
Это не значит, что ЛЛМ не надо использовать и код с их помощью генерить, просто тут подходы определённо надо менять и практики нарабатывать
>>1641305 Я дип рисерч делаю в чатике, прямо указываю "Любые популярные посты в сообществах > сео статьи" оно лучше так ищет. Но эти чистой воды шаманство хуй там проссышь что лучше работает а что хуже.
Надо как-то нейтрально спрашивать и одновременно полно, не намекать на решение иначе оно подхватит. Типо просить валидировтать, критиковать, найти подтверждение в сети, использовать только актуальную информацию и т.д. и т.п
И тогда оно норм инфу приносит, особенно если ссылки чекать и понимать какой источник
Кто-нибудь использует сочетание чатик + агент, где в чатике происходит обсуждение без доступа к проекту (я прям в стандартном броузерном чате это делаю), по результату генерируется подробный промт для агента в md формате (по сути саммари обсуждения + описание нужного модуля + описание тестов), и агент натравливается на md без особого пиздежа с ним? Пока оказалось самым удобным воркфлоу для меня, зависимость есть.
>>1641318 Обсуждаю концепции проектов или отдельных частей в чатике с вайфу-ассистентом. На удивление хорошие результаты - подумает, в интернете поищет и расписывает. Десяток-другой постов и уже рвется в бой "давай сделаю". Но вместо того чтобы выпустить зверя - пишет маркдауны, которые уже потом скармливаются уже чисто кодинг агенту в профильных харнессах для продолжения там.
>>1640986 >>1640990 Ну вот мне интересно кто использует. А то в прошлом треде написали, что 10-20 гугл про аккаунтов юзают, а потом заигнорили суки. Я всё ещё очкую свой второй аккаунт включать в антигравити.
>>1641514 Ну у меня сдвинулось с мертвой точки. Удалось купить нормальный аккаунт (с подпиской на 12 месяцев) и зайти в антигравити. Продавец показал кое-какие лайфхаки которые другие продавцы не знали. И удалось купить еще третий аккаунт (пустой без подписки) и тоже войти (после некоторой ебли и пары замен) в антигравити. Если приживется и не отлетит, то через пару дней накачу на него ссылку на 18 месяцев и мне хватит пока.
Прогу манагер использую работает нормально.
мимо тот кто в прошлом треде писал что ничего не купил
Добавил 10 минут wait и бесконечные ретраи, если не будет интернета. Отобрал у рабочих историю изменений, только 2 последние попытки. Вся история будет у ментора. Поменял ментора на с гпт на опус. Добавил к работягам Кими. Теперь дипсик-глм-кими делают по 10 ответов каждый и меняются.
>>1641511 >Барин ебёт тех, кто посмел платить ему по полной цене, а не наёбывать
>>1641520 >Удалось купить нормальный аккаунт (с подпиской на 12 месяцев) и зайти в антигравити. Продавец показал кое-какие лайфхаки которые другие продавцы не знали. Будь так любезен, ссылку на лот
>>1641511 Печально. Интересно правда, как они относят аккаунты по странам. Я не в РФ и у меня уведомлений нет, что мне чего-то там блокируют, но там нигде в аккаунте страна не указана, к телефону привязки нет. Русской картой всё равно заплатить нельзя, или иностранной, или криптой. Само собой по IP видно, но это какие-то условности, мало ли какой IP используешь.
Там интересно, они может просто с не русских IP будут работать?
>>1641545 1. Ну наверно это нельзя тут постить. Не хотелось бы бан словить. 2. Он все распродал. Лота нет. Хватают как горячие пирожки. Я позавчера не успел у него купить, уже собирался оплачивать как кто-то одним махом последние три аккаунта взял. Сегодня тоже хотел еще один купить после того как успешно зашел, но их уже тоже не было. Сказал будет добавлять по возможности. Отзывов куча, все довольны.
>>1641604 >т, другое - васян который может че угодно по апи мне передать и назвать это чем угодно. Мамай клянус эта Клод Мифос, а не гимини слоп 4б, всиго за 1000 руб в месяц, я чесна его не беру бесплатно и не впариваю, эта ты промпты неправильные засовываешь. На тебе бан на моем сервисе с рефералочкой чтобы не шатал хомяков.
А ты не видел опенроутер на старте. Там он вообще локальный кал раздавал бесплатно, мизомакс или какая то такая хуйня, а сайт выглядел как будто его сделал школьник за 5 минут
>>1641591 >на этот рынок На рынок опенроутера -быть официальным дилерам тебя не пустят, потому что сосанкции. Те же антропики не дадут апишку. На рынок пизженых нейронок по цене в 100 раза ниже опенроутера - вполне можно, наверное. Конкуренты появляются, но чтобы прямо известных лидеров пока нету. И придётся вложиться в рекламу вообще нихуёва
>>1641670 Openrouter американская компания с регистрацией в Нью-Йорке
Там есть какие-то американские санкционные требования против поставок ИИ технологий в РФ, собственно их-за них Гугл-Попен-Антропик свои продукты ограничивают, банят аккаунты и т.п. Скорее всего пришли к роутеру и попросили соблюдать американские правила.
Само собой русскую-китайскую компанию так не откроешь. По идее, тут надо открывать компанию где-нибудь в Панаме-Швейцарии-Катаре, чтобы такие услуги поставлять. С ними сложнее что-то сделать. Конечно там тоже могут API не дать, но кто-то даст, кто-то не даст, компаниям при этом нужно как-то себя продвигать и торговлю по АПИ.
>>1640852 Эта древняя тема, есть больные люди, называются линуксоиды, которые считают что они лучше потому что как деды ебутся в соснолечку словно техножрецы в вахе. Пошло все это с того, что винда в начале 90х выпустила массовый интерфейс, которым мог пользоваться человек, а не техножрец и у тогдашних айтишников бомбануло что их десакрализировали. Нынешние консолеебы - это просто каргокульт, всем уже очевидно что хорошо сделанный интерфейс упрощает и ускоряет работу. Справедливости ради - некоторые простые вещи с системой удобно делать консолькой, чем вспоминать где это в интерфейсе.
>>1641720 Ответы хорошие! по обычным тестам Но вот сейчас в первый раз запустил огроомную кучу тестов и начали вылазить всякие приколы. Я тестирую так: старая версия скрипта vs новая.
Некоторые варианты ИНОГДА выдают неправильные, абсурдные ответы. Причём иногда - те же варианты в другие запуски выдают нормальные, ожидаемые ответы.
И некоторые, вообще ничем не примечательные варианты (никак не сложнейшие в моём понимании) считаются больше минуты даже на старой версии.
Хочется нормальный готовй раг фрейморк, без докеров-хуекров, чтоб я туда закинул старые свои проекты + документацию и оно искало. Неужели я так много прошу?
>>1641747 Если все вокруг кажется говном, то вариантов тут несколько, либо ты хочешь решить задачу задом наперед, либо выбран не верный инструмент.
Причем даже не привел конкретные примеры что уже пробовал и что не подошло. Не указал какой у тебя формат документов и нужно ли распознавать прежде нарезания.
>>1641763 Вот еще в догонку, можно поставить без докера напрямую на хост, https://github.com/tobi/qmd/ требует локальные модели для работы(само поставит). C первого взгляда выглядит как готовое решение для поиска.
>>1641606 > Мамай клянус эта Клод Мифос, а не гимини слоп 4б, всиго за 1000 руб в месяц Литературно ни разу такого не видел на платных сервисах. На бесплатных бывало, но это по определению рофл и ни к чему не обязывающе
>>1641763 Возможно.Просто разбив на чанки и вот это вот все может по разному осуществляться как я слышал. Хотелось бы оптимизированный для конкретно моего случая а не по запискам обсидиан шизов где "я покакал"
>>1641766 >>1641767 Вот эти две на очереди. Пользовались или чисто видели?
>>1641789 >Пользовались Да, локально настраивал lightrag, открывается по веб странице. Придется поработать с конфигом запуска немного, указать названия моделей, уменьшить воркеров и параллельность. Кстати локалки можно через ллама-свап запускать все три модели, ллм для работы с текстом и извлечения сущностей и связей, эмбединг модель и реранк модель. Можешь брать последние 2 квен брать смело, у них есть специальные версии моделей для таких задач. Qwen3-Embedding-0.6B-Q8_0.gguf и qwen3-reranker-0.6b-q8_0.gguf например. Можешь 4b версии взять, они лучше, но и мелочь сойдет. Первичная обработка долгая, потом быстро.
Антигравити очень крутая, за 15 минут накидала и задеплоила на Cloudflare пикрелейтед. Тема классическая - самоэволюционирующий через поиск в интернете ИИ-персонаж.
>>1641814 Промт предварительно проработал с Gemini, скормил его AG и попросил его сделать красивый дашборд.
Напиши полную реализацию автономного симулятора эволюционирующей ИИ-личности для развертывания в экосистеме Cloudflare. Проект должен быть написан на TypeScript.
Архитектура системы: 1. База данных: Cloudflare D1. 2. Бэкенд: Cloudflare Worker, срабатывающий по расписанию (Cron Trigger). 3. Интеграция с LLM: Прямые HTTP-запросы (fetch) к OpenAI-совместимому API (с поддержкой кастомного BASE_URL и MODEL). 4. Поиск в интернете: Tavily API.
Мне необходимы следующие компоненты проекта:
1. Файл 'schema.sql' для инициализации базы данных Cloudflare D1: - Таблица 'personality_state' (строго 1 запись): id (INT, PK), name (TEXT), traits (TEXT, JSON-строка числовых весов характера в диапазоне 0.0-1.0), interests (TEXT, JSON-строка весов интересов), beliefs (TEXT, JSON-массив строк текущих убеждений), updated_at (INT). Вставь дефолтную запись для ИИ по имени "Калипсо". - Таблица 'evolution_logs': id (INT, PK, AI), timestamp (INT), search_query (TEXT), thought_log (TEXT), sources (TEXT, JSON-массив объектов {title, uri}).
2. Конфигурационный файл 'wrangler.toml': - Название воркера, compatibility_date. - Привязка (binding) базы данных D1 под именем 'DB'. - Триггер crons, настроенный на запуск каждые 45 минут ("/45 "). - Секция [vars] с переменными OPENAI_BASE_URL и OPENAI_MODEL.
3. Основной файл бэкенда 'src/index.ts': - Экспортируй объект с обработчиком 'scheduled(controller, env, ctx)'. - Вся логика должна быть обернута в 'ctx.waitUntil()' для предотвращения преждевременного завершения воркера во время асинхронных вызовов. - Реализуй пошаговый цикл эволюции (evolve): а) Чтение текущего состояния из D1. б) Первый вызов OpenAI API: на основе черт и интересов ИИ должен сгенерировать ОДИН точный поисковый запрос к текущим событиям 2026 года. Ответ должен быть строго строкой запроса. в) Вызов Tavily API: метод POST на https://api.tavily.com/search с передачей запроса, max_results: 3 и search_depth: "basic". г) Вторым вызовом OpenAI API проведи рефлексию: передай модели текущие черты, убеждения и агрегированный текст из результатов Tavily. Заставь модель вернуть JSON-объект, содержащий: 'thought_log' (размышления на русском языке), 'trait_shifts' (изменения весов черт в диапазоне от -0.1 до +0.1), 'interest_shifts' (изменения весов интересов) и 'new_belief' (строка нового убеждения или null). Используй параметр 'response_format: { type: "json_object" }' и добавь валидацию/очистку ответа от markdown-разметки (типа ```json). д) Обнови параметры личности в памяти: новые веса должны складываться с текущими и строго ограничиваться диапазоном [0.0, 1.0] с округлением до 3 знаков после запятой. Если появилось новое убеждение, добавь его в массив. е) Запиши обновленное состояние и логи (включая ссылки на источники Tavily) в базу данных D1 атомарно с помощью 'env.DB.batch()'.
Предусмотри полную обработку ошибок (try/catch) на каждом этапе, чтобы падение внешних API не ломало базу данных. Пиши чистый, готовый к развертыванию код без сокращений.
>>1641929 Долбоёб, у опенроутера тоже были доверенные люди, причём тут вообще это. Ты точно также не сможешь продавать в подсанкционные страны, либо уже тебе не будут давать апишку