Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
С чего начать: - Хочешь кодить с AI эффективно: Cursor или Claude Code - Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter - Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.6, подробности в llama-треде - Хочешь приложение без кода: Lovable или bolt.new - Хочешь автоматизировать рутину: n8n или Langflow - Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке
Чисто таймаутов для "доверенной" она же текущая поднято тупо потому, что во время высокой нагрузки, эндпоинт может тупо не отвечать 10 секунд, а потом дальше работать 10 минут подряд. Смысла проверять так заведомо мертвые нет, но вот если текущая работала, почему бы не попробовать еще раз. В целом адекватно до минуты на ретраях провести, зачастую тот же опен роутер оживает
Там много деталей опущено в этой описашке, оно там по тексту сообщения может определить что фри квота всё и не гнать на ретрай
>>1627786 > на следующего ДОВЕРЕННОГО провайдера. Нейрослоп такой нейрослоп кста
следующего доверенного нет Доверенным становится тот, кто ответил, все. Следующий доверенный означает погнали на некст (помечая текущую как фейл). Если прошло 3 часа, то из отстойника выкатываются полежалые модели и чекаются еще и они, все в порядке приоритета
По факту свапер никак кроме как циклического вызова одной и той же задачи не пригодится. Тупо из-за того, что от смены даже кванта, не то, что модели, старая история сообщений приводит к мгновенному психозу модели. Поэтому вся конструкция по факту имеет очень ограниченную сферу применения, которую мне удалось найти, но я бы не сказал, что могу придумать хоть что-то еще кроме циклического фикса ошибок компиляции из-за того, что ты притащил какую-то адскую срань в код и реальных ошибок сборки типа полторы-две тыщи
>>1627801 В чем проблема то? Субагенты, им плевать на предыдущий промпт у них он изначально свой. Надо только хорошо оркестратора прописать, что бы нормально им задачи распределял давая хорошие промпты.
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №239 /llama/
Аноним03/06/26 Срд 21:35:27№1624998Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1627654 >Ну да, но в чем разница между моэ как пишут? Наверное сколько не отвечай на эту хуету, все равно каждый раз будут вопросы, которые сразу отпадают у любого кто знаком с архитектурами трансформеров. 1. Трансформер может обработать хоть сколько токенов параллельно, загружая модель из памяти ровно 1 раз, множатся только вычисления. 2. Мое загружает условно рандомный набор параметров для обработки одного токена, для другого это будет в основном другой набор. Допустим 1 из 10 параметров. Если тебе нужно обработать 2 токена, мое загрузит почти 2 параметров чисто статистически. Если скорость работы упирается в память, проверять 2 токена в мое в 2 раза дольше чем 1. При увеличении количества проверяемых токенов скорость работы мое стремится к скорости плотной модели того же размера.
Касательно выгрузки в рам, то что выгружается, считается на цпу. На 2 токена в 2 раза больше вычислений на говнопроце. Да и данных по шине гпу еще тоже в 2 раза больше надо гонять. Хотя я бы сказал, все проблемы кроме физики мое - от говнокода.
>>1627792 >Хотя я бы сказал, все проблемы кроме физики мое - от говнокода. Непризнанный гений изобрёл сидя на двачах трансформерс2 и не рассказал гуглу
• Lens (3.8B) от Microsoft • HiDream-O1-Image • Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
>>1627741 >Сложно голову подставлять реалистично? Мэтчить размер/масштаб/скинтон свет и >выражение лица?
нууу я вот честно скажу, хуй знает xD все этот тугой долбаеб на клейне делает, что вкинул и напромптил то и получил. но тут с анимой я например сделал чтобы он автоматом с анимы тянул арт, сразу свапал его на мой референс ну и делал свои флюксовые штуки дрюки чтоб пластиком поменьше несло.
у меня вф вот этот с анимой это чтото из мира автоваза, просто прикрутил свой исходный вф кляйна собранного на коленке к спизженой перелопаченной аниме. (там в кишках еще и дедайлеры есть на лицо и глаза, но я их пока вырубил) вф на 2 референса чисто для свапа. Я в целом готовые вф не юзаю, но беру например понравившийся за основу и перехуяриваю как мне надо, так что я не могу сказать есть ли там какая хитрость, наверно есть, у меня с стандартными вф хуй получалось нормально засвапать бошку. В целом у клейна стандартные настройки для турбо - лсм на 6 шагов с 1 кфг. Ну и гдето вписано в промпте: add woman from image 2. Replace the woman's face and hair in image 1 with the woman's face and hair in image 2. woman's face expression exactly the same as in image 1. Есть отдельно промпт еще более душный для свапа, но я пока не юзаю его. Есть еще такая хуйня как FLUX Identity Adjuster, помогает с ебалом, но хуйня тонкая и капризная, я бывает её вырубаю.
Тут главное то понять что клейн чуда не сотворит, и если исходник в целом говно, то и на выходе тоже будет говно. Правда чудо уже будет если вот лору натренишь на него, тогда с лорой и референсом вот там да, сходство прост пиздец становится, ни одной хуйней не достигал лучшего сходства.
>>1627711 Попроси банану зарендерить тебе в разных стилях, или сам под контролнетом делай. Мусор вычисти из датасета, больше хреновых картинок - не зачит лучше. Можешь свои гены с текущей лоры в датасет добавить, если персонаж на них достаточно узнаваемый.
>>1627796 чел, итак всем понятно что на 3.5 будет фильтр такой же как на о1 от сэма шлемы, прост смысл на ней изначально сидеть было если это слопный кал?
Новости об искусственном интеллекте №73 /news/
Аноним# OP01/06/26 Пнд 00:00:14№1623168Ответ
Активно репортите все нерелейтед посты кнопкой на сообщениях. Этот тред только про новости, не позволим троллям загаживать тред шитпостом и бесконечным словоблудием.
🚀 Последний обзор ИИ новостей:
📰 Главные новости ИИ
Anthropic выпустила Opus 4.8, «скромное, но ощутимое улучшение», которое тем не менее демонстрирует SOTA-результат 69,2% на SWE-Bench Pro, 57,9% на Humanity’s Last Exam с использованием инструментов и 1890 на GDPval-AA, сочетая новые успехи в честности с уровнями рассогласованности, которые соперничают с еще не выпущенным Mythos Preview, который Anthropic теперь обещает предоставить «всем нашим клиентам в ближайшие недели».
💰 Финансирование
Внутри проспекта эмиссии Unitree: Выручка растет, а прибыль падает по мере приближения слушаний по IPO на STAR Market. Unitree Robotics направляется на долгожданное слушание по листингу 1 июня с обновленным проспектом эмиссии, в котором подчеркивается тонкий баланс между взрывным ростом выручки и стремительно растущими расходами на НИОКР.
Deep Robotics подает заявку на IPO на STAR Market на 367 млн долларов после первого прибыльного года. Deep Robotics планирует привлечь 2,5 млрд юаней (367,4 млн долларов) на площадке STAR Market Шанхайской фондовой биржи, оценив компанию более чем в 1,5 млрд долларов.
Anthropic обгоняет OpenAI, становясь самым дорогим ИИ-стартапом, и приближается к оценке в 1 триллион долларов в последнем раунде финансирования.
Apollo и Blackstone продвигают долговую сделку примерно на 36 миллиардов долларов для покупки TPU Google с целью сдачи их в аренду Anthropic, при этом Broadcom обеспечивает поддержку крупнейших траншей, а финансовая инженерия теперь финансирует кремниевую инженерию.
Конкуренты перегруппировываются, поскольку Groq привлекает до 650 миллионов долларов для «второго акта» после того, как лицензионная сделка с Nvidia на 20 миллиардов долларов опустошила ее руководящую команду.
После сделки Nvidia на 20 млрд долларов, не являющейся аквайхиром, стартап по производству ИИ-чипов Groq, по сообщениям, привлекает 650 млн долларов
10 крупнейших раундов финансирования за неделю: Anthropic доминирует на фоне в целом более спокойной недели для мегараундов. На этой неделе пятилетний гигант в области генеративного ИИ привлек 65 миллиардов долларов в рамках раунда Series H, доведя свою оценку post-money до умопомрачительных 965 миллиардов долларов.
Следующим по величине финансированием стал раунд на 1 миллиард долларов для производителя инструментов разработки ИИ-ПО Cognition, что подняло его оценку до 26 миллиардов долларов.
XCENA — стартап с офисами в Южной Корее и США — этот чиповый стартап только что привлек 135 миллионов долларов, сделав ставку на то, что главное узкое место ИИ — это не вычисления, а память. Четырехлетний стартап разработал чип, который размещает вычислительные мощности гораздо ближе к DRAM — быстрым чипам кратковременной памяти, которые хранят данные, активно используемые процессором, — что позволяет выполнять рутинные операции с данными вблизи памяти, без дорогостоящих циклов обмена между CPU, GPU и памятью.
🤖 Робототехника
Figure заключает коммерческое соглашение с Catalyst Brands о масштабном внедрении человекоподобных роботов. Figure подписала коммерческое соглашение с Catalyst Brands о внедрении своих человекоподобных роботов следующего поколения в коммерческие дистрибьюторские и логистические сети. Внедрение начнется в дистрибьюторском логистическом центре Catalyst в Рино, штат Невада, где антропоморфные роботы будут сосредоточены на автоматизации физически тяжелых и рутинных задач по сортировке и упаковке в цепочке поставок.
EngineAI вступает в производственную гонку: один человекоподобный робот каждые 15 минут на новой базе в Шэньчжэне. EngineAI официально ввела в эксплуатацию свою базу интеллектуального производства в районе Наньшань города Шэньчжэнь, заявив о темпах производства одного человекоподобного робота каждые 15 минут. Компания стремится к «масштабным поставкам на уровне десятков тысяч единиц»,.
NVIDIA Research продвигает робототехнику от симуляции к реальному миру. Представленные на Международной конференции по робототехнике и автоматизации, восемь новых исследовательских работ NVIDIA Research показывают, как роботы, обученные в симуляции, переходят в реальный мир.
Человекоподобные роботы Figure получают работу в розничной торговле в логистическом центре Catalyst Brands в Рино, материнской компании JCPenney и Aeropostale
OpenAI запускает кампанию по найму сотрудников в свое подразделение робототехники для создания роботов для реального мира с использованием совместного проектирования аппаратного обеспечения полного стека и машинного обучения. Первые роботы будут поддерживать работников на инфраструктурных проектах.
Waymo выпустит Ojai, более просторное роботакси, созданное совместно с Zeekr от Geely, для публичных поездок без водителя.
⚖ Регулирование
Представитель Иллинойса обсуждает законопроект, который будет регулировать деятельность ИИ-компаний.
CNN подает в суд на Perplexity AI за незаконное копирование и распространение своих новостных материалов
ЕС готовит чрезвычайные полномочия для отмены контрактов на поставку микросхем во время их дефицита, в то время как IBM ставит 10 миллиардов долларов на создание надежного крупномасштабного квантового компьютера к 2029 году.
Основатели компаний используют решение индийского суда для возобновления критики рекламного бизнеса Google. Недавнее решение индийского суда против практики контекстной рекламы Google привлекло новое внимание после того, как основатели заявили, что конкуренты давно используют эту систему для переманивания клиентов и вынуждения компаний платить за защиту собственных брендов.
🏢 Приобретения
Asana приобретает StackAI, конструктора ИИ-агентов без кода.
📱 Приложения
Robinhood запускает агентский трейдинг и анонсирует кредитную карту для ИИ-агентов с кэшбэком 3%.
Производитель из центрального Нью-Йорка оседлал волну «золотой лихорадки» ИИ и удвоил мощности, чтобы удовлетворить взрывной спрос от дата-центров для ИИ.
Ознакомьтесь с реальными прототипами ИИ из Futures Lab. Несколько ярких проектов последних двух лабораторий включают: Kanji Garden: Приложение, которое обучает японскому языку через иммерсивные, сгенерированные ИИ истории и визуальные образы вместо зубрежки. SignFluent: Инструмент для изучения американского жестового языка в реальном времени, который обеспечивает мгновенную обратную связь по вашей технике исполнения. MuscleMemory: Мобильный инструмент для тренировок по калистенике, который использует отслеживание с помощью ИИ-камеры для обеспечения мгновенной голосовой обратной связи по технике выполнения упражнений, помогая предотвратить травмы.
Этот ИИ-стартап будет убирать ваш дом бесплатно, чтобы обучать роботов будущего. Стартап по обучению ИИ Shift хочет убирать ваш дом бесплатно. Подвох — потому что, несмотря на то, что написано на их сайте, подвох есть всегда — заключается в том, что они будут записывать уборщиков, пока они моют, пылесосят, вытирают пыль, наводят порядок и стирают, и использовать эти записи для обучения роботов.
⚠ Безопасность ИИ
Push Security раскрывает детали вредоносной кампании LLMShare, злоупотребляющей общими ссылками ChatGPT и Claude. Злоумышленники используют функции обмена контентом на платформах ИИ-чат-ботов — ChatGPT и Claude — для доставки вредоносного ПО через страницы, размещенные на легитимных, доверенных доменах, распространяя вредоносные ссылки через спонсируемую вредоносную рекламу в поисковых системах.
Красная команда Института безопасности ИИ Великобритании взломала ChatGPT за шесть часов без специального доступа
Вредоносные пакеты npm, созданные с помощью Claude AI, эксфильтрируют файлы из каталога пользовательских данных Claude Code mnt в репозитории GitHub злоумышленников
Google внедряет автономную защиту от хакеров. Google Cloud представила новую платформу безопасности «AI Threat Defense», которая реагирует на быстрые атаки с помощью ИИ. Система не только обнаруживает уязвимости, но и с помощью ИИ-агентов самостоятельно пишет подходящий код для их немедленного устранения.
>>1627536 Гемини юзают только для красивых текстов, за фактами пиздуют в GPT-5.x searh/high, который имеет самый низкий процент галлюцинаций на рынке, за кодом идут в клод.
МУЗЫКАЛЬНЫЙ №22 /music/
Аноним29/05/26 Птн 21:42:17№1621953Ответ
1. Suno https://suno.com/ Вышла версия 5.5 (но для тех кто платит денюшку), качество моделей постепенно улучшается: звук, понимание концепций, набора различных жанров. Но в то же время все сильнее урезается для бесплатных юзеров: осталось только 5 бесплатных генераций в день на аккаунт, а также по заявлением некоторых анонов, модель для генерации на бесплатке (на момент создания треда использовалась 4.5) ухудшили. Спам аккаунтами пока что работает. Купить подписку из РФ: 1. https://payment.mts.ru/tools/suno-ai 2. https://plati.market/games/suno-ai/1701/
2. Tunee https://www.tunee.ai Хороший звук, более-менее понимание концептов, но тоже сильно урезан для бесплатных юзеров: режет концепты в промптах, плюс произвольно определяет "цену" за каждую генерация исходя из какой-то "сложности запроса". И получается, что если с бесплатки забацаешь промпт сложнее банальщины "Make cool rock about love for youtube" он может решить что у тебя нет кредитов для такого сложного запроса и пошлет нахуй. Способов оплаты из РФ неизвестно.
3. Sonauto https://sonauto.ai/ Как по мне, недооценённая вещь, особенно учитывая что недавно он обновился до 3.0, который очень даже разъебывает. Но он тут более ограничен тегам и понимает чисто какие-то жанровые теги, гибкости поменьше. Но зато пока что халявный и не ограничен кредитами, генерируй пока есть настроение.
Потихоньку развиваются, стоит внимания ACE-STEP 1.5: https://github.com/ace-step/ACE-Step-1.5 Звук уже на уровне раннего Suno ~2.0-3.0, аноны делают на нем уже приемлемые результаты и постят в тред. Если есть хотя бы 12 GB VRAM и хочется генерировать без цензуры и подписок - можете юзать.
МЁРТВЫЕ ГЕНЕРАТОРЫ
1. Udio (udio.com) - куплен Warner Bros, но затем сами Warner Bros сдали назад и откатили сделку. Но уже успели испортить, больше нельзя скачивать треки, их только доставать из буфера в 160 кбит/с. Плюс непонятно как работающая цензура, которая не дает генерировать треки с определенными тегами. Плюс уже год ебут один и тот же 1.5 allegro. 2. Riffusion, Producer.ai (producer.ai) - куплен гуглом, удалены все старые относительно норм модели, вместо этого запихали безальтернативную каловую модель, которая и промпты сложнее самых нормисных в духе "make cool rock about love" не понимает, и вокал смазывает в какую-то кашу. При этом еще и максимально дегенеративная цензура, которая режет чуть ли не любые попытки сделать просто что-то не попсовое и не "музыку для ютуб".
ПРОЧИЕ ПОЛЕЗНЫЕ УТИЛИТЫ
1. https://www.bandlab.com/mastering Быстрый мастеринг в две кнопки, если хочешь чтобы звучало более слушабельно, но не имеешь навыков в DAW или аудиоредакторах (или лень). 2. https://morpher.ru/accentizer/ Если генерируешь музыку с лириками на русском, то очень часто случается, что твой генератор путает ударения в словах. Прежде чем пихать свою графоманию в генератор, проставь ударения в сервисе по ссылке. И уже из этого сервиса копируй текст в генератор. По крайней мере в Suno это помогает.
>>1627479 Я сэмплы с какого-то сайта скачал, штук 20, из них большинство не дало загрузить. Скорее всего я просто не первый их туда заливал. Но те сэмплы, которые я миллион лет назад сам делал в редакторах-генераторах - все норм загрузились. А вообще конечно основная масса музыки это один и тот же кал, особенно электронная.
>>1627501 >особенно электронная. Разнообразие зависит не от жанра, а от того как сложена композиция. Металлику же тоже можно говном назвать, 90% их песен, где уникальными будут только отдельные рифы вступления и проигрыша.
Мне нравится электронная музыка, но я не слушаю как дебил все подряд, т.к. меня привлекает только мелодичность и уникальность трека, а это те-же самые 5-10%. Ты же видел группы, которые буквально 1-2 трека выстрелят и все, альбомы их слушать невозможно.
Нужна помощь бомжу
Аноним05/06/26 Птн 12:41:40№1625940Ответ
Короче, ребята, нужна помощь бомжу с 4gb vram. Что есть типа DeepNude, но локальное и нетребовательное, желательно без слишком сложной установки? Остальные характеристики ПК: Ryzen 5 4500, 8x2 ddr4 ram
>>1625940 (OP) О, у меня тоже 4Гб vram, зато обычной оперативы 64Гб, этого хватает даже на генерацию видосов в comfyui, причём это занимает не вечность по времени (но качество шакальное, хотя это от модели зависит). Касательно 8×2 ram как вариант в comfyui взять плагин на gguf, либо скомпилить под видеокарту stable-diffusion.cpp, а потом запускать с флагом -- n-gpu-layers [число слоёв], если, конечно, там такое есть. Может показаться, что возни многовато, но на самом деле в случае с stable-diffusion.cpp достаточно просто в аргументах командной строки прописать необходимые модели.
>>1627428 А, ещё добалю, что наверняка полно приложух на основе stable-diffusion.cpp, которые позволяют избежать работы в командной строке. Об этом можно почитать в readme.md проета в разделе сопутствующих проектов.
ИТТ обсуждаем опыт нейродроча в своих настоящих задачах. Это не тред "а вот через три года" - он тол
Аноним24/12/22 Суб 16:39:19№3223Ответ
ИТТ обсуждаем опыт нейродроча в своих настоящих задачах. Это не тред "а вот через три года" - он только для обмена реальными историями успеха, пусть даже очень локального.
Мой опыт следующий (golang). Отобрал десяток наиболее изолированных тикетов, закрыть которые можно, не зная о проекте ничего. Это весьма скромный процент от общего кол-ва задач, но я решил ограничится идеальными ситуациями. Например, "Проверить системные требования перед установкой". Самостоятельно разбил эти тикеты на подзадачи. Например, "Проверить системные требования перед установкой" = "Проверить объем ОЗУ" + "Проверить место на диске" + ... Ввел все эти подзадачи на английском (другие языки не пробовал по очевидной причине их хуевости) и тщательно следил за выводом.
Ответ убил🤭 Хотя одну из подзадач (найти кол-во ядер) нейронка решила верно, это была самая простая из них, буквально пример из мануала в одну строчку. На остальных получалось хуже. Сильно хуже. Выдавая поначалу что-то нерабочее в принципе, после длительного чтения нотаций "There is an error: ..." получался код, который можно собрать, но лучше было бы нельзя. Он мог делать абсолютно что угодно, выводя какие-то типа осмысленные результаты.
Мой итог следующий. На данном этапе нейрогенератор не способен заменить даже вкатуна со Скиллбокса, не говоря уж о джунах и, тем более, миддлах. Даже в идеальных случаях ГПТ не помог в написании кода. Тот мизерный процент решенных подзадач не стоил труда, затраченного даже конкретно на них. Но реальная польза уже есть! Чатик позволяет узнать о каких-то релевантных либах и методах, предупреждает о вероятных оказиях (например, что, узнавая кол-во ядер, надо помнить, что они бывают физическими и логическими).
И все же, хотелось бы узнать, есть ли аноны, добившиеся от сетки большего?
>>1623385 >Музыку, картины, фильмы тоже не запоминаешь И ладно. У меня нет целей все зафиксировать и запомнить, только то, что вызвало какие-то яркие эмоции. Если послушал новый альбом и он как-то по-особому откликнулся, то запишу, есть прицеденты.
>>1623679 Не понял. Тебе сегодня понравилась песня, ты зафиксировал и забыл. Через неделю ты услышал эту же песню, ты опять фиксируешь или ты помнишь свои ощущения?
>>1620862 Я проверил мединцкие протоколы на системах и структурах. Работает. И дает четкий абсолютно сигнал. Вкратце в всяких США сейчас ебейший кризис, вот прям сейчас. Просто сдерживают эмоции, чтобы все не охуели. Присмотрись к региональным, мелким банкам (их около 1к.) им всем пизда. Волна уже пошла. Останется около 6-10 банков во всей США. Вся коммерческая недвига тоже ебанется.
Обсуждаем развитие искусственного интеллекта с более технической стороны, чем обычно. Ищем замену надоевшим трансформерам и диффузии, пилим AGI в гараже на риге из под майнинга и игнорируем горький урок.
Я ничего не понимаю, что делать? Без петросянства: смотри программу стэнфорда CS229, CS231n https://see.stanford.edu/Course/CS229 (классика) и http://cs231n.stanford.edu (введение в нейроночки) и изучай, если не понятно - смотри курсы prerequisites и изучай их. Как именно ты изучишь конкретные пункты, типа линейной алгебры - дело твое, есть книги, курсы, видосики, ссылки смотри ниже.
Почему python? Исторически сложилось. Поэтому давай, иди и перечитывай Dive into Python.
Можно не python? Никого не волнует, где именно ты натренируешь свою гениальную модель. Но при серьезной работе придется изучать то, что выкладывают другие, а это будет, скорее всего, python, если работа последних лет.
Стоит отметить, что спортивный deep learning отличается от работы примерно так же, как олимпиадное программирование от настоящего. За полпроцента точности в бизнесе борятся редко, а в случае проблем нанимают больше макак для разметки датасетов. На кагле ты будешь вилкой чистить свой датасет, чтобы на 0,1% обогнать конкурента.
Количество статей зашкваливающее, поэтому все читают только свою узкую тему и хайповые статьи, упоминаемые в блогах, твиттере, ютубе и телеграме, топы NIPS и прочий хайп. Есть блоги, где кратко пересказывают статьи, даже на русском
Где ещё можно поговорить про анализ данных? http://ods.ai
Нужно ли покупать видеокарту/дорогой пека? Если хочешь просто пощупать нейроночки или сделать курсовую, то можно обойтись облаком. Google Colab дает бесплатно аналог GPU среднего ценового уровня на несколько часов с возможностью продления, при чем этот "средний уровень" постоянно растет. Некоторым достается даже V100. Иначе выгоднее вложиться в GPU https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning заодно в майнкрафт на топовых настройках погоняешь.
Когда уже изобретут AI и он нас всех поработит? На текущем железе — никогда, тред не об этом
Кто-нибудь использовал машоб для трейдинга? Огромное количество ордеров как в крипте так и на фонде выставляются ботами: оценщиками-игральщиками, перекупщиками, срезальщиками, арбитражниками. Часть из них оснащена тем или иным ML. Даже на швабре есть пара статей об угадывании цены. Тащем-то пруф оф ворк для фонды показывали ещё 15 лет назад. Так-что бери Tensorflow + Reinforcement Learning и иди делать очередного бота: не забудь про стоп-лоссы и прочий риск-менеджмент, братишка
Список дедовских книг для серьёзных людей Trevor Hastie et al. "The Elements of Statistical Learning" Vladimir N. Vapnik "The Nature of Statistical Learning Theory" Christopher M. Bishop "Pattern Recognition and Machine Learning" Взять можно тут: https://www.libgen.is
Напоминание ньюфагам: немодифицированные персептроны и прочий мусор середины прошлого века действительно не работают на серьёзных задачах.
Почему никто до сих пор не написал конкретного гайда? В ссылках лишь одна вода, 100500 алгоритмов и результатов на практике нахуй не нужных. Где пошаговый гайд для написания проги которая может генерировати картинку по тексту, например. На псевдокоде, без черных ящиков и ссылок на питоновские библиотеки, только с необходимой для данной задачи Математикой (со всеми доказательствами или ссылками на них), можно в заметках отмечать что "тут мы использовали Х, а в общем случае это У". Где это всё? У нет ни времени ни желания переваривать этот абстрактный кал.
>>1626531 Разобрался сегодня, что я сделал. Получается зашёл с чёрного входа к правилу 110. Реализовал это не через 1,5 мерное пространство, а через 5+ мерное. Ну как реализовал, на отдельных логических операциях проходит проверки, начал тестировать в комплексе и у меня DeepSeek сожрал все оплаченные запросы по API. Но это охуеть как круто, особенно для того кто не разбирается в программировании и вот этом вот всём. Поле не паханное, передний край науки. Теперь хочу реализовать это в железе.
>>1627056 Ты будешь читать стену математических выкладок? Я могу накидать, для начала, какие алгоритмы использовал для EoC (фундаментальные вещи для большинства нейросетей), но что это тебе даст? То, что можно реализовать за неделю используя абстрактное/концептуальное вайброграммирование, на описание этого уйдёт ни один месяц и будет сравни научной работе.
ai age verification (подтверждение возраста) на сайте
Аноним02/06/26 Втр 18:12:59№1624341Ответ
привет дрочеры двачеры! столкнулся с трудностями там, где совсем уж не ожидал. при очередном визите на spankbang обнаружил предложение пройти процедуру верификации возраста. процедура довольно простая - доки не нужны, просто лицом в камеру посветить. мне то лет уже достаточно, но светить родным ликом в камеру перед каким-то ИИ, сгенерированным другим ИИ я не хочу. посему встал вопрос - как пройти эту проверку, не "спалив свой фейс?" смена региона для слабаков - хочу один раз закрыть вопрос и спокойно пользоваться, потому проверку нужно именно пройти, а не обойти требование подтверждения возраста.
пробовал показывать камере смарта фотки футболистов - фейлишь несколько попыток, после чего идёшь нахер презагружаешь страницу. и так по кругу.
пробовал OBS virtual camera и видос с "говорящей головой" в качестве источника - сразу схлопывает, говорит прошёл, но доступа к сайту так и не даёт. и так по кругу.
помогайте, умники и умницы! у меня там в разделе "favorites" сохранены очень важные видео, которых на других ресурсах не найти. очень нужно восстановить доступ.
🎤🔊 ОБСУЖДАЕМ ПРЕОБРАЗОВАНИЕ ТЕКСТА В ГОЛОС И КЛОНИРОВАНИЕ ГОЛОСОВ 🔊🎤 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🌟 ТОП ЛОКАЛЬНЫХ МОДЕЛЕЙ ПО КАЧЕСТВУ РУССКОГО ГОЛОСА НА МАРТ 2026 🌟
🐟👑 Fish-Speech S2 Pro (FishAudio) — SOTA, ElevenLabs на локале! → zero-shot клон от 10–30 сек записи → 80+ языков (русский топ), теги эмоций [excited], [whisper], [angry], [laughing] и вообще дохуя → диалог между несколькими голосами → тяжёлая сучка (FP8 в 12 ГБ VRAM, full ~17 ГБ), но есть экспериментальный вариант для 6+ ГБ https://github.com/rodrigomatta/s2.cpp 🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹 🧠 Qwen3-TTS → клон от 3–30 сек (ВАЖНО: без reference-транскрипта текста — хуйня, если хочешь поудобнее подключи сразу QwenASR) → VoiceDesign: пишешь «весёлая молодая девка с хрипотцой» — и получаешь голос → 10 языков, включая русский → диалог между спикерами → лёгкая — влезает в 6 ГБ VRAM 🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹 🎙️ VibeVoice-7B от Майкрософт → тяжёлая, но 4-bit квантизация — запускается на 8 ГБ (проверено на 3070) → поддержка долгих спичей → подкаст-режим: 4 спикера одновременно → норм клонирование голоса 🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹 ☁️ FL CosyVoice3 → ультралёгкий 0.5 — запустится даже на тостере → 9 языков, включая русский → zero-shot клон от 3–10 сек референса 🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹 🌍 Chatterbox Multilingual (23 языка, включая русский) → zero-shot клонирование голоса 🎤 F5-tts → zero-shot клонирование голоса → официально русский не поддерживается, но есть файнтюн (см. ниже) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 🚀 КАК ЭТИМ ПОЛЬЗОВАТЬСЯ (если что-то не понятно — спроси у ИИ лол) 🚀
🔥Вариант «всё в одном месте» — ComfyUI + TTS-Audio-Suite
1. Устанавливаем ComfyUI (Desktop для нормисов, Portable для здешних нейромантов) 2. Ставим https://github.com/diodiogod/TTS-Audio-Suite — постоянная обновляемая солярка почти всех моделей 3. Поставить FFmpeg (через winget в комадной строке: winget install FFmpeg или скачать) 4. Запускаем Комфи → перетаскиваем готовый json-воркфлоу из репозитория 5. Отсавляем включенными выбранные ноды, жмём Run 6. При первой генерации модели сами скачаются (~1–9 ГБ)
💥 Вариант «по отдельности» (кастом под каждую модель) 💥 Тоже через ComfyUI, только ставим отдельные кастомные ноды (на выбор):
в комфи в ноде F5 TTS audio advanced выбрать: model model:///ru.safetensors model_type: F5TTS_v1_Base sample_audio: emma_ru_xtts_3 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 🎉 Если что-то не запускается — пиши, разберёмся! Голосуем, клонируем, ебём нейросети вместе! 🔥🎙️
>>1576418 так это ж фиш аудио S2 у неё модель даже среднего размера всю vram займет с ней даже бояре напрягаются, а например на 5070ti bnb nf4 только нормально будет пахать, а это самая урезанная версия. Такая вот нейронка, которая по ресурсам жирнее чем видеомодели. но звук хороший генерирует, факт
2. higgs-audio-v3-tts (тоже самое что и Qwen3 только с возможностью контроля эмоции и экспрессий) - хуже чем dots.tts (но у него нету контроля эмоций, поэтому хз) в общем аудио приблуда сделанная для их собственного видео-генератора, как видно тут https://www.youtube.com/watch?v=qpXbU5011Pw (самой их видео модели у нас нет) https://github.com/Saganaki22/Higgs_v3-TTS-ComfyUI - кастомная нода для этой новинки
Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.
>>1626973 >слоп Как же достало это слово. Сейчас либой АИ арт зовут слопом, я буду банить любого в соцсетях кто так пишет. Почему если нейронки такие плохие, то у меня к ним болше интереса, чем к аниме 80х говодов отрисованных вручную в 24 фпс?
Пытаюсь на 5070ti через LTX сгенерировать 20 сек. видео в 1024х1024, но на выходе получаю пустоту, приходится или длительность или разрешение уменьшать. Это можно обойти программными методами, может за счет времени генерации?
Арена и aistudio закрыли бесплатный доступ к nano banana 2 и pro. Вопрос к тем, кому она нужна, как единственная модель, которая нормально переносит контекст персонажа, где её сейчас найти? Вроде как сейчас она есть на офке gemini, но в шакальном качестве, есть актуальные бесплатные варики для выставления 2К с демократическими лимитами?
Но я в рб живу, поэтому мало чем помогу. Без ВПН пишет что регион заблокирован, но при этом аккаунты не банят.
Поэтому подозреваю, что это со стороны корпов решение блокировать аккаунты зашкваренные об русский айпи или кукасы.
ВПН подойдёт любой рабочий. Но нужно скачать новый браузер специально для нейронок, включить ВПН и не выключать. Затем создать аккаунт гугловский. Но я хз какой должен быть ВПН чтобы по приколу не выключаться и не палить реальный айпишник лол.
Думаю, контейнер в firefox может создавать среды чистые от кукасов, где можно аккаунт новый регать. Там проёб аккаунта не такой быстрый. Плюс вроде бы у firefox есть встроенный бесплатный ВПН, но не уверен что это в РФ доступно всё.
А может быть это не корпы аккаунты блочат, а Пыпа - ВПН. Тогда нужно просто рабочий ВПН найти
>>1623513 Надо скриншот, что пишет. Может быть у меня без ВПН другая надпись будет и можно будет вычислить со стороны Пыпы это или со стороны корпов. Вот мне такую надпись выдаёт. Впн включаю и захожу в аккаунт спокойно.
В этом треде обсуждаем нейронки генерящие 3д модели, выясняем где это говно можно юзать, насколько оно говно, пиплайны с другими 3д софтами и т.д., вангуем когда 3д-мешки с говном останутся без работы.