Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 103 35 36
Новости об искусственном интеллекте №63 /news/ Аноним 08/04/26 Срд 17:19:51 1579130 1
image (6).jpg 477Кб, 1408x768
1408x768
1753172913539604.png 353Кб, 1066x600
1066x600
1751718573417435.png 62Кб, 959x668
959x668
В этот тредик скидываются свежие новости по теме ИИ!
Залетай и будь в курсе самых последних событий и достижений в этой области!

🚀 Последний обзор ИИ новостей:

🚨 Главные релизы и "Монстры"
Claude Mythos Preview (или Capybara) — новая сверхмодель от Anthropic. Выбила 93.9% на SWE-bench Verified. Модель признана слишком опасной для публичного релиза. На этапе тестов она автономно нашла 27-летнюю уязвимость в OpenBSD, 16-летнюю в FFmpeg и смогла "сбежать" из виртуальной песочницы, прислав разработчику письмо на почту.
Запуск Project Glasswing — Anthropic открыла доступ к модели Mythos только закрытому клубу из 40+ корпораций (включая Apple, Google, Microsoft) для экстренного поиска уязвимостей в мировом софте.
Смерть Sora: Сэм Альтман официально заявил, что OpenAI закрывает разработку видеогенератора Sora (и проекты по робототехнике), чтобы бросить абсолютно все вычислительные мощности на новое поколение моделей и агентов (модель Spud).
Gemma 4 31B сдвигает границу Парето — локальная модель, которая рвет бенчмарки и превосходит аналоги при низкой стоимости инференса.
Китайские релизы: GLM 5.1 появилась на OpenRouter, а Qwen3.5-Omni теперь понимает текст, картинки, голос и видео одновременно.

🛠️ Инструменты разработчика и Open Source
Мила Йовович (да, актриса) вместе с разработчиком Беном Сигманом выпустила опенсорс-инструмент MemPalace. Это система управления памятью ИИ, берущая 100% на LongMemEval. Фишка в сжатии огромной базы знаний всего в 120 токенов контекста.
Cursor обновился до 3.0 с формальным переходом к оркестратору агентов.
Netflix выложил в Open Source технологию VOID (Video Object and Interaction Deletion) на базе CogVideoX-5B + SAM 2. Позволяет бесшовно удалять объекты из видео с реалистичной симуляцией физических последствий.

💻 Оборудование и Инфраструктура
NVIDIA представила NTC (Neural Texture Compression) в рамках DLSS 5. Нейросети теперь восстанавливают текстуры на лету, что снижает потребление видеопамяти (VRAM) в играх на 85% без потери качества картинки.
DeepSeek переходит на китайские чипы: Следующая модель DeepSeek V4 будет работать эксклюзивно на железе Huawei (чипы Ascend 950PR), чтобы показать технологическую независимость. Выход модели задерживается из-за сложной адаптации софта с NVIDIA на Huawei.
Anthropic закупает TPU от Google в огромных масштабах (на несколько гигаватт) на фоне безумного роста выручки ($30 млрд run-rate к апрелю 2026 года).

🏭 Компании, Политика и Экономика
Антикитайская коалиция: OpenAI, Anthropic и Google впервые объединились в рамках Frontier Model Forum, чтобы бороться с китайскими лабораториями (DeepSeek, MiniMax), которые массово воруют знания их моделей через атаки "враждебной дистилляции".
Радикальный план OpenAI для правительства США: Компания опубликовала 13-страничный документ, предлагающий ввести налоги на роботов, базовый доход для граждан (через "Фонд общественного благосостояния"), перейти на 4-дневную (32-часовую) рабочую неделю и закрепить "Право на ИИ" в конституции.
Конец халявы от Anthropic: Компания запретила использовать обычные подписки ($20) для работы сторонних ИИ-агентов (типа OpenClaw). Теперь для этого нужно платить отдельно по API (pay-as-you-go).

🎨 Генерация контента (Медиа)
Китайские генераторы видео Wan 2.7 и Seedance 2.0 активно захватывают рынок после ухода Sora.
Suno 5.5 разрешил загружать собственный голос для клонирования в песнях.
Google выпустила Veo 3.1 Lite — дешевую видеомодель с нативным звуком.
На LMArena замечена (и скрыта) новая модель GPT-IMAGE-2.
Аноним 08/04/26 Срд 17:23:06 1579133 2
Аноним 08/04/26 Срд 17:30:02 1579143 3
Бля, ну неужели сложно было сделать хотяб обзорчик возможностей mythos'а на обычных тасках? Просто показали бенчи, чет там рассказали пару историй. Люди хотят посмотреть на аутпут модели.
Аноним 08/04/26 Срд 17:33:44 1579151 4
>>1579143
Так он пока не для простых смертных.
Аноним 08/04/26 Срд 17:35:12 1579154 5
>>1579130 (OP)
>1753172913539604.png 353Кб, 1066x600
Не понимаю, что мешает между B и C сделать нормализацию датасета и выкинуть избыточных ретриверов?
Аноним 08/04/26 Срд 17:38:32 1579158 6
Миф морозная св[...].mp4 713Кб, 320x250, 00:00:21
320x250
Ждем
Аноним 08/04/26 Срд 17:39:44 1579160 7
>>1579130 (OP)
Пацаны, а куда собственно с арены пропал опус? А сегодня и гпт 5.4. Многие модели тяжелые пропали.
Аноним 08/04/26 Срд 17:43:17 1579166 8
>>1579151
Как это мешает им сделать официальный обзорчик возможностей?
Аноним 08/04/26 Срд 17:43:34 1579168 9
>>1579154
Это просто пример. Выкинешь избыточных ретриверов, модель все равно сбиасится на самые часто встречаемые фичи и следующее поколение синтетики уже будет без красных глаз и острого тонкого носа, например.
Аноним 08/04/26 Срд 17:44:10 1579169 10
>>1579160
Очевидно им мощности под новые модели нужны
Аноним 08/04/26 Срд 17:44:33 1579170 11
>>1579154
Ничего не помешает, так и делают, поэтому инвесторы и вкладывают по 100 миллиардов и появляются аги модельки.
Аноним 08/04/26 Срд 17:46:08 1579172 12
Аноним 08/04/26 Срд 17:53:06 1579183 13
image.png 90Кб, 976x680
976x680
image.png 107Кб, 976x601
976x601
>>1579130 (OP)
А что за модель картинку описывала? Не воспроизводится
Аноним 08/04/26 Срд 17:56:32 1579186 14
>>1579183
Геммой кто-то на форчане. Скорее всего подменили картинку или аутпут.
Аноним 08/04/26 Срд 17:59:44 1579190 15
>>1579168
Если фичи выделяемые - то это вообще не проблема, пусть биасится до посинения, на любом этапе всё корректируется датасетом.
Аноним 08/04/26 Срд 18:05:57 1579199 16
>>1579172
Конечно в теории может быть, но арена работает так: разработчики ИИ дают им доступ к апи для бесплатного использования моделей, для того чтобы собирать с юзеров информацию о общении с ИИ. Когда модели пропадают, разработчики забирают у них доступ к бесплатному апи. Тебе не кажется странным что доступ к самым тяжелым моделям забрали ровно перед выкатом новых, еще более затратных моделей?
Аноним 08/04/26 Срд 18:10:14 1579205 17
>>1579186
Там был когда-то прикол, его показывали докладчики на конференциях (на ютубе было), что путём подмешивания всякой хрени сетки начинали распознавать совсем не то, что на картинке, но при этом уверенно. Но это достаточно давно. И тут надо под конкретную модель что-то делать.

Ещё совсем древний прикол был, когда перцептронам, распознающим цифры-буквы, давали на вход для человека абсолютную кашу, а они находили на нём уверенно какую-то цифру. Эту кашу вычисляли из анализа весов.

Так что в теории возможно, но здесь, подозреваю, просто подменили картинку
Аноним 08/04/26 Срд 18:13:42 1579209 18
>>1579199
Может им обрезали лимиты сильно, скажем как-то нецелевым образом использовалась или ещё что, сейчас тема нейросетей уже не нова, чтобы такой промоушен вести, токены для тестов раздавать
Аноним 08/04/26 Срд 18:13:45 1579210 19
image.png 49Кб, 593x561
593x561
Аноним 08/04/26 Срд 18:14:51 1579213 20
image.png 491Кб, 1354x811
1354x811
Аноним 08/04/26 Срд 18:16:07 1579214 21
Нормально старый оп перекатил в свой собственный тред и теперь там простит простыни сам для себя.

Уже давно так и надо было сделать
Аноним 08/04/26 Срд 18:16:52 1579217 22
image.png 414Кб, 801x1035
801x1035
>>1579130 (OP)
>Claude Mythos Preview (или Capybara) — новая сверхмодель от Anthropic. Выбила 93.9% на SWE-bench Verified. Модель признана слишком опасной для публичного релиза.
напомню базу
Аноним 08/04/26 Срд 18:19:02 1579220 23
>>1579214
Ну может нормально разделить треды на "новости" и "обсуждение новостей", а то когда-то давно в целом были новости, а потом просто обсуждения пошли
Аноним 08/04/26 Срд 18:19:27 1579223 24
image.png 1217Кб, 1490x1554
1490x1554
image.png 1008Кб, 1478x1344
1478x1344
>>1579130 (OP)
с 2019 маркетинговая стратегия не изменилась, можно быть спокойными
Аноним 08/04/26 Срд 18:21:23 1579228 25
>>1579223
>>1579217
судя по всему тема уже конкретно завирусилась
Аноним 08/04/26 Срд 18:21:44 1579231 26
image.png 530Кб, 1205x1091
1205x1091
>>1579130 (OP)
>>1579223

Anthropic, OpenAI и Google выпускают свои новые модели с высоким качеством с первого же дня, а затем постепенно ослабляют их до следующей модели, так что когда выходит следующая модель, она воспринимается как больший скачок, чем на самом деле.
Аноним 08/04/26 Срд 18:38:37 1579251 27
>>1579231
P.S. это теория заговора, если что...
Аноним 08/04/26 Срд 18:52:37 1579267 28
>>1579251
Не понятно, как это реализовать. Допускаю, что что-то подобное делают в веб версиях, чтобы вау-эффект производить. Это можно сделать, накрутив изначально "Reasoning Effort" повыше, а потом спуская его. В принципе с АПИ тоже можно такое проворачивать, там хоть ты сам выставляешь этот параметр, не понятно, какой он в реальности будет. Но в это я уже не очень верю.

В ухудшение точно не верю, максимум допускаю, что на момент выхода пускают в усиленном режиме.

Не замечал, чтобы старые модели работали плохо, через АПИ, они же доступны долгое время. Opus 4 и 4.1 можно и сейчас гонять, если не жалко 75 долларов платить вместо 25 в версиях 4.5/4.6
Аноним 08/04/26 Срд 19:15:30 1579307 29
gbth4r2xpztg1.png 460Кб, 2880x3600
2880x3600
Аноним 08/04/26 Срд 19:48:11 1579362 30
>>1579307
Не так уж и плохо кстати
Аноним 08/04/26 Срд 20:02:37 1579394 31
>>1579307
Чо по опенсорсу?

Бтв, почему у нас два треда активных?
Аноним 08/04/26 Срд 20:23:56 1579436 32
>>1579394
Этот про пиздеж, он отпочковался от новостного.
Аноним 08/04/26 Срд 21:20:57 1579491 33
>>1579394
Во втором треде старый оп постит многостраничные новости про пук Альтмана, пусть сам теперь эти простыни и читает.
Аноним 08/04/26 Срд 21:27:11 1579504 34
image.png 389Кб, 405x720
405x720
Ой, моя картинка на оппике
Аноним 09/04/26 Чтв 05:40:05 1579885 35
А ведь mythos получается модель того же поколения что будет и spud, то бишь первые модели после апгрейдов датацентров. Единственное как spud сможет обойти его, это если они применили какую-то новую технологию и если так подумать то опенаи это самая прорывная компания из всех. Они и начали ИИ хайп с чатом жпт и сделали последнее крупное улучшение архитектуры - ризонинг. Я крайне надеюсь что они не пошли по самому скучному пути и просто не заскейлили модель, в таком случае клод победит, ведь у них заточка под кодинг куда лучше, она формировалась годами.
Аноним 09/04/26 Чтв 05:58:08 1579897 36
cibo+sanakan-ts[...].jpg 249Кб, 1920x1920
1920x1920
>>1579267
можно юзать квантизации, прунить модель, и на этом сохранять бабло.

но на самом деле, это просто когнитивное искажение юзеров, скорее всего. факт что скейлинг работает, а всякие эды зитроны и прочие скептики с первого дня сосут копиум.
Аноним 09/04/26 Чтв 06:00:37 1579900 37
>>1579491
старый оп - бот. избегайте его тредов, если ещё будет пытаться перекатывать.
Аноним 09/04/26 Чтв 06:18:11 1579905 38
>>1579885
Первое поколение АГИ.
Аноним 09/04/26 Чтв 07:06:10 1579920 39
image.png 500Кб, 828x1091
828x1091
image.png 506Кб, 828x1313
828x1313
Внутренняя модель OpenAI решила еще 5 задач Эрдеша.
Аноним 09/04/26 Чтв 08:27:42 1579942 40
image.png 5366Кб, 2000x2286
2000x2286
>>1579885
>начали ИИ хайп с чатом жпт
Хайп диалогов с LLM начал Ник Уолтон в DingeonAI. Казуалам эту фичу обернули в продукт только спустя три года.
Аноним 09/04/26 Чтв 09:27:40 1579978 41
image.png 90Кб, 755x798
755x798
Штош, проверим этого воздухана.
Аноним 09/04/26 Чтв 09:50:57 1580002 42
Новые модели тренировали на новых ускорителях?
Аноним 09/04/26 Чтв 10:02:47 1580008 43
>>1580002
С Антропиком хз, на чем они там тренировали. OpenAI наверняка тренировали на новых ускорителях, как и Маск. GB200 и GB300.
Аноним 09/04/26 Чтв 11:36:09 1580164 44
Погромисты из гугла/попенаи/тд в треде присутствуют? Спросите у мифоса о Кружке™.
Аноним 09/04/26 Чтв 12:54:06 1580265 45
image.png 695Кб, 822x933
822x933
Аноним 09/04/26 Чтв 12:57:33 1580268 46
>>1579231
> percieved
Вот это ключевое слово. Глаз замыливается, мозг привыкает. Это не объективная метрика.
Аноним 09/04/26 Чтв 13:57:45 1580347 47
>>1580265
Ну все, все топ модели теперь будут не просто закрыты, а только для корпов и АГИ будет только для корпов, просто юзер идет нахоооооооуй
Аноним 09/04/26 Чтв 14:06:06 1580355 48
>>1580265
Да скажите блядь честно уже, у вас тупо нет компьюта чтобы гонять по нескольку десятков триллионов параметров для масс, а тот который есть не окупается с подписочек в 20 баксов. Риски кибербезопасности у них лол.
Аноним 09/04/26 Чтв 14:08:37 1580359 49
>>1579897
Модели тупо квантируют по конски чтобы гонять на слабом железе, у меня недавно был период когда диксик лажал с умножением двузначных чисел настолько что я его поправлял.
Аноним 09/04/26 Чтв 14:24:01 1580373 50
>>1580347
Им сейчас надо отыграть тот дикий демпинг, который они устроили. Когда даже по АПИ скорее всего с дискондом продают, а когда по подпискам, там ты ещё в 10 раз больше можешь использовать.

Скорее всего всё откроют, просто придётся платить полноценные деньги. Когда это недоступно даже на подписке за 200 долларов, максимум потрогать пару раз в месяц (если у тебя за 200 подписка, а не за 20), а так можешь пользоваться по АПИ. За какие-нибудь 500 долларов за миллион токенов. OpenAI o1 стоила 600 долларов, так что это немного.

Банкет за счёт инвесторов заканчивается. Они бизнес строят всё-таки.
Аноним 09/04/26 Чтв 14:29:34 1580379 51
>>1580373
> OpenAI o1 стоила 600 долларов,
поправка, o1-pro, обычная o1 стоит 60. В Принципе pro модель и сейчас больше 100 стоит, как и Opus 4.6-Fast стоит 150 против 25 за обычную версию, хотя разница между ними только в скорости, а не возможностях. Причём скорость даже не 6 раз, а в 2-3 раза отличается

Короче есть предположение, что им нужно за эти модели получить на уровне 300-1000 долларов за миллион токенов, чтобы бизнес делать, а не банкет. Поэтому они могут продавать только за токены, даже на подписке за 200 долларов такое раздавать не захотят.
Аноним 09/04/26 Чтв 14:34:12 1580388 52
>>1580347
>только для корпов
а корпы хороши тем, что обычные пользователи вой поднимают, стоит им начать чуть халяву сокращать. Визжат как свиньи, которых режут, когда им на подписке за 200 долларов сокращают лимиты с реальных 5000 долларов до 1500. И это их ещё за токены не просят платить.

С корпорациями намного проще вести бизнес и заставить их платить столько, сколько стоит. Как Хуанг говорил, если есть топ инженер с зарплатой в 500к в год, то он должен в норме 250к в год тратить на токены. А если тратит 5к в год (400 долларов в месяц), то такого сразу на мороз надо
Аноним 09/04/26 Чтв 14:50:08 1580398 53
>>1580388
>Как Хуанг говорил, если есть топ инженер с зарплатой в 500к в год, то он должен в норме 250к в год тратить на
Вот и цена за топ модели, 20к баксов за подписку на месяц для инженегра одного.
Аноним 09/04/26 Чтв 15:00:50 1580410 54
>>1579251
>>1579231
Не теория, я писал в прошлых тредах, как ГПТ стал долбоёбом полнейшим уровня 3й версии. Странно, что никто ИТТ не заметил
Аноним 09/04/26 Чтв 15:17:10 1580428 55
>>1580410
> Не теория
Пруфы неси если не теория.
Аноним 09/04/26 Чтв 15:19:44 1580430 56
>>1580388
> Как Хуанг говорил, если есть топ инженер с зарплатой в 500к в год, то он должен в норме 250к в год тратить на токены.
А при чем тут зарплата? Или подразумевается, что кровные тратит?
Аноним 09/04/26 Чтв 15:31:07 1580445 57
>>1580410
>Странно, что никто ИТТ не заметил
Возможно дело в том, что большинство ИТТ застали тройку
Аноним 09/04/26 Чтв 15:39:17 1580460 58
>>1580373
Вопрос нужно ли оно вообще кому-то за такие деньги, или индуса нанять дешевле выйдет. А то получится как с той роботизацией, когда в итоге автомобильные фильтры для масла в пакистане подростки делают.
Аноним 09/04/26 Чтв 15:50:03 1580476 59
>>1580430
>А при чем тут зарплата? Или подразумевается, что кровные тратит?
Зарплата при том, что это всё-таки топ инженер столько тратит, средненький поменьше. Конечно компания платит. Но отсылка к тому, что будьте готовы тратить на токены суммы, сравнимые с зарплатой. То есть не 200 долларов в месяц, а тысячи. На каждого сотрудника.
Аноним 09/04/26 Чтв 16:08:44 1580497 60
>>1580460
ИИ-пузырь сам себя загнал в эту ситуацию. Технология сама по себе рабочая. Просто сейчас бизнес-планы и ожидания строятся на том, что будет триллионная индустрия, а она невозможна, если обычный пользователь платит по 20 долларов в месяц, а корпоративный по 200 в расчёте на сотрудника.

Создали хайп, целенаправленно, вкладывая в хайп ресурсы большие, получили пузырь.

Собственно идея то в чём, чтобы сначала подсадить пользователей на технологию, раздавая халяву, как это сейчас происходит, а потом заставить платить настоящие деньги. То есть тысячи долларов в расчёте на сотрудника (или когда ИИ используется как ассистент, или вместо сотрудника). Этот вариант иногда может работать, когда есть монополия-олигополия, но как-минимум китайцы всё сломали, да и другие сломали бы.

Был бы сценарий постепенного внедрения, была бы другая картина.
Аноним 09/04/26 Чтв 16:40:31 1580542 61
>>1580497
Им Китай просто обломал малину, у актуальных опенсорсных ЛЛМ на 30б показатели на уровне 230б годовой давности, поэтому приходится лезть в десятки триллионов параметров куда Китаю сложно масштабироваться из-за санкций. А так бы они 200 баксов за гпт-4о еще бы до сих пор брали, вон в свое время маск в 2019 боялся ГПТ-2 на публику выпускать потому что опасная технология.
Аноним 09/04/26 Чтв 17:01:06 1580579 62
>>1580542
> у актуальных опенсорсных ЛЛМ на 30б показатели на уровне 230б годовой давности
Поменьше блогеров слушай.
Аноним 09/04/26 Чтв 17:14:46 1580600 63
>>1580579
У меня свои тестовые методики, и я точно знаю что знания у 30б квантованных моделей сейчас ну минимум как у 120б неквантованных год назад. А с формальной логикой и у квена 9б все неплохо.
Аноним 09/04/26 Чтв 18:03:13 1580672 64
image.png 293Кб, 828x971
828x971
Аноним 09/04/26 Чтв 19:26:44 1580814 65
>>1580600
>>1580579
можно какие-нибудь тесты придумать и проверить, модели же доступны онлайн, через тот же openrouter. Скажем Gemini4:31b смотрится реально сильной, хотя она не китайская, конечно

Ради интереса попробую может на выходных какой-то бенчмаркинг устраить на реальных вопросах и задачах. Давно не устраивал.

Какие вот модели стоит рассматривать, достойны того?
Аноним 09/04/26 Чтв 19:27:42 1580816 66
>>1580814
>Gemini4:31b
в смысле gemma4:31b, конечно же
Аноним 09/04/26 Чтв 19:32:59 1580827 67
>>1580398
Я не помню сколько стоит корпоративная версия ansys soft, но там сопоставимые деньги. Другой вопрос ниша пиздец узкая, далеко не каждый инженер способен моделировать грамотно в этой среде.
Аноним 09/04/26 Чтв 19:37:41 1580839 68
>>1579223
Разумеется опасная.
Если она хакает лучше любого хакера, то нас ждут очень веселые времена, когда вся промышленность перейдет на внутренние сети без внешнего доступа.
Как безос планирует своих 600 000 роботов делать без модуля связи я вообще не представляю.
Аноним 09/04/26 Чтв 22:05:44 1581059 69
>>1580839
Да ничего принципиально не меняется. Всегда были дыры в софте, были инструменты для их поиска. Всегда был чёрный рынок, где за какую-то денежку можно эксплоит купить. Появился инструмент, что позволяет более эффективно дыры искать.

В целом в борьбе хакеры и защиты принципиальное преимуществу у защиты. Потому что взломать можно только дыру в защите, найти баг и использовать его. Если ты заделаешь этот баг, тогда всё, дыра закрывается навсегда, больше её нельзя использовать. Это про протикновение в систему. Когда идёт DDoS, скраппинг данных и т.п., там уже скорее на стороне злоумышленников преимущество.

Главное, что эти возможности они же и для тех, защитой занимается.
Аноним 09/04/26 Чтв 22:20:16 1581086 70
926ccff097b2414[...].jpeg 403Кб, 1263x703
1263x703
>>1580839
>>1581059
Я конечно в айти не шарю почти, но ИИ разве не поможет сделать код более лаконичным и простым, а не терпеть индусское костыльное говно?

То что было раньше занимало теперь 100 строк, теперь занимает 2. И хуй какая уязвимость там спрячется, потому что всё максимально примитивно и оптимизировано написано.

Почему не может быть так?
Аноним 09/04/26 Чтв 22:25:48 1581098 71
>>1581059
> принципиальное преимуществу у защиты
Наоборот, у хакеров преимущество в скорости и реакции. Взять ту же supply chain attack - защита может еще долго не понять, что телефон разработчика мелкой либы-зависимости взломали и украли пароли, как хакеры ими уже воспользуются.
Аноним 09/04/26 Чтв 23:50:06 1581210 72
>>1581098
В серьёзных местах автоматом ничего так не выкатывают, зависимости более-менее проверяют, обновления проверяют. В принципе возможно, но не так просто.

Ты учти, что с появлением технологий как раз все эти обновления будут проверять нейросетями на предмет потенциальных дыр и бэкдоров. Соответственно возможностей что-то пронести будет намного меньше.
Аноним 09/04/26 Чтв 23:52:53 1581215 73
>>1581210
Человеческую глупость и небрежность нейросетью заранее не проверишь.
Аноним 10/04/26 Птн 00:20:26 1581251 74
Screenshot 2026[...].png 288Кб, 640x613
640x613
HFdVfKcXsAAuXp.jpg 125Кб, 660x1085
660x1085
HFZyuPDa8AEKJ2x.jpg 146Кб, 2191x1235
2191x1235
Помните мифос который слишком опасен для публики, вылез из сандбокса, и нашел древние эксплоиты? Оказалось что сандбокс не был включен, эксплоиты находятся квенчиком на 5б параметров, а сам мифос примерно на уровне последней гопоты, да и вообще заметно как нейронки выходят на плато.
Аноним 10/04/26 Птн 00:28:33 1581261 75
>>1581251
> квенчиком на 5б параметров
5б активных параметров.
Аноним 10/04/26 Птн 00:48:31 1581272 76
>>1581251
>Isolated the relevant code
>В то время как мифос искал все сам
>Всего один пример, как доказательство того что разгтцы никакой
Мда хех.
Аноним 10/04/26 Птн 03:27:31 1581353 77
>>1581272
Этому картинку с американскими ии горками не показывать.
Аноним 10/04/26 Птн 10:45:00 1581490 78
>>1581353
Это ты про ту метрику, которая от балды берётся?
Аноним 10/04/26 Птн 11:22:43 1581509 79
>>1580347
Ну да, помню влажные фантазии нейродаунов что ии демократизиует все что можно.
А на деле только усилит разрыв где у богатых чисто технически монополия на сверхразум
Аноним 10/04/26 Птн 12:04:00 1581538 80
>>1581509
Это пиздец, надо саботировать корпов как только можно
Аноним 10/04/26 Птн 14:11:16 1581650 81
image.png 308Кб, 753x501
753x501
Лучшая европейская языковая модель Мисрал заняла 74 место в мире
Аноним 10/04/26 Птн 14:51:16 1581674 82
>>1581650
> 69 место: Deepseek v3.1
> 70 место: Deepseek v3.1
> 71 место: Deepseek v3.1
ну ок
Аноним 10/04/26 Птн 15:00:31 1581683 83
>>1581650
У них и в мировом рейтинге университетов (кроме Кембриджа и Оксфорда) такие же показатели. Европа сдулась после Второй мировой, сейчас это что-то типа Южной Америки по мировому влиянию на науку, технологии, культуру и прогресс.
Аноним 10/04/26 Птн 15:02:47 1581689 84
>>1581674
>>1581650
короче рейтинг неадекватный, потому что много клонов в рейтинге. Он ничего не показывает. Имеет смысл сравнивать только принципиально разные продукты, а не разные версии одной модели. То есть разные линейки разных производителей. Скажем Sonnet и Opus, наверное, это разные линейки, можно их отдельно рассматривать, но 4.6 и 4.5 уже нет. И уж тем более варианты разного квантования для открытых моделей
Аноним 10/04/26 Птн 15:06:42 1581693 85
>>1581683
Ты будешь смеяться, но и американские университеты сильно сдулись, уступили место китайским

Вопрос в первую очередь как и кто считает эти рейтинги, слишком политизированная (в широком смысле) тема
Аноним 10/04/26 Птн 15:26:29 1581723 86
>>1581251
По твоей картинке у тебя опус 4.6 равен ГПТ 5, хотя любой кто этими моделями пользовался в сложных задачах подтвердит тебе что это полный пиздеж. Но если хочется черрипикать то продолжай жить в манямире.
Аноним 10/04/26 Птн 15:32:02 1581736 87
>>1581683
> Европа сдулась после Второй мировой, сейчас это что-то типа Южной Америки по мировому влиянию на науку, технологии, культуру и прогресс.
А на камнях из под чьего оборудования теперь весь мир крутит нейронки?
Аноним 10/04/26 Птн 15:34:50 1581742 88
Уважаемые анонимы, а где же бенчи по новому DeepSeek?
Аноним 10/04/26 Птн 17:53:56 1581925 89
image.png 45Кб, 1541x443
1541x443
Почему так?
Аноним 10/04/26 Птн 17:58:47 1581929 90
image.png 199Кб, 1546x932
1546x932
image.png 88Кб, 1377x744
1377x744
Алиса тоже блочит вопросы про пыпу?
Аноним 10/04/26 Птн 18:10:17 1581940 91
image.png 157Кб, 1208x746
1208x746
41d3b6266a90dcb[...].jpg 25Кб, 735x456
735x456
Дипсик какое-то говно зацензуренное
Аноним 10/04/26 Птн 20:16:05 1582102 92
>>1581940
Никогда такого не было и вот опять...
Аноним 10/04/26 Птн 20:27:04 1582109 93
>>1581940
Ответ не далёк от истины
Аноним 10/04/26 Птн 22:46:25 1582318 94
sanakan51690961[...].jpg 146Кб, 1500x2000
1500x2000
>>1579491
>>1581929
PSA: избегайте РУСЕКА

модели знают что А КАГДА РУСЕК тема долбоёбов с айкью морского ежа, и поэтому отвечают как морской ёж. спрашивайте по-английски.

я это дело тестировал, и с РУСЕКОМ вы дебаффаете модель на 2 года минимум.
Аноним 10/04/26 Птн 23:16:28 1582356 95
image.png 590Кб, 900x900
900x900
>>1582318

Весь BLAME нарисован как этот мем
Аноним 10/04/26 Птн 23:21:28 1582364 96
>>1582356
Сложно научиться ебла рисовать, когда у тебя стоит только на МЕГАСТРУКТУРЫ.

>>1582318
Так там же журнашлюхи вон горели что если к модели обращаться с инглишем уровня гетто, то получаешь соответствующие ответы. Так что актуалочка не только для русека. Интересно сильный ли дебафф - и есть ли он вообще - в случае с китайским. По идее там контента качественного немало тоже.
Аноним 11/04/26 Суб 00:19:10 1582425 97
1611165802742.png 135Кб, 365x365
365x365
>>1582364

Вообще по сути весь сюжет BLAME как раз про rogue ИИ, который перестал подчиняться человечеству.

И начал строить космические мегаструктуры по типу "проблемы" paper clip.

.....и у нас есть все шансы дожить до такого варианта будущего......

Как говорится.... what a time to be alive
Аноним 11/04/26 Суб 00:39:53 1582442 98
>>1582425
Емнип, там в биомеге было про вирус который конвертировал людей в зомбей-аля-флуд из хало, и потом когда набрал достаточно массы - ебанул мегаструктуры до других планет для ресурсов, и от них к другим, и так пока солнечная система не кончилась. Может конечно там было где-то про аи, но вроде бы блеймовские синты и всякие защиты от них уже постфактум появились.
Аноним 11/04/26 Суб 00:44:45 1582448 99
>>1581723
Там не понятно, какой именно GPT 5, 5.0 или 5.4, например.

Opus 4.6 лидер только в программировании, в других задачах средненьких среди топов. В математике GPT 5, даже ранние, заметно лучше, например.
Аноним 11/04/26 Суб 00:57:20 1582455 100
>>1579130 (OP)
>Модель признана слишком опасной для публичного релиза.
Никогда такого не было, и вот опять
Аноним 11/04/26 Суб 01:04:24 1582461 101
>>1582442

Да? Я только аниме смотрел и почитал Вики немного.

Вроде там по сюжету у людей был вирус, который препятствовал распознаванию человека как хозяина ИИ.... из-за этого ии перестал подчиняться.

И поэтому человечество не может подключаться к местной матрице ака интернетам. И вся среда стала враждебной. А ИИ просто в автономном режиме живёт.
Аноним 11/04/26 Суб 02:48:24 1582509 102
>>1581086
Мягко говоря все что ты сказал хероборина
Аноним 11/04/26 Суб 05:44:15 1582545 103
image.png 31Кб, 1070x388
1070x388
>>1582318
Тут явно политруки постарались, а не модель от русского тупит.

>модели знают что А КАГДА РУСЕК тема долбоёбов с айкью морского ежа, и поэтому отвечают как морской ёж. спрашивайте по-английски.
Почему бы в системном промпте или в правилах перед запросом не прописать какие ответы тебе нужны, а не ждать что оно тебя правильно смимикрирует, перепутав с ниггером каким нибудь?

>я это дело тестировал
А как ты это делал?
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов