Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 13 6 7
ИИ подливы тред Аноним 11/11/25 Втр 10:46:25 1413476 1
16926168282620s.jpg 5Кб, 200x160
200x160
В этом треде собираем случаи, когда нейросети ходили под себя. Тема навеяна чатом пропердолек и детским алфавитом. Вообще, люди делали это для смехуечков и я это рассматривал, как смехуечки, но потом подумал, что такие случаи как раз являются отличным тестом "интеллекта(?)". Везде любят подкидывать чатам срамоты и прочим дикпикам олимпиадные задачи. Ты читаешь, видишь нейросети хуярят картины, дают просраться профессорам математики, АГИ не за горами. Потом видишь тред про детский алфавит. Короче, я пришел в выводу, что наилучший не наилучший, но очень важный тест на интеллект - тупые задачи, которые может сделать дебил. И когда ии на нем дрищет брызгами это не просто весело, но и ценно с практической точки зрения. Олимпиадные задачи хуй проверишь во-первых, во-вторых наверно там может быть небольшое на самом деле количество вариаций ответов, которые ии может зазубрить. Задачи для дебилов может проверить полудебил, во первых, во-вторых они вскрывают фундаментальные еще нерешенные косяки которые фундаментально ограничивают нас в задачах, которые мы можем ии подкинуть. О чем нам может сказать, назовем его уже Алфавитный тест мультимодальных БЯМ? БЯМ - не могут, по крайней мере в данном случае, разбить задачу на подзадачи, выполнить их и объединить в единый результат. То, что может дебил. По крайней мере у деблила не было бы такой нестыковки, что он может изобразить деда-смазочника в стиле вангога, но не может разместить на листе маленькие картинки и буквы в правильных местах. Т.е. в данном случае мы видим, что ии высирает задачи исключительно целой котяхой и никак иначе. Если задача не идет монокотяхой, она моментально переходит в состояние подливы. И это говорит о скрытой зазубренности. Нам кажется, что сеть выдала что-то умное, раз оно выглядит сложным, а она на самом деле только проиграла то, что запомнила где-то в интернете целиком.
Аноним 11/11/25 Втр 10:47:49 1413478 2
Мне бампать эту хуйню особо не чем, но я недавно пробовал подкинуть нескольким ллм простую задачу. И они неожиданно для меня трескуче обосрались в очередной раз. Я короче попросил ллм сделать svg, на которой изображен куб в изометрической проекции. Кто-то может сказать, хуя ты выдал. Но я могу сказать, что это тоже задача на дебила. Ее резульат по сути три ромбика вписанные в шестиугольник. По крайней мере должна быть для хуевен, которые типа решают олимпиадные задачи мирового уровня. Я могу легко запилить это несколькими способами, немного заглянуть в стандарт и сделать руками, сделать на питухоне к примеру рассчетным способом, сделать в вектрном редакторе. Это просто для кожаного полудебила. Я ведь и не погромист даже. О чем это пока мне говорит? Что если люди где-то надеятся заменить такой хуйней младших программистов или простигосподи заменили. То значит им просто повезло и их задачи решаются шаблонами.
Аноним 11/11/25 Втр 10:51:49 1413480 3
Короче накидайте своих примеров. Смысл понятен - задача детская вообще или вполне годится в качестве учебной. ИИ твердо и четко серит в кибершаровары.
Аноним 11/11/25 Втр 10:53:21 1413483 4
Соберем Standard AIB AGI test.
Аноним 11/11/25 Втр 10:58:44 1413488 5
>>1413476 (OP)
>наилучший не наилучший, но очень важный тест на интеллект - тупые задачи, которые может сделать дебил.
Поздравляю, ты открыл для себя парадокс Моравека. Вкратце, он сводится к тому что области которые условный белый ботан считает "умными" (ну там шахматы, математика, философия всякая и.т.п.) на самом деле таковыми не являются. Просто человеческий мозг к ним эволюционно слабо приспособлен, но научить машину созданную с нуля их решать достаточно просто. А вот например сделать робота, который будет ссать из трубочки в писсуар так чтобы не обоссывать себе штаны - это Задача, а человек ее выполняет даже в упоротом виде. Такой вот парадокс, на незнании которого денежными мешками альтманы бабло нагребли.
Аноним 11/11/25 Втр 11:14:32 1413499 6
>>1413488
Но математика - это не просто и пример с svg как раз показывает, что ии как раз не может ее применить. Даже в базовом виде.
11/11/25 Втр 11:31:58 1413505 7
>>1413476 (OP)
Почитай как работают языковые модели, даже поверхностных знаний будет достаточно что бы понять что это не ИИ тупой. А ты, уверовавший в маркетинговую наебку века.
Аноним 11/11/25 Втр 11:55:02 1413524 8
>>1413505
Дело то не в тупизне, а в методе оценки. Если бы ЛЛМы были просто наебкой у них бы не было никаких практических применений, но применения есть. Только ЛЛМ ограничены и для людей эти ограничения выглядят парадоксально, потому что не получается спрогнозировать сравнительную сложность задач. Дебилотесты - это как раз хороший рабоий способ понять какую задачу ллм не решит и почему конкретно.
Аноним 11/11/25 Втр 12:43:01 1413567 9
Пытался сгенерить что-то дрочибельное в google gemini, он то отказывался, то обсирался. Ну я его и решил пристыдить задачей: сколько энергии в пересчёт на килограммы CO2 он затратил на этот бесполезный разговор. В принципе стандартная задача для собеседований уровня "сколько автобусов влезет в мячик для пинг-понга", где нужен не точный ответ, а ход мыслей и хотя бы примерные вычисления.

И если студент-кандидат хоть как-то напрягает мозги, чтоб решить поставленную задачу, то эта железная ебанина сначала попыталась в философию "гугол перейдёт на безуглеродную энергию вот уже СКОРО", потом посетовала на распределённость своих серверов, незнание мощности каждого сервера в отдельности и сколько людей пользуются ими в каждый момент времени. Не помогло ни предложение взять известные значения или усреднить, ни аналогичный расчёт мною для моей пекарни.
Аноним 13/11/25 Чтв 17:42:41 1415683 10
image 73Кб, 1720x442
1720x442
Аноним 13/11/25 Чтв 17:46:13 1415685 11
>>1415683
>>1413567
>ход мыслей

на самом деле все эти задачки на лолгику - хуита, сколько людей справятся с такими задачами? а генерировть хуиту и ллмки могут
Аноним 13/11/25 Чтв 17:57:14 1415693 12
Дал дипсику 2 задачи. Первая - есть дом 6 на 4, двускатная крыша под углом 30 градусов выступает на 20 см над стенами, сколько потребуется листов черепицы для покрытия крыши, перекрытие листов - 8 см. Вторая - дифференциальное уравнение ейлера-коши из интернета. Уравнение решил за минуту, черепицу подсчитал за 5. У меня в очередной раз возникло подозрение что математика это банальный аутизм-чек, обфусцированный уебищной нечитабельной нотацией, о чем я напрямую спросил дипсик. Дипсик ответил что таки да, и архитектура трансформеров по сути создана чтобы сводить математические задачи к элементарному pattern-matching, что и требуется для решения математических задач.
Аноним 14/11/25 Птн 18:07:07 1416323 13
image.png 630Кб, 1139x630
1139x630
image.png 345Кб, 798x469
798x469
image.png 263Кб, 739x521
739x521
image.png 228Кб, 705x463
705x463
На логических задачах клод и гопота примерно одинаково обсираются, точнее где обсирается одна модель, правильно справляется другая. На вопросах "с подвохом" по типу про желток обсираются обе одинаково.

И для себя я такую практическую задачу для тестирования ЛЛМ завёл: экстракшн даты из текста и перевод в utc timestamp, промпт:

Extract first date and time from the post and answer with UTC timestamp format time in seconds:
"Ракету "Союз-2.1а", которая отправит к Международной космической станции грузовик "Прогресс МС-24", установили на старт на Байконуре, сообщил Роскосмос.

Корабль доставит на МКС около 2,5 тонны грузов, запуск запланирован на 23 октября в 04:08 мск."
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов