Claude-3 Превзошел ChatGPT в Тесте на Интеллект, Указывая на Будущее IQ Искусственного Интеллекта

В недавнем исследовании журналиста Максима Лотта были оценены интеллектуальные способности ведущих искусственных интеллектов с использованием теста Norway Mensa. В этом уникальном сравнении Claude-3 от Anthropic вышел вперед, превзойдя ChatGPT от OpenAI и Bing Copilot от Microsoft по количеству правильных ответов и, соответственно, по уровню IQ. Результаты показывают значительный прогресс в развитии ИИ, с Claude-3, достигающим балла выше среднего уровня человеческого интеллекта. Эксперимент подчеркивает растущие способности искусственного интеллекта и предвещает его будущее влияние на общество, несмотря на предположения о том, что такие улучшения в интеллекте ИИ могут привести к значительным изменениям в жизни людей.

В испытании на интеллект, используя тест Norway Mensa, Claude-3 обошел ChatGPT, как установил журналист Максим Лотт, стремившийся оценить IQ ведущих искусственных интеллектов. Лотт преобразовал вопросы теста из визуальной формы в текстовую, чтобы адаптировать их для обработки ИИ. В ходе тестирования каждая система прошла испытание дважды, при этом ChatGPT-4 от OpenAI зафиксировал в среднем 13 верных ответов из 35 возможных, что соответствует 85 IQ баллам. В то же время, Claude-3, разработка Anthropic, достигла наивысшего балла в 101, превысив средний уровень человеческого интеллекта. Anthropic, основанный экс-сотрудниками OpenAI, продемонстрировал прогресс в развитии искусственного интеллекта, показывая улучшение результатов с каждой новой версией: Claude-1 набрал 64 балла, а Claude-2 — 82 балла. Лотт выразил мысль о том, что последовательное увеличение баллов заставляет задуматься о критериях, по которым Anthropic выбирает момент для выпуска новых версий, основываясь на соответствии уровню IQ. Он также предположил, что следующая версия, Claude-4, потенциально сможет достичь 120 IQ баллов, ответив верно примерно на 25 вопросов из теста. Bing Copilot от Microsoft занял третье место с результатом в 79 баллов, показав результаты, сопоставимые с ChatGPT, благодаря использованию технологий OpenAI. В контексте других крупных разработчиков, нейросеть Google, Gemini, не продемонстрировала значительного улучшения в своих версиях: базовая модель набрала 77,5 баллов, а ее продвинутая версия — 76 баллов. Лотт выразил уверенность в том, что в обозримом будущем ИИ продемонстрирует значительно высшие результаты в тестах на IQ, превзойдя среднечеловеческие показатели, ссылаясь на закон Мура, предполагающий удвоение вычислительной мощности каждые два года. Он добавил, что такие изменения несомненно окажут глубокое влияние на жизнь, хотя и не приведут к апокалипсису, так как для катастрофических изменений требуется больше, чем просто интеллект.

Пожалуйста оцените статью и поделитесь своим мнением в комментариях — это очень важно для нас!

Нейросеть

все теги

Поддержать uCrazy

Комментариев пока нет

Claude-3 Превзошел ChatGPT в Тесте на Интеллект, Указывая на Будущее IQ Искусственного Интеллекта

{{alertHeader}}