OpenAI и Anthropic изменили подход к оценке искусственного интеллекта, отказавшись от традиционных IQ-тестов в пользу проверки на 1300 реальных задачах из 44 профессий. Новые модели GPT-5.2 и Claude Opus 4.6 демонстрируют впечатляющие результаты, значительно превосходя профессионалов по скорости и стоимости выполнения задач. Результаты тестирования GPT-5.2 и Claude Opus 4.6 GPT-5.2 побеждает профессионалов в 70,9% случаев. Claude Opus 4.6 превосходит экспертов в 76% задач. Обе модели работают в 100 раз быстрее человека. Стоимость выполнения задач с помощью AI в 100 раз ниже, чем у человека. На тесте SWE Bench Pro (программирование) GPT-5.2 показал 55,6%, а Claude Opus 4.6 — 80,9%. Влияние на маркетинг и профессиональную деятельность Для маркетологов и специалистов в других областях это означает существенную экономию времени и ресурсов. Задачи, на которые раньше уходило 6 часов — например, медиапланирование, анализ конкурентов и создание контент-плана — теперь AI выполняет за 4 минуты, при этом затраты значительно снижаются. Развитие AI и планы OpenAI OpenAI, начавшая свою деятельность в 2015 году с миссией «делиться технологиями со всеми», превратилась в коммерческого гиганта, активно участвующего в гонке за создание искусственного общего интеллекта (AGI). По словам Сэма Альтмана, суперинтеллект может появиться в ближайшие 10 лет.
GPT-5.2 и Claude Opus 4.6: новые стандарты эффективности AI в профессиональных задачах
OpenAI и Anthropic тестируют AI на 1300 реальных задачах из 44 профессий. GPT-5.2 и Claude Opus 4.6 работают в 100 раз быстрее и дешевле человека.
OpenAI и Anthropic изменили подход к оценке искусственного интеллекта, отказавшись от традиционных IQ-тестов в пользу проверки на 1300 реальных задачах из 44 профессий. Новые модели GPT-5.2 и Claude Opus 4.6 демонстрируют впечатляющие результаты, значительно превосходя профессионалов по скорости и стоимости выполнения задач.
Результаты тестирования GPT-5.2 и Claude Opus 4.6
- GPT-5.2 побеждает профессионалов в 70,9% случаев.
- Claude Opus 4.6 превосходит экспертов в 76% задач.
- Обе модели работают в 100 раз быстрее человека.
- Стоимость выполнения задач с помощью AI в 100 раз ниже, чем у человека.
- На тесте SWE Bench Pro (программирование) GPT-5.2 показал 55,6%, а Claude Opus 4.6 — 80,9%.
Влияние на маркетинг и профессиональную деятельность
Для маркетологов и специалистов в других областях это означает существенную экономию времени и ресурсов. Задачи, на которые раньше уходило 6 часов — например, медиапланирование, анализ конкурентов и создание контент-плана — теперь AI выполняет за 4 минуты, при этом затраты значительно снижаются.
Развитие AI и планы OpenAI
OpenAI, начавшая свою деятельность в 2015 году с миссией «делиться технологиями со всеми», превратилась в коммерческого гиганта, активно участвующего в гонке за создание искусственного общего интеллекта (AGI). По словам Сэма Альтмана, суперинтеллект может появиться в ближайшие 10 лет.