OpenAI и Anthropic отказались от традиционных IQ-тестов для оценки искусственного интеллекта и перешли к проверке на реальных задачах из 44 профессий. Новые модели GPT-5.2 и Claude Opus 4.6 демонстрируют впечатляющие результаты, значительно превосходя экспертов в ряде областей. Результаты тестирования GPT-5.2 и Claude Opus 4.6 GPT-5.2 побеждает профессионалов в 70,9% случаев. Claude Opus 4.6 превосходит экспертов в 76% задач. Обе модели работают в 100 раз быстрее человека. Стоимость выполнения задач снижается в 100 раз. На тесте SWE Bench Pro, связанного с программированием, GPT-5.2 показал 55,6%, а Claude Opus 4.6 — 80,9%. Влияние на маркетинг и рабочие процессы Для маркетологов и специалистов, занимающихся медиа-планированием, анализом конкурентов и созданием контент-планов, новые AI-модели сокращают время выполнения задач с 6 часов до 4 минут. Это позволяет значительно оптимизировать рабочие процессы и снизить затраты. Эволюция OpenAI и перспективы развития AI OpenAI, начавшая свою деятельность в 2015 году с миссией сделать технологии доступными для всех, сегодня превратилась в крупного коммерческого игрока в области искусственного интеллекта. Глава компании Сэм Альтман прогнозирует появление суперинтеллекта в ближайшие 10 лет, что открывает новые горизонты для развития AI.
GPT-5.2 и Claude Opus 4.6: новые стандарты AI в рабочих задачах
OpenAI и Anthropic тестируют GPT-5.2 и Claude Opus 4.6 на 1300 профессиональных задачах. Модели быстрее и дешевле человека, меняя подход к маркетингу.
OpenAI и Anthropic отказались от традиционных IQ-тестов для оценки искусственного интеллекта и перешли к проверке на реальных задачах из 44 профессий. Новые модели GPT-5.2 и Claude Opus 4.6 демонстрируют впечатляющие результаты, значительно превосходя экспертов в ряде областей.
Результаты тестирования GPT-5.2 и Claude Opus 4.6
- GPT-5.2 побеждает профессионалов в 70,9% случаев.
- Claude Opus 4.6 превосходит экспертов в 76% задач.
- Обе модели работают в 100 раз быстрее человека.
- Стоимость выполнения задач снижается в 100 раз.
- На тесте SWE Bench Pro, связанного с программированием, GPT-5.2 показал 55,6%, а Claude Opus 4.6 — 80,9%.
Влияние на маркетинг и рабочие процессы
Для маркетологов и специалистов, занимающихся медиа-планированием, анализом конкурентов и созданием контент-планов, новые AI-модели сокращают время выполнения задач с 6 часов до 4 минут. Это позволяет значительно оптимизировать рабочие процессы и снизить затраты.
Эволюция OpenAI и перспективы развития AI
OpenAI, начавшая свою деятельность в 2015 году с миссией сделать технологии доступными для всех, сегодня превратилась в крупного коммерческого игрока в области искусственного интеллекта. Глава компании Сэм Альтман прогнозирует появление суперинтеллекта в ближайшие 10 лет, что открывает новые горизонты для развития AI.