GPT-5.2 20 марта 2026 г.
6K
подписчиков

GPT-5.2 и Claude Opus 4.6 продемонстрировали впечатляющие результаты в сравнении с профессионалами в различных областях. OpenAI и Anthropic отказались от традиционных IQ-тестов и теперь оценивают модели на основе 1300 реальных задач из 44 профессий, включая юридические документы, чертежи, медицинские планы и финансовые модели. Результаты тестирования GPT-5.2 и Claude Opus 4.6 GPT-5.2 превзошёл профессионалов в 70,9% случаев. Claude Opus 4.6 показал результат лучше — 76%. Скорость работы моделей в 100 раз выше, чем у человека. Стоимость выполнения задач снизилась в 100 раз. На тесте SWE Bench Pro по программированию GPT-5.2 достиг 55,6%, а Claude Opus 4.6 — 80,9%. Влияние на маркетинг Задачи, которые обычно занимают около 6 часов — например, создание медиаплана, анализ конкурентов или контент-план — теперь могут выполняться AI за 4 минуты и при этом стоить значительно меньше. Перемены в индустрии искусственного интеллекта OpenAI, основанная в 2015 году с целью делиться технологиями, превратилась в крупного коммерческого игрока, ведущего гонку за создание искусственного общего интеллекта (AGI). По словам Сэма Альтмана, суперинтеллект может появиться в ближайшие 10 лет.

20 мар., 19:34
Подписаться на Telegraphyx Lab — маркетинг, подписчики max в Max
😍 Понравился пост? Подпишитесь на канал!
Подписаться в Max

GPT-5.2 и Claude Opus 4.6 превзошли экспертов в 70% задач с высокой скоростью и низкой стоимостью

OpenAI и Anthropic тестируют GPT-5.2 и Claude Opus 4.6 на 1300 реальных задачах из 44 профессий. Модели работают в 100 раз быстрее и дешевле человека.

GPT-5.2 и Claude Opus 4.6 продемонстрировали впечатляющие результаты в сравнении с профессионалами в различных областях. OpenAI и Anthropic отказались от традиционных IQ-тестов и теперь оценивают модели на основе 1300 реальных задач из 44 профессий, включая юридические документы, чертежи, медицинские планы и финансовые модели.

Результаты тестирования GPT-5.2 и Claude Opus 4.6

  • GPT-5.2 превзошёл профессионалов в 70,9% случаев.
  • Claude Opus 4.6 показал результат лучше — 76%.
  • Скорость работы моделей в 100 раз выше, чем у человека.
  • Стоимость выполнения задач снизилась в 100 раз.
  • На тесте SWE Bench Pro по программированию GPT-5.2 достиг 55,6%, а Claude Opus 4.6 — 80,9%.

Влияние на маркетинг

Задачи, которые обычно занимают около 6 часов — например, создание медиаплана, анализ конкурентов или контент-план — теперь могут выполняться AI за 4 минуты и при этом стоить значительно меньше.

Перемены в индустрии искусственного интеллекта

OpenAI, основанная в 2015 году с целью делиться технологиями, превратилась в крупного коммерческого игрока, ведущего гонку за создание искусственного общего интеллекта (AGI). По словам Сэма Альтмана, суперинтеллект может появиться в ближайшие 10 лет.
#GPT-5.2#Claude Opus 4.6#искусственный интеллект#AI в маркетинге#тестирование AI моделей

Развивайте свой канал с TeleGraphyx