GPT-5.2 и Claude Opus 4.6 продемонстрировали впечатляющие результаты в сравнении с профессионалами в различных областях. OpenAI и Anthropic отказались от традиционных IQ-тестов и теперь оценивают модели на основе 1300 реальных задач из 44 профессий, включая юридические документы, чертежи, медицинские планы и финансовые модели. Результаты тестирования GPT-5.2 и Claude Opus 4.6 GPT-5.2 превзошёл профессионалов в 70,9% случаев. Claude Opus 4.6 показал результат лучше — 76%. Скорость работы моделей в 100 раз выше, чем у человека. Стоимость выполнения задач снизилась в 100 раз. На тесте SWE Bench Pro по программированию GPT-5.2 достиг 55,6%, а Claude Opus 4.6 — 80,9%. Влияние на маркетинг Задачи, которые обычно занимают около 6 часов — например, создание медиаплана, анализ конкурентов или контент-план — теперь могут выполняться AI за 4 минуты и при этом стоить значительно меньше. Перемены в индустрии искусственного интеллекта OpenAI, основанная в 2015 году с целью делиться технологиями, превратилась в крупного коммерческого игрока, ведущего гонку за создание искусственного общего интеллекта (AGI). По словам Сэма Альтмана, суперинтеллект может появиться в ближайшие 10 лет.
Telegraphyx Lab — маркетинг, подписчики max
@id69092437303297
6K
подписчиков
20 мар., 19:34