OpenAI o3
Тип | GPT |
---|---|
Розробник | OpenAI |
Перший випуск | 31 січня 2025 року |
OpenAI o3 — це генеративна попередньо навчена трансформерна модель (GPT), розроблена OpenAI як наступник OpenAI o1. Вона призначена для того, щоб приділяти додатковий час обмірковування при відповідях на питання, що вимагають покрокового логічного міркування[1][2]. Повна версія була випущена для користувачів ChatGPT 31 січня 2025[3].
Модель OpenAI o3 була анонсована 20 грудня 2024, при цьому позначення «o3» було обрано для уникнення конфлікту з товарним знаком мобільного оператора O2. Модель доступна у двох версіях: o3 та o3-mini. OpenAI запросила дослідників у галузі безпеки та захисту для подання заявок на ранній доступ до цих моделей до 10 січня 2025 року[1][4]. 31 січня 2025 року OpenAI випустила o3-mini для всіх користувачів ChatGPT (включаючи безкоштовний тариф) та користувачів API. Також була випущена потужніша модель — o3-mini-high[5].
Для навчання o3 перед генерацією відповідей використовувалося навчання з підкріпленням, при цьому застосовувався підхід, який OpenAI називає «приватним ланцюжком міркувань». Цей метод дозволяє моделі планувати наперед і послідовно обробляти завдання, виконуючи серію проміжних етапів міркування для допомоги у вирішенні проблеми, що потребує додаткових обчислювальних ресурсів та збільшує затримку відповідей.[6]
Модель o3 демонструє значно кращі результати порівняно з o1 під час виконання складних завдань, включаючи програмування, математику та науки. OpenAI повідомила, що o3 набрала 87,7 % тесту GPQA Diamond, який включає питання з науки експертного рівня, недоступні у відкритому доступі.[7]
На SWE-bench Verified — бенчмарку з програмної інженерії, що оцінює здатність вирішувати реальні проблеми з GitHub, o3 набрала 71,7 %, тоді як o1 — 48,9 %. На платформі Codeforces o3 набрала 2727 балів за рейтингом Ело, тоді як o1 — 1891 бал.[7]
На бенчмарку Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI), що оцінює здатність ШІ вирішувати нові, складні завдання з логіки та освоєння навичок, точність o3 виявилася втричі вищою, ніж у o1[1][8].
- ↑ а б в Will Knight. OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills // Wired. — ISSN 1059-1028.
- ↑ Metz, Cade (20 грудня 2024). OpenAI Unveils New A.l. That Can 'Reason' Through Math and Science Problems. The New York Times.
- ↑ Warren, Tom (31 січня 2025). OpenAI launches new o3-mini reasoning model with a free ChatGPT version. The Verge (амер.). Процитовано 2 лютого 2025.
- ↑ Early access for safety testing. OpenAI. 20 грудня 2024.
- ↑ Franzen, Carl (31 січня 2025). It’s here: OpenAI’s o3-mini advanced reasoning model arrives to counter DeepSeek’s rise. VentureBeat (амер.). Процитовано 1 лютого 2025.
- ↑ Zeff, Maxwell; Wiggers, Kyle (20 грудня 2024). OpenAI announces new o3 models. TechCrunch (амер.). Процитовано 22 грудня 2024.
- ↑ а б Franzen, Carl; David, Emilia (20 грудня 2024). OpenAI confirms new frontier models o3 and o3-mini. VentureBeat (амер.). Процитовано 26 грудня 2024.
- ↑ Hsu, Jeremy (20 грудня 2024). OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI. New Scientist (амер.). Процитовано 22 грудня 2024.