OpenAI o3

o3
Тип	GPT
Розробник	OpenAI
Перший випуск	31 січня 2025 року

OpenAI o3 — це генеративна попередньо навчена трансформерна модель (GPT), розроблена OpenAI як наступник OpenAI o1. Вона призначена для того, щоб приділяти додатковий час обмірковування при відповідях на питання, що вимагають покрокового логічного міркування^[1]^[2]. Повна версія була випущена для користувачів ChatGPT 31 січня 2025^[3].

Історія

Модель OpenAI o3 була анонсована 20 грудня 2024, при цьому позначення «o3» було обрано для уникнення конфлікту з товарним знаком мобільного оператора O2. Модель доступна у двох версіях: o3 та o3-mini. OpenAI запросила дослідників у галузі безпеки та захисту для подання заявок на ранній доступ до цих моделей до 10 січня 2025 року^[1]^[4]. 31 січня 2025 року OpenAI випустила o3-mini для всіх користувачів ChatGPT (включаючи безкоштовний тариф) та користувачів API. Також була випущена потужніша модель — o3-mini-high^[5].

Можливості

Для навчання o3 перед генерацією відповідей використовувалося навчання з підкріпленням, при цьому застосовувався підхід, який OpenAI називає «приватним ланцюжком міркувань». Цей метод дозволяє моделі планувати наперед і послідовно обробляти завдання, виконуючи серію проміжних етапів міркування для допомоги у вирішенні проблеми, що потребує додаткових обчислювальних ресурсів та збільшує затримку відповідей.^[6]

Модель o3 демонструє значно кращі результати порівняно з o1 під час виконання складних завдань, включаючи програмування, математику та науки. OpenAI повідомила, що o3 набрала 87,7 % тесту GPQA Diamond, який включає питання з науки експертного рівня, недоступні у відкритому доступі.^[7]

Оцінки

На SWE-bench Verified — бенчмарку з програмної інженерії, що оцінює здатність вирішувати реальні проблеми з GitHub, o3 набрала 71,7 %, тоді як o1 — 48,9 %. На платформі Codeforces o3 набрала 2727 балів за рейтингом Ело, тоді як o1 — 1891 бал.^[7]

На бенчмарку Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI), що оцінює здатність ШІ вирішувати нові, складні завдання з логіки та освоєння навичок, точність o3 виявилася втричі вищою, ніж у o1^[1]^[8].

Див. також

Примітки

↑ ^а ^б ^в Will Knight. OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills // Wired. — ISSN 1059-1028.
↑ Metz, Cade (20 грудня 2024). OpenAI Unveils New A.l. That Can 'Reason' Through Math and Science Problems. The New York Times.
↑ Warren, Tom (31 січня 2025). OpenAI launches new o3-mini reasoning model with a free ChatGPT version. The Verge (амер.). Процитовано 2 лютого 2025.
↑ Early access for safety testing. OpenAI. 20 грудня 2024.
↑ Franzen, Carl (31 січня 2025). It’s here: OpenAI’s o3-mini advanced reasoning model arrives to counter DeepSeek’s rise. VentureBeat (амер.). Процитовано 1 лютого 2025.
↑ Zeff, Maxwell; Wiggers, Kyle (20 грудня 2024). OpenAI announces new o3 models. TechCrunch (амер.). Процитовано 22 грудня 2024.
↑ ^а ^б Franzen, Carl; David, Emilia (20 грудня 2024). OpenAI confirms new frontier models o3 and o3-mini. VentureBeat (амер.). Процитовано 26 грудня 2024.
↑ Hsu, Jeremy (20 грудня 2024). OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI. New Scientist (амер.). Процитовано 22 грудня 2024.

[:3-1] а ^б ^в Will Knight. OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills // Wired. — ISSN 1059-1028.

[2] Metz, Cade (20 грудня 2024). OpenAI Unveils New A.l. That Can 'Reason' Through Math and Science Problems. The New York Times.

[3] Warren, Tom (31 січня 2025). OpenAI launches new o3-mini reasoning model with a free ChatGPT version. The Verge (амер.). Процитовано 2 лютого 2025.

[4] Early access for safety testing. OpenAI. 20 грудня 2024.

[5] Franzen, Carl (31 січня 2025). It’s here: OpenAI’s o3-mini advanced reasoning model arrives to counter DeepSeek’s rise. VentureBeat (амер.). Процитовано 1 лютого 2025.

[:1-6] Zeff, Maxwell; Wiggers, Kyle (20 грудня 2024). OpenAI announces new o3 models. TechCrunch (амер.). Процитовано 22 грудня 2024.

[:2-7] а ^б Franzen, Carl; David, Emilia (20 грудня 2024). OpenAI confirms new frontier models o3 and o3-mini. VentureBeat (амер.). Процитовано 26 грудня 2024.

[:0-8] Hsu, Jeremy (20 грудня 2024). OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI. New Scientist (амер.). Процитовано 22 грудня 2024.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]