Потужна ІІ-модель для фахівців: що вміє o1 Pro від OpenAI?
Потужна ІІ-модель для фахівців: що вміє o1 Pro від OpenAI?
23.12.24
Найдорожчу нейромережу від авторів ChatGPT протестували фахівці. Нова o1 Pro пропонує максимальні обчислювальні потужності та майже нульову ймовірність помилок — усе це за $200 на місяць. Розповідаємо, для яких завдань стане у пригоді цей інструмент.
Що покращено у порівнянні з o1
Головна особливість Pro-версії асистента — довші ланцюжки роздумів, які підвищують якість відповідей. Усі моделі серії o1 вирізняються здатністю поетапно вирішувати складні завдання, «обмірковуючи» кожен крок. У o1 Pro цей механізм удосконалили: модель отримала більше часу й ресурсів, що дозволяє видавати стабільно точну інформацію. Щоправда, замість 1–3 хвилин, як у звичайній o1, обробка запитів може займати до п'яти хвилин.
Результат виправдовує очікування, якщо правильно підходити до формулювання вхідних даних. ІІ орієнтований на професіоналів, занурених у свою галузь, наприклад, для аналізу складних наукових текстів і коду або створення маркетингових матеріалів. За замовчуванням відповіді можуть бути поверхневими чи неповними. У таких випадках важливо спрямовувати асистента на глибший аналіз і коригувати його хід думок.
Плюси та мінуси на практиці
У збірці o1 Pro покращили функцію візуального розпізнавання, тобто деталі на зображеннях ідентифікуються краще. Щодо програмування, як з’ясував ІІ-спеціаліст Денис Ширяєв, модель не пропонує видатних можливостей у написанні коду. Тому з такими завданнями доцільніше звертатися до простіших аналогів і економити час. З іншого боку, кілька унікальних властивостей новинки переконали оглядача оформити дорогу підписку.
Перше — достовірність відповідей. У перевірці фактів o1 Pro демонструє високий рівень, чого досягає завдяки ретельним роздумам і самоаналізу. Якщо виникають сумніви, нейромережа або відмовляється відповідати, або позначає можливу неточність. У результаті її не вдалося впіймати на помилках, що є цінною властивістю для експертів. Даним від Pro-модифікації можна довіряти, адже ймовірність так званих «галюцинацій» майже виключена. Для порівняння, у GPT-4o та Sonnet 3.6 серйозна робота неможлива без додаткової перевірки фактів.
У продуктових бенчмарках o1 Pro також демонструє чудові результати, посідаючи перше місце в рейтингу. Водночас робочі сценарії — не єдина сфера, де корисний поетапний підхід. ІІ також створює якісні художні тексти, утримуючи в пам’яті послідовність сюжету й деталі про персонажів. Однак і тут необхідні креативні вихідні ідеї й власний наратив. Оскільки модель чутлива до інструкцій, усі приклади й нюанси мають бути максимально точними.
На GitHub зібрано спеціальний набір кастомних інструкцій, який допоможе повністю розкрити потенціал o1 Pro. З їхньою допомогою нейромережа приймає на себе роль професіонала в певній галузі й «мислить» від його імені, що позитивно впливає на якість відповідей.