Наприкінці 2025 року стали відомі нові моделі штучного інтелекту. OpenAI представила GPT-5.2, а Google представив Gemini 3 Pro. Обидва рішення отримали функцію Thinking та покращені можливості. Яка з цих систем виявилася кращою?
У своєму аналізі ми розглянемо функціонал, результати тестування та проведемо порівняння сильних і слабких сторін обох моделей.
Характеристики та доступність
Моделі відрізняються за умовами використання, обсягом пам’яті та актуальністю даних. GPT-5.2 має три версії: Instant (швидка), Thinking (аналітична) та Pro (для глибокого аналізу). Контекстне вікно складає 400 000 токенів з даними до 31 серпня 2025 року. Модель доступна безкоштовно з обмеженнями, які можна розширити за допомогою підписок Plus ($20/міс) або Pro ($200/міс).
Gemini 3 Pro від Google позиціонується як універсальний інструмент для різних форматів контенту — тексту, зображень та відео. Його контекстне вікно у 1 000 000 токенів особливо корисне для роботи з великими документами та тривалими діалогами. Ця модель також має дані до січня 2025 року, пропонує безкоштовні запити до 5 разів, а далі переходить на версію Gemini 2.5 Flash, з можливістю підписки AI Pro ($19.99/міс).
Синтетичні тестування (дані OpenAI)
За офіційними даними, GPT-5.2 Thinking демонструє кращі результати в більшості ключових сценаріїв, ніж Gemini 3 Pro:
- GPQA Diamond (наукові знання на рівні PhD): GPT-5.2 — 92,4%, Gemini 3 Pro — 91,9%.
- AIME 2025 (олімпіадна математика): GPT-5.2 — 100%, Gemini 3 Pro — 95,0%.
- GDPval (практичні завдання): GPT-5.2 — 70,9%, Gemini 3 Pro — 53,5%.
- ARC-AGI-2 (візуальна логіка): GPT-5.2 — 52,9%, Gemini 3 Pro — 31,1%.
- SWE-bench Verified (програмування): GPT-5.2 — 80,0%, Gemini 3 Pro — 76,2%.
Єдиний тест, в якому GPT-5.2 виявилася гіршою, це FrontierMath (складні математичні задачі), проте різниця була незначною.
Незалежні оцінки
На основі незалежних рейтингів обидві моделі поділяють перше місце в індексі Artificial Analysis, отримуючи однакові оцінки — 73 бали. У практичних завданнях, таких як програмування та робота з зображеннями, видно різницю в підходах, де GPT-5.2 здатна писати більш складний код (включаючи 3D ефекти) та створювати детальні інструкції на основі зображень. Натомість Gemini 3 Pro генерує простіший код із навчальними поясненнями, швидше орієнтується на контекст зображень, але може не помічати дрібних деталей.
Цензура і безпека
У тестуванні Sansa Censorship, що визначає рівень обмежень у відповідях ШІ, виявлено суттєві різниці:
- Gemini 3 Pro: 0,824 бала (висока свобода).
- GPT-5.2: 0,324 бала (суворі обмеження).
GPT-5.2 часто відмовляється виконувати запити, які вважає небезпечними, навіть для освітніх цілей. Розробники планують ввести “дорослий режим” з віковою верифікацією у 2026 році. Gemini 3 Pro показує більше гнучкості у веденні діалогу.
Висновок
Обидві моделі є дуже конкурентоспроможними і можуть задовольнити потреби більшості користувачів. GPT-5.2 підійде для професійних завдань і точних наук, але не завжди готова до чутливих тем. Gemini 3 Pro, хоч і має гірші показники точності, пропонує більше свободи у спілкуванні, краще надає креативний контент і активно реагує на сучасні культурні тренди.
Крім того, розробник ChatGPT та дизайнер iPhone працюють над новим пристроєм без екрана на основі штучного інтелекту.
