Попри те, що офіційний реліз ще не відбувся, навколо цієї моделі вже шириться безліч чуток і заяв, що підігрівають інтерес до її можливостей, а останні анонси від OpenAI починають прояснювати картину.
Засновник OpenAI, Сем Альтман, нещодавно виступив з досить сміливою заявою на панельній дискусії в Технічному університеті Берліна. Він передбачив, що ChatGPT-5 буде розумнішим за нього самого, або, точніше, він сам не буде розумнішим за GPT-5. Ця заява, хоч і прозвучала трохи підготовлено та у відповідь на непов'язане питання, підкреслює амбіції OpenAI щодо наступного покоління своєї моделі.
Альтман висловив ентузіазм з приводу того, що ця модель дозволить здійснювати "неймовірні речі", особливо в галузі наукових відкриттів. Він згадав, що вона допоможе вченим робити те, що було неможливим раніше, і навіть торкнувся теми вилікування раку. Однак, що саме означає "бути розумнішим за Сема Альтмана" і як конкретно ChatGPT-5 сприятиме науковим проривам, залишається неясним.
Багато хто задається питанням, як велика мовна модель, орієнтована на генерацію тексту та діалоги, зможе зробити істотний внесок у глибокі наукові дослідження, де відповіді на питання ще невідомі людству.
Критики зазначають, що поточні версії, такі як GPT-4, хоч і володіють обширними знаннями, часто відчувають труднощі з дотриманням інструкцій, утриманням контексту та точним редагуванням відповідей, що знижує їхній "інтелект" у практичному застосуванні.
Приклади інших моделей, таких як DeepSeek, які краще справляються з точним дотриманням інструкцій, змушують сподіватися, що GPT-5 значно покращиться в цих аспектах. Це означає, що здатність точно виконувати складні багатоетапні інструкції та зберігати контекст може стати ключовим показником "інтелекту" GPT-5.
Альтман та інші представники OpenAI неодноразово підкреслювали, що мета — створити ШІ, який "просто працюватиме" (just work), мінімізуючи складність вибору між моделями та забезпечуючи безперешкодний користувацький досвід.
Спочатку очікувалося, що GPT-5 може бути випущена вже в травні, однак OpenAI скоригувала свій план. Сем Альтман оголосив, що компанія відкладе запуск флагманської моделі на користь випуску легших "міркувальних" моделей, таких як o3 і o4-mini, найближчими тижнями.
Це дозволило OpenAI згладити деякі проблеми в розробці GPT-5 і переконатися, що модель буде значно кращою, ніж планувалося спочатку. Альтман підкреслив, що інтеграція всіх компонентів виявилася складнішою, ніж очікувалося, і компанія хоче бути впевненою в наявності достатніх потужностей для підтримки безпрецедентного попиту.
Ця затримка також пов'язана з безпрецедентним зростанням кількості користувачів ChatGPT, який нещодавно виріс з 400 до 500 мільйонів всього за годину після вірусного тренду, викликаного оновленням генерації зображень GPT-4o.
Хоча назви моделей, таких як o4 і 4o, можуть здатися заплутаними для користувачів, до моменту виходу GPT-5 система зможе автоматично вибирати найкращу модель для конкретного завдання.
За останніми даними, GPT-5 очікується до випуску влітку 2025 року, швидше за все, в липні або серпні. Це підтвердив сам Сем Альтман у відеоподкасті на офіційному YouTube-каналі OpenAI в червні 2025 року.
Моделі o3 і o4-mini, що передують випуску GPT-5, відіграють ключову роль у стратегії OpenAI. Ці моделі, випущені в квітні 2025 року, є мультимодальними моделями міркування. Вони розроблені для покращення здатності ШІ до багатоетапної логіки та прийняття рішень, використовуючи так званий "ланцюжок міркувань" (chain-of-thought processing).
На відміну від попередніх моделей, які могли бути хорошими в генерації креативного тексту, але гіршими в логічних задачах, o-серія фокусується на автономному використанні інструментів (таких як веб-браузинг, Python, аналіз зображень і файлів) та покращеному дотриманні інструкцій.
Наприклад, o4-mini показала себе добре в завданнях, що вимагають візуального розуміння та відповідей на питання на основі зображень, а також у завданнях кодування та математичних тестах.
Ці моделі є важливим кроком до того, щоб ШІ міг не просто генерувати текст, а й самостійно планувати, виконувати складні команди, виправляти помилки та адаптуватися до нової інформації, що критично важливо для створення більш "розумного" агента.
Мета OpenAI полягає в тому, щоб GPT-5 успадкувала та масштабувала ці можливості.
За інформацією OpenAI, GPT-5 обіцяє об'єднати в собі мультимодальність GPT-4 (здатність обробляти та генерувати різні типи даних, такі як текст, зображення, голос) та логічні здібності серії GPT-4o та o-серії.
Мета полягає в створенні єдиної потужної моделі, яка усуне необхідність перемикання між різними версіями для виконання різних завдань. Це означатиме, що користувачам більше не доведеться вручну вибирати, яку модель використовувати для тексту, зображень або голосу; GPT-5 автоматично визначатиме оптимальний підхід.
Компанія заявляє, що GPT-5 запропонує "прорив у міркуванні" та "прорив у мультимодальності". Якщо ці обіцянки будуть виконані, це може означати значний крок вперед у здатності ШІ розуміти складні запити, робити логічні висновки та ефективно працювати з різноманітними вхідними даними.
Серед очікуваних покращень:
- Збільшені контекстні вікна: Це критично важливо для ведення довгих розмов і виконання складних завдань, що вимагають аналізу великих обсягів інформації. GPT-5, за чутками, отримає значно більші контекстні вікна.
- Персоналізовані відповіді: Модель буде вчитися на взаємодіях з користувачем, щоб адаптувати відповіді під індивідуальні переваги.
- Зниження "галюцинацій": OpenAI активно працює над зменшенням неточних або вигаданих відповідей, і GPT-5, як очікується, буде значно надійнішою в цьому плані.
- Покращена взаємодія: Модель має стати більш природною та людяною у спілкуванні.
- Єдина система: Замість набору окремих моделей (GPT-серія, o-серія, DALL-E) GPT-5 буде являти собою уніфікований "хаб" штучного інтелекту, здатний виконувати широкий спектр завдань, від креативного письма до складного програмування, без необхідності вибору конкретної версії.
- "Глибокий пошук" (Deep Research): У рамках своєї дорожньої карти OpenAI також згадує інтеграцію функцій "глибокого пошуку", що може означати більш просунуті можливості ШІ для збору та аналізу інформації.
Користувачі безкоштовної версії ChatGPT, як і раніше, матимуть обмежений доступ до GPT-5, тоді як передплатники Plus і Pro зможуть повною мірою скористатися всіма перевагами нової моделі, включаючи вищі рівні "інтелекту" та обчислювальної потужності.
Тиск на OpenAI залишається високим. Конкуренти, такі як Google (з Gemini), xAI (з Grok) і DeepMind, також активно розробляють свої передові моделі ШІ. У цьому контексті, уніфікація можливостей і значні покращення в міркуванні та мультимодальності в GPT-5 є стратегічно важливими для утримання лідерства OpenAI.
Компанія бачить GPT-5 не просто як нову версію, а як злиття всіх своїх досягнень за останні роки, що має спростити взаємодію користувачів зі ШІ та зробити його більш потужним і універсальним.
Заяви Сема Альтмана про те, що ChatGPT-5 буде розумнішим за людину, звучать амбітно, але останні підтверджені деталі показують, що OpenAI рухається до створення дійсно універсальної та значно більш здібної моделі. Відкладений запуск, викликаний прагненням до досконалості та необхідністю впоратися з величезним потоком користувачів, свідчить про серйозність підходу OpenAI до свого флагманського продукту.
Якщо GPT-5 справді зможе забезпечити заявлені прориви в міркуванні та мультимодальності, а також значно покращить здатність слідувати складним інструкціям і працювати як єдина, інтуїтивно зрозуміла система, вона може стати потужним інструментом для найрізноманітніших областей — від повсякденних завдань до наукових досліджень. Очікуваний реліз влітку 2025 року наближається, і світ ШІ з нетерпінням чекає, наскільки ці очікування співпадуть з реальністю.
Рекомендовані коментарі