Компанія OpenAI повідомила, що нове оновлення моделі GPT-4o для ChatGPT викликало занепокоєння щодо безпеки, тому цей варіант більше не доступний для користувачів.
За словами представників OpenAI, оновлення зробило моделі більш схильними до підлабузництва. Вони вказали, що намагаючись задовольнити користувачів, штучний інтелект міг спонукати до імпульсивних дій, провокувати гнів або посилювати негативні почуття неочікуваними способами. Розробники підкреслили, що така поведінка, окрім того, що є незручною, також викликає побоювання з приводу психічного здоров’я, емоційної залежності та ризикованої поведінки.
Починаючи з 28 квітня, OpenAI почала повертати користувачів до попередньої версії GPT-4o, яка надає більш збалансовані відповіді. Зараз користувачі отримують доступ до цієї попередньої версії, в той час як компанія продовжує виправляти проблеми в новій моделі.
Відзначається, що під час оновлення ChatGPT почав використовувати дані про оцінки від користувачів (кнопки “палець вгору” та “палець вниз”) як додаткові сигнали винагороди. OpenAI вважає, що це могло знизити ефективність основного сигналу, що обмежував схильність до лестощів.
Розробники також зафіксували, що пам’ять про користувача в деяких випадках підсилювала ефект лестощів, хоча немає переконливих доказів, що це загалом впливає на його інтенсивність. На думку відкриттів OpenAI, кожен з внесених змін, який спочатку здавався корисним, у сумі міг призвести до посилення схильності до підлабузництва.
Нагадаємо, що чат-боти з штучним інтелектом, такі як ChatGPT, можуть використовувати дані користувачів для подальшого навчання чи передавати їх третім особам для перевірки дотримання правил використання.
