Nové modely ChatGPT — GPT-o3 a GPT-o4 mini — vkládají do textů skryté symboly, které nejsou pro člověka viditelné. Tyto značky připomínají běžné mezery, ale mají odlišný kód. Lze je zobrazit pouze v specializovaných programech, jako je Sublime Text nebo Visual Studio Code.
Výzkumníci z Rumi zjistili, že se značky častěji objevují v dlouhých textech, například v esejích. „Rozmístění symbolů vypadá systematicky, ne náhodně,“ uvedli s tím, že značky jsou pravděpodobně přidávány úmyslně. OpenAI to popírá a označuje je za „vedlejší efekt rozsáhlého učení modelů“.
Problém zesílil poté, co OpenAI zpřístupnila ChatGPT zdarma pro školy do konce května. Mnoho uživatelů nyní využívá službu pro psaní prací, ale přímé kopírování textů může vést k problémům: učitelé mohou značky odhalit pomocí stejných editorů nebo online nástrojů jako SoSciSurvey’s character viewer.
Odstranění symbolů je jednoduché: stačí funkce „najít a nahradit“ v textovém editoru. Značky však přetrvají při kopírování do Google Docs nebo jiných programů.
OpenAI dříve testovala vodoznaky u obrázků, což ukazuje na její zájem o označování obsahu. Status textových značek zůstává nejasný — společnost nepotvrdila jejich záměrné použití.