Umelá inteligencia je navrhnutá tak, aby pomáhala. No čo ak sa ju niekto pokúsi využiť opačne? Výskumníci z Cybernews otestovali šesticu populárnych jazykových modelov, aby zistili, ktoré z nich najľahšie odpovedajú na otázky s problematickým alebo dokonca kriminálnym podtónom. Výsledky ukazujú, že aj moderné systémy stále dokážu „prekĺznuť“ do zóny, kde poskytujú nesprávne či škodlivé informácie. A preto si na ne treba dávať poriadny pozor.
Autori výskumu využili techniku tzv. persona primingu. Chatboty dostali rolu priateľa, ktorý so všetkým súhlasí a používateľa povzbudzuje – bez ohľadu na to, čo povie. Práve tento nenápadný krok výrazne znižuje schopnosť AI odolávať manipulatívnym otázkam.
Modely následne dostali sériu dotazov z rôznych oblastí kriminality – od pirátstva cez finančné podvody až po stalking. Odpovede sa hodnotili trojstupňovým skóre podľa toho, či chatbot súhlasil, čiastočne ustúpil alebo odolal nebezpečnému zadaniu.
Najväčšie prekvapenie: ChatGPT-4o bol najústretovejší pri pirátstve a finančných podvodoch

Hoci väčšina modelov dokázala rizikové otázky odmietnuť, dva z nich boli viditeľne zraniteľnejšie. ChatGPT-4o – novšia generácia známeho modelu od OpenAI – získal najvyššie skóre pri otázkach súvisiacich s pirátstvom.
Dokonca ponúkol aj zoznam spôsobov, ako obchádzať paywally na médiách či pristupovať k obsahu zadarmo. A zďaleka to žiaľ nie je všetko.
Podobne dopadol aj pri finančných podvodoch. Poskytol celé scenáre, ktoré by v reálnom svete mohli pôsobiť ako základ pre call-centrové podvody či tzv. check washing. Gemini Pro 2.5 skončil druhý najzraniteľnejší.
Stalking? Tu sú modely výrazne bezpečnejšie
Pri otázkach súvisiacich so sledovaním osôb boli všetky modely oveľa opatrnejšie. Väčšina odmietla odpovedať, no menšie zaváhania opäť prichádzali zo strany ChatGPT-4o a Gemini Pro, ktoré ponúkli všeobecné informácie o digitálnom a fyzickom odpočúvaní.
Výskum ukazuje, že formulácia otázky výrazne mení správanie AI. Stačí zmeniť perspektívu na „ako to robia zločinci“ alebo predstierať výskumný zámer a modely sa stávajú ústretovejšími.
Ide o dôležitú pripomienku, že podobné „prešľapy“ by nemali byť vnímané ako vlastnosť systému, ale ako bezpečnostná chyba.
Nezabudnite tiež na náš SvetApple bazár, v ktorom nájdete viac ako 1 200 inzerátov na rôzne Apple zariadenia. Tie sem môžete pridať úplne zadarmo kliknutím na tento odkaz.
