Spoločnosť OpenAI predstavila novú verziu svojho jazykového modelu GPT-4o, ktorý je zatiaľ najpokročilejšou generatívnou umelou inteligenciou, akú nám kedy firma ukázala. Hlavným dôvodom je fakt, že GPT-4o ponúka prirodzenú interakciu medzi človekom a technológiou, vďaka čomu sa s touto AI oveľa lepšie pracuje.

Novinka GPT-4o, ktorá bola prezentovaná na oficiálnom webe spoločnosti OpenAI je schopná prijať akúkoľvek kombináciu textu, zvuku alebo obrazu, pričom rovnakým spôsobom dokáže podať používateľovi výstup. Všetko to navyše funguje neuveriteľne rýchlo, vďaka čomu nebudete čakať na odpoveď.

Tak napríklad, na zvukové vstupy GPT-4o odpovie už za 232 milisekúnd, pričom priemerná doba reakcie je o niečo dlhšia, presnejšie 320 milisekúnd. Len pre predstavu, zhruba rovnako dlhý čas trvá odpoveď skutočného človeka, keď sa s ním rozprávame.

Doteraz trvala odpoveď ChatGPT z hlasových výstupov priemerne 2,8 sekundy pri jazkovom modeli GPT-3.5 a až 5,4 sekundy pri GPT-4. Nová AI je okrem extrémnej rýchlosti aj o 50 % úspornejšia v rámci API. Ako je to možné?

GPT-4o kombinuje tri AI modely do jedného

Spoločnosť OpenAI sa rozhodla vyriešiť jeden zásadný problém. Akonáhle totiž v ChatGPT aktivujete hlasový režim, automaticky využívať tri AI modely súčasne.

Ten prvý prepisuje vaše hovorené slovo na text, druhý sa stará o odpoveď a tretí premieňa túto odpoveď späť na zvuk, kvôli čomu celý proces zaberá sekundy.

Vývojári sa preto rozhodli, že v rámci celého procesu urobia zmenu. GPT-4o ponúka jeden AI model, ktorý dokáže pracovať s textom, zvukom aj obrazom, pričom všetky tieto vstupy a výstupy spracováva jednotná neurónová sieť. Aj to je dôvod, prečo sa odpovede vieme dočkať oveľa skôr, ako za pol sekundy.

GPT-4o vie spievať a vyjadrovať emócie a riešiť domáce úlohy

Aby nám spoločnosť OpenAI čo najlepšie demonštrovala novú technológiu, rozhodla sa natočiť aj niekoľko praktických ukážok, ktoré nám znázorňujú, ako to celé funguje.

GPT-4o bola v rámci nich schopná vytvoriť rozprávku, pričom ju dokázala dokonca aj zaspievať. Znelo to až nečakane prirodzene.

Technológia tiež dokáže vidieť cez kameru, vďaka čomu vám napríklad povie, čo máte práve na sebe oblečené, alebo kam sa vaše oči pozerajú. Toto môže veľmi pomôcť hendikepovaným používateľom so zrakovým postihnutím. A je to ešte lepšie.

Pokiaľ do záberu ukážete matematickú rovnicu na papieri, prípadne pre GPT-4o zazdieľate obrazovku, technológia ju okamžite vidí a dokáže vám pomôcť s jej riešením.

Prečítajte si tiež  Nová, dychberúca funkcia na YouTube využíva umelú inteligenciu. Toto je revolúcia v sledovaní videí

Celé je to navyše interaktívne, takže AI bude reagovať aj na zmeny, ktoré počas riešenia rovnice urobíte. Ide o ideálny spôsob, ktorý nám môže zmeniť pohľad na vzdelávanie.

Je toho ešte oveľa viac. Technológia je zadarmo

Nová GPT-4o funguje aj ako automatický prekladač v reálnom čase. Ak s ňou odfotíte jedálny lístok v zahraničnej reštaurácii, technológia vám ho bude schopná preložiť a takisto vám povie viac o konkrétnych typoch jedál.

Taktiež by mala byť v budúcnosti schopná presne analyzovať športové zápasy a následne ľuďom vysvetliť ich pravidlá.

No a najlepšie na záver, GPT-4o je aktuálne zadarmo pre úplne každého používateľa, pričom platí, že na jej spustenie a testovanie nebude nutné ani vytváranie registrácie. Toto môže byť príležitosť aj pre vás. Tak čo hovoríte na túto inováciu vy?

Predstavenie GPT-4o si môžete pozrieť aj na oficiálnom videu: 

Nezabudnite tiež na náš SvetApple bazár, v ktorom nájdete viac ako 1000 inzerátov na rôzne Apple zariadenia. Tie sem môžete pridať úplne zadarmo kliknutím na tento odkaz.

Môže ťa zaujímať
- Reklama -