OpenAI predstavio je najnoviji veliki jezični model imena GPT-4o koji za razliku od običnog GPT-4 će prepoznati sliku, zvuk i tekst u stvarnom vremenu.
POGLEDAJTE VIDEO:
- To je veliki korak naprijed kada je u pitanju jednostavnost korištenja - rekla je direktorica OpenAI-ja Mira Murati.
Naime, imat će impresivne sposobnosti da procijeni što vidi kroz kameru pametnog telefona korisnika, pomogne u rješavanju matematičkih problema, a čak je i pomogao prilikom kodiranja u kratkom video predstavljanju.
Može odgovoriti i na auto upit, a iz OpenAI su se pohvalili da obrađuje audio ulaz za samo 232 milisekunde, što bi odgovaralo vremenu ljudskog odgovora u razgovoru. Kako su pojasnili, razlog za to je u činjenici da GPT-4o ne mora transkribirati tekst, već audio odmah obrađuje neuronska mreža.
Ovaj model će zvučati i prirodnije zahvaljujući ženskom glasu koji odgovara na pitanja u realnom vremenu.
Kako je prilikom predstavljanja istaknuo CEO OpenAI-ja, Sam Altman, novi model bit će dostupan svim korisnicima ChatGPT-a, pa čak i onima koji ga koriste besplatno.
- Razgovor s računalom nikada mi se nije činio prirodnim; sada jest. Kako dodajemo (neobaveznu) personalizaciju, pristup vašim podacima, mogućnost poduzimanja radnji u vaše ime i više, stvarno vidim uzbudljivu budućnost u kojoj možemo koristiti računala za mnogo više nego ikad prije - rekao je izvršni direktor i suosnivač OpenAI-ja Sam Altman.
ChatGPT također sada može detektirati emocije gledajući lice kroz kameru. Tijekom demonstracije, pokazali su nasmiješeno lice, a AI je upitao "Želite li podijeliti razlog vaših dobrih vibracija?"
ChatGPT također pokreće aplikaciju za stolna računala s glasovnim i vizualnim mogućnostima.