Kunstig intelligens gpt-4o fremhævet mod en baggrund af levende og bløde farver.

OpenAI lancerer GPT-4o, en hurtigere, gratis model, der kan "se" med dit mobiltelefonkamera 

victor pacheco avatar
Opdatering kommer med nye apps til mobiltelefoner og desktops og kan bedre forstå og tale med brugeren, som om de var et menneske

I en hurtig begivenhed afholdt på din kanal YouTube, blev vi introduceret til den nye sprogmodel af OpenAI, hedder GPT-4o. LLM lover at være dobbelt så hurtigt og 50 % billigere end GPT-4 Turbo, virksomhedens mest komplette sprogmodel til dato. Se alle detaljerne lige nu.

Fordele ved GPT-4o

Mira Murati. openai teknologidirektør
Mira Murati, teknologidirektør hos OpenAI, præsenterede en ny sprogmodel (Skærmbillede: Glauco Vital/Showmetech)

"O" af GPT-4o kommer fra det latinske ord "omni”, som betyder “alt”. Under arrangementet OpenAI, Mira Murat, virksomhedens teknologidirektør, indtog scenen for at præsentere den nye sprogmodel. Hun fremhævede, at den nye funktion kan bruges gratis af alle, der har en OpenAI-konto, men alle, der har en ChatGPT Pro-konto, vil have 5 gange beskedgrænsen.

Den store fordel ved den nye sprogmodel er dens understøttelse af mere end 97 sprog, foruden muligheden for at skabe tekster, billeder og præstere på en mere forbedret måde end GPT-4 Turbo. Den nye funktion har også en hukommelsesfunktion, som optager tidligere samtaler for en bedre forståelse af chats i fremtiden.

Virksomheden nævner også, at den nye sprogmodel snart vil være i stand til at surfe på nettet, men sagde ikke, om denne vil være tilgængelig for brugere med gratis konti eller kun for dem med en Pro-konto.

Endelig, ved at lytte til, hvad brugeren siger, kan OpenAIs nye sprogmodel forstå en persons humør. I et eksempel vist under præsentationen identificerede han, at en person ville blive nervøs blot ved at trække vejret tungt. GPT-4o kan også identificere stemning bare fra et billede.

Kunstig intelligens GPT-4O præsentation innovationsteknologi Showmetech.
Ny funktion kan tilgås fra i dag (Billede: Glauco Vital/Showmetech)

Mira Murat delte også, at i øjeblikket bruger mere end 100 millioner mennesker ChatGPT til at skabe billeder, tekster og mere indhold. Direktøren fremhævede OpenAI's store formål med at skabe tilgængelige teknologier for alle, og lanceringen af ​​den nye sprogmodel er endnu en måde at omsætte dette engagement i praksis.

Nøglefunktioner og eksempler

Der kan ikke benægtes, at GPT-4o Det ligner mere en fantastisk personlig assistent, som Google Assistant og Amazon Alexa. Under OpenAI-nyhedsarrangementet blev LLM's evne til at bruge smartphonens kamera til at understøtte dens opgaver demonstreret.

udvikleren Mark Chan Han simulerede at være i en nervøs situation, og umiddelbart efter at have identificeret den unormale adfærd, indikerede sprogmodellen øvelser for at gøre ham roligere. Se videoen herunder:

Den mest interessante funktion er sprogmodellens evne til at genkende ansigtsudtryk, miljøer med mere, blot ved hjælp af smartphonens kamera. Bare giv en kommando til ChatGPT og åbn kameraet og vent på, at det er gjort om et par sekunder. Se demoen:

https://twitter.com/chamavito/status/1790093050905051396

Er du en person, der har brug for hjælp til matematiske problemer, kan kunstig intelligens også hjælpe med at løse dette ved hjælp af støttekameraet. Under dagens begivenhed designede en udvikler en førstegradsligning (3X + 1 = 4), og med støtte fra den nye sprogmodel, der findes i ChatGPT, lykkedes det at opnå resultatet. Se en anden demo:

Med understøttelse af mere end 97 sprog, AI's kunstige intelligens OpenAI Du vil også have mulighed for at hjælpe to personer, der taler forskellige sprog, i realtid (noget allerede set i Google Translate). Bare giv kommandoen og citer begge sprog, og en samtale kan føres ved at bruge GPT-4o sprogmodellen som base. Tjek ud:

Virksomheden fremhæver også, at alle ordrer foretaget af brugere kan ændres, mens stemmen til GPT-4o sender svarene. På denne måde er det ikke længere nødvendigt at vente på, at et helt svar sendes for at fremsætte en ny anmodning til den kunstige intelligens. Se demoen:

Under afbrydelsen af ​​afsendelse af svar vil det være muligt at ændre tonefaldet, intonationen af ​​de sendte kommandoer og talehastigheden for den kunstige intelligensstemme. Alt dette på få sekunder. Dette er blot nogle få eksempler på, hvad den nye sprogmodel kan, men den nye funktion vil helt sikkert få nye muligheder, når den er frigivet til generel brug.

Ny desktop-app

Skærmbillede af Python-kode til meteorologisk dataanalyse, der viser temperaturgrafer og visualiseringer med fokus på trendanalyse og datavisualisering.
Desktop-applikation vil blive lanceret til macOS, i det mindste i dette første øjeblik (Foto: Glauco Vital/Showmetech)

En applikation, der simulerer brugen af ​​kunstig intelligens på nettet, blev lanceret og vist under arrangementet OpenAI af i dag. Ud over at sende svar på kommandoer skrevet i chatten, kan applikationen, som allerede har den nye integrerede sprogmodel, se, hvad der bliver vist på skærmen og endda lave resuméer. Den nye funktion kan også bruge Mac'ens webcam til at "se" og genkende billeder.

For nu er ChatGPT desktop-appen kun udgivet til macOS fra og med i dag for Pro-brugere og andre brugere i løbet af de næste par uger. Der er ingen information om tilgængelighed for Windows eller Linux, men vi opdaterer artiklen, når informationen udgives af OpenAI.

Virksomheden udnyttede også lanceringen til at forny AI-webgrænsefladen, dog uden at annoncere en dato for implementering. Se:

Ny chatgpt interface med gpt-4o sprogmodel
Navigation blev mindre forurenet (Foto: Reproduction/MacRumors)

Blandt de nye funktioner er der repositionering af knapper og et mere centraliseret layout til AI-svar, alt sammen for at være mere "venligt og konverserende", ifølge virksomheden.

Tilgængelighed

udgivelsen af GPT-4o, trods start i dag, vil det blive gjort i dele. Ifølge pressemeddelelsen vil alle, der har en gratis eller Pro-konto, have adgang til GPT-4o-kapaciteten gratis, men de, der er abonnenter, vil have en sprogmodel med en 5x større beskedgrænse. Se den nye grænseflade for OpenAI-abonnenter:

gpt-4o sprogmodel
Sprogmodellen frigives fra og med i dag (Foto: Bruno Martinez/Showmetech)

Når vi taler om Voice Mode, som giver stemme til ChatGPT, vil det være nødvendigt at vente lidt længere: virksomheden meddelte, at denne funktion vil blive lanceret senere, med sin fulde kapacitet, "i de kommende uger".

API'et GPT-4o Den er også blevet frigivet og er 2x hurtigere end GPT-4 Turbo, udover at den er 50% billigere og har 5x højere hastighedsgrænser i forhold til den tidligere model.

Kan ChatGPT blive en personlig assistent?

Nyhederne kommer for at ændre, hvordan vi bruger den AI, der er blevet berømt siden slutningen af ​​2023. Og der er ingen tvivl om, at OpenAI præsenterer sit fantastiske værktøj som en interessant mulighed mod Google Assistant og Amazon Alexa, især da det nu kan " tale”.

Det er stadig uvist, om det vil være tilgængeligt på enheder, der lanceres i resten af ​​2024, men vi ser begyndelsen på en ny æra for at bruge ChatGPT. Fortæl os i mellemtiden Kommentar hvordan ser du denne ændring, og hvad er din yndlingsfunktion introduceret i dag.

Se også

https://www.showmetech.com.br/openai-e-moderna-anunciam-parceria-para-melhorar-vacinas

ChatGPT-4 udkonkurrerer psykologer i social intelligenstest, siger undersøgelse

OpenAI og Moderna annoncerer partnerskab for at forbedre vacciner og behandlinger

Med information: OpenAI

Anmeldt af Glaucon Vital den 13/5/24.


Opdag mere om Showmetech

Tilmeld dig for at modtage vores seneste nyheder via e-mail.

Relaterede indlæg