Index
Sidste weekend vakte en kunstig intelligens kaldet DeepSeek, udviklet i Kina, opsigt i teknologiverdenen og får aktieværdien af amerikanske giganter som NVIDIA, Google, Meta og Microsoft til at styrtdykke med mere end 1 billion dollars. Forstå, hvordan det virker, og hvordan det kan påvirke teknologiens verden, men specifikt OpenAI's ChatGPT.
Hvad er DeepSeek
DeepSeek er en kinesisk kunstig intelligens-virksomhed, oprettet i 2023 af Liang Wenfeng, kinesisk iværksætter og medstifter af kvantitativ hedgefond High-Flyer. Denne fond, der er berømt for at bruge maskinlæringsteknikker i aktieinvesteringer, er også den nuværende finansierer af virksomhedens AI-forskning.
Siden 2023 har virksomheden tiltrukket sig global opmærksomhed på grund af den hurtige udvikling af dets sprogmodeller eller LLM'er.
Lavprisudvikling
Den største fordel ved modeller er deres udviklingsomkostninger. I en nyligt udgivet artikel forklarede virksomheden, at dens sprogmodel DeepSeek-V3 Brugt 2 tusinde NVIDIA H800-kort, som i forvejen er forholdsvis gamle, til træning på en samlede omkostninger på 5,5 millioner dollars.
Til sammenligning er det kun en brøkdel af omkostningerne ved at træne en model som Metas Llama 3.3, som alene i år forventes at bruge mere end 65% milliarder dollars i sin forbedring. I denne sammenligning ender DeekpSeeks omkostninger med at blive endnu lavere end årslønnen for nogle ledere i Metas virksomhed. Ifølge analytikere når omkostningsreduktionerne imponerende 95%.
Denne præstation sætter en stopper for paradigmet om, at høje investeringer i datacenterinfrastruktur og elektricitet ville være nødvendige for at træne AI'er, hvilket gør DeepSeek til en AI, der ikke kun er billigere, men også mere økologisk bæredygtig.
I teorien, i stedet for at bruge specialiserede datacentre med meget dyre GPU'er designet til høje AI-krav, kunne DeepSeek-modeller endda trænes på hjemmecomputere med traditionelle GPU'er, hvilket forårsager både forbløffelse og frygt i virksomheder som NVIDIA, som blev så udnyttet af seneste hastværk med at bygge datacentre af virksomheder, der søger en andel på dette marked.
Af denne grund, i det, der er blevet kendt som “DeepSeek Panic Day” ou "DeepSeek panik dag", I fri oversættelse var den 27. januar præget af fald i milliarder dollars i aktier på NASDAQ, børsen for amerikanske højteknologivirksomheder, og nåede op på 3,5 % af det samlede omsatte. ChatGPTs konkurrent har alt for at få succes.
DeepSeek-V3 og DeepSeek-R1
Virksomhedens modeller er også et eksempel på effektivitet. DE DeepSeek-V3, for eksempel kan prale af imponerende ydeevne på tværs af flere benchmarks, mens de kræver væsentligt færre ressourcer end konkurrenter som Metas Llama 3.3. Og den DeepSeek-R1, lanceret i januar 2025, fokuserer på ræsonnementopgaver og udfordrer OpenAIs o1-model med dens avancerede funktioner.
I bund og grund lærer begge kinesiske modeller for kunstig intelligens ved at interagere med deres omgivelser og modtage feedback på deres handlinger, svarende til hvordan mennesker lærer gennem erfaring. Dette giver dem mulighed for at udvikle sig mere sofistikerede ræsonnement færdigheder og tilpasse sig nye situationer mere effektivt. Denne tilgang er også billigere end den "human supervised learning" brugt af konkurrenter.
En anden fordel ved denne kinesiske AI er ressourcebesparelse. I stedet for at bruge alle modellens parametre til at besvare en forespørgsel, vælger DeepSeeks modeller kun nogle få "specifikke parametre" eller "eksperter" til emnet. Denne selektive aktivering reducerer beregningsomkostningerne betydeligt og øger modeleffektiviteten.
Hvis man forklarer det på en enklere måde, ville det være som at have et stort team af specialister til rådighed til alle typer opgaver, men kun ringe til dem, der er bedst egnede til at udføre det i en konkret sag, hvilket garanterer effektiv brug og ekspertise i service.
O DeepSeek-V3 også beskæftiger destillationsteknikker, hvilket betyder, at den overfører viden og kapaciteter fra større modeller til mindre, mere effektive modeller. Det er som en lærer, der overfører deres viden til en elev, så eleven kan udføre opgaver med lignende færdigheder, men med mindre erfaring eller ressourcer.
Resultatet er en kunstig intelligens, der optager mindre plads og ressourcer, med høj effektivitet til at arbejde på mindre enheder, såsom smartphones og notebooks. For at gøre applikationen tilgængelig til smartphones og også i webversionen brugte virksomheden DeepSeek R1 som base og transformerede den til en app.
Open source model
Ud over at kombinere effektivitet og præstationsteknikker, udnytter modellerne også det samarbejde, der ligger i designprojekter. åben kode (eller open source, på engelsk).
Her, i modsætning til en virksomhed som OpenAI, der arbejder privat med udvikling af AI'er, har DeepSeeks modeller deres kode tilgængelig på nettet, og de kan tilgås, testes og endda rettes af det globale fællesskab af udviklere, hvilket også afspejler mere gennemsigtighed og tillid til de fremlagte resultater.
Faktisk ønsker virksomheden at opfordre alle til at teste sine modeller og frigiver licenser til sine professionelle for at gøre det nemmere for andre virksomheder at bruge dem.
Strategien styrker også konkurrenceevnen, tiltrækker talenter og fremhæver DeepSeeks førende position, i en form for gratis markedsføring. Virksomheden drager ikke direkte fordel af dette, men vil drage fordel af massevedtagelsen af modellen, idet den er i stand til at tjene penge gennem komplementære tjenester, såsom teknisk support eller premium-versioner, samtidig med at det fremmer et samarbejdende og innovativt økosystem.
Nummer 1 i app-butikker
Nysgerrighed om DeepSeek var ikke kun blandt administrerende direktører og teknologiingeniører.
Lanceret den 20. januar, R1, DeepSeek app til iPhones og Android-smartphones, ser ud til at følge konkurrenten ChatGPTs succesrige vej. Det er allerede den mest downloadede applikation i den amerikanske Apple App Store og den anden i Brasilien, kun efter OpenAI-konkurrenten.
Na Play Butik, Android butik, succesen er også ubestridelig: På verdensplan er den kinesiske chatbot allerede blevet installeret mere end en million gange.
Sam Altman, grundlægger og nuværende administrerende direktør for OpenAI, talte om DeepSeeks succes. Han nævnte, at han holder øje med, hvad kinesisk kunstig intelligens kan, og at den første model er imponerende. Se tweets og oversættelser nedenfor.
Deepseek r1 er en imponerende model, især i forhold til hvad de kan levere til prisen. Det er klart, at vi vil levere meget bedre modeller, og det er også lovligt forfriskende at have en ny konkurrent! Vi vil lave nogle udgivelser.
Men vigtigst af alt, vi er glade for at fortsætte med at eksekvere på vores mål og tror på, at mere computing er vigtigere nu end nogensinde før for at lykkes med vores mission.
Verden kommer til at ville bruge MEGET kunstig intelligens og vil virkelig blive overrasket over de næste generations modeller, der kommer. Vi ser frem til at bringe jer alle af AGI og videre.
Sam Altman om succesen med kinesisk AI DeepSeek.
Implikationer og politisk skævhed
Men med succes opstår der også mistanke. Eksperter stiller spørgsmålstegn ved, om det samlede antal GPU'er, der blev brugt til at træne DeepSeek-modeller, var underrapporteret, med den hensigt at skjule brugen af NVIDIA-hardware, som for nylig blev forbudt at blive solgt i Kina på grund af handelskrigen med USA. Men virksomheden benægter denne kendsgerning og siger, at den formåede at træne sin model selv med laveffekt GPU'er.
Der er også tegn på censur i værktøjet, i overensstemmelse med det kinesiske kommunistpartis forskrifter eller politiske partier. For eksempel, når man bliver spurgt om "1989 Den Himmelske Freds Plads massakre i Beijing", hvor hundredvis af aktivister blev dræbt eller såret af den kinesiske hær, nægter AI at besvare spørgsmålet.
Det samme sker, når AI bliver spurgt om konflikten mellem Kina og Taiwan. DeepSeek nævner, at Taiwan er en del af Kina, og det "Den kinesiske regering er forpligtet til et-Kina-princippet og søger en fredelig genforening af landet.
Hvad er det næste?
Muligheden for at have så effektive AI-modeller til væsentligt lavere infrastrukturomkostninger får investorer til at genoverveje at købe eller endda sælge deres aktier i teknologivirksomheder med fokus på denne sektor.
En af legenderne om venturekapital Amerikansk, Marc Andreessen, ser fremkomsten af DeepSeek som "AI's Sputnik-øjeblik", med henvisning til den historiske første satellitopsendelse i kredsløb i 1957, som markerede det øjeblik, hvor Sovjetunionen midlertidigt overgik USA inden for rumteknologi.
Faktum er, at amerikansk overlegenhed inden for kunstig intelligens er blevet sat i tvivl. Og af denne grund er det sandsynligt, at gengældelse fra den amerikanske regering, måske gennem flere sanktioner mod kommercialisering af amerikanske teknologier og chips til kinesiske virksomheder, vil blive annonceret.
Som reaktion på sagen kaldte den nye præsident Donald Trump fremkomsten af det kinesiske firma DeepSeek for "et wake-up call" for den amerikanske teknologiindustri, et tegn på, at en reaktion snart skulle komme.
Vi vil følge emnet tæt. Fortæl os i mellemtiden Kommentar: Tror du, at DeepSeek kan tage ChatGPT lederskab?
Se videoen
Se også
Med information: Yahoo l Grundd Nyheder l Info penge l Forbes (1 e 2)
Opdag mere om Showmetech
Tilmeld dig for at modtage vores seneste nyheder via e-mail.