W styczniu tego roku startup DeepSeek, zajmujący się sztuczną inteligencją, opublikował dwa przełomy poprzez swój nowy model R1, cicho redefiniując ekonomię sztucznej inteligencji.Ten model osiąga najwyższą wydajność przy 1/40 kosztów poprzedniego modeluOd grudnia 2024 roku model dużych języków DeepSeek V3 zmniejszył koszty szkolenia o ponad 90%.
Dwa przełomy DeepSeek przyciągnęły szeroką uwagę:DeepSeek ujawnił, że proszenie modeli sztucznej inteligencji o opracowanie ich procesów rozumowania - podejście badawcze znane jako łańcuch myśli - poprawiło dokładność i wydajnośćPo drugie, DeepSeek wykorzystuje sztuczną inteligencję do generowania własnych zestawów danych, całkowicie niezależnych od ręcznego oznakowania danych.Chociaż istnieją argumenty, że DeepSeek nie jest tak tani, jak twierdzi, te przełomy z pewnością zapoczątkowały nową erę ekonomii sztucznej inteligencji.
Struktura kosztów sztucznej inteligencji zmienia się dramatycznie.i inwestycje w infrastrukturęZmiana ta może zmienić siły rynkowe, pomagając ostatecznie zwinnym start-upom dogonić technologicznych gigantów w krótkim okresie, jednocześnie zwiększając marże zysku.
Giganci technologiczni zainwestowali już ponad 100 miliardów dolarów w rozwój infrastruktury sztucznej inteligencji, a liczba ta wciąż rośnie.Teraz muszą rozważyć, jak generować zwrot z tych ogromnych inwestycji i utrzymać przewagę nad algorytmami przeciwko bardziej zwinnymW obliczu szybko zmieniającego się otoczenia zarówno giganty technologiczne, jak i startupy stoją przed wyraźnym sygnałem: szybko wykorzystać szansę postępu technologicznego,lub zostać wyeliminowany.
Krajobraz rynku sztucznej inteligencji przed i po DeepSeek
Przed powstaniem DeepSeek, startupy zmagały się z inwestycjami w infrastrukturę gigantów technologicznych,/które wlewało miliardy dolarów /w budowę ogromnych centrów danych /każdego kwartału /i czerpało ogromne korzyści z postępów w technologii sztucznej inteligencjiTe giganty posiadają nie tylko ogromne zasoby danych, ale również gromadzą dużą liczbę doktorantów, a postęp algorytmów zależy również od ich silnej siły technicznej.długotrwałe sieci dystrybucyjne umożliwiają im szybkie przesyłanie produktów do istniejących klientów i przyspieszenie postępu technologicznego poprzez pętle zwrotnej.
Obecnie startupy są wystarczająco duże, by konkurować z gigantami technologicznymi.znacząco zmniejszenie przewagi gigantów technologicznych w zakresie infrastrukturyW ciągu ostatnich trzech lat koszty rozumowania spadły niemal tysiąc razy i spodziewane są dalszych spadków.Okres trwania korzyści algorytmicznej został skrócony do 45-100 dni i może nadal zmniejszać się.
Kiedy koszty szkolenia nie będą już głównym wąskim gardłem, wydajność wnioskowania (tj. jak dobrze modele sztucznej inteligencji działają w aplikacjach w czasie rzeczywistym) stanie się nowym celem.tańsze modele, które oferują porównywalną moc do większych modeli i mogą działać na GPU o niższej wydajnościJeśli inteligentniejsze produkty sztucznej inteligencji mogą być dostarczane za bardzo niskie koszty, to startupy wreszcie mają szansę przewyższyć gigantów technologicznych przy jednoczesnym zwiększeniu zysków.
Efektywne alokacje siły roboczej dodatkowo wzmacniają przewagę konkurenta, ponieważ nie ma już potrzeby zatrudniania dużej liczby talentów na poziomie doktoranckich, aby zebrać konkurencyjny zespół sztucznej inteligencji.optymalizowaćI, ponieważ są one w dużej mierze skoncentrowane na poziomie aplikacji,Wspierający przedsiębiorcy mogą korzystać z wyższych marż zysku w taki sam sposób, w jaki startupy chmury zyskały przewagę dzięki poprawie ekonomiczności jednostki 15 lat temu.
Po ogłoszeniu przez DeepSeek, cena akcji Nvidia spadła o 12%, chociaż od tego czasu odbiła się.Ryzyko dla producentów chipów wzrasta, ponieważ popyt zmienia się z sprzętu skoncentrowanego na szkoleniach na bardziej wydajne rozwiązania wnioskoweWzrost jednostek przetwarzania neuronowego klasy konsumenckiej (Npus) może przyspieszyć tę zmianę, umożliwiając modelowi sztucznej inteligencji uruchomienie w sposób natywny na urządzeniach takich jak smartfony i laptopy.
Wydatki na sztuczną inteligencję
Co jest dobre dla wyzwańców, jest złe dla gigantów technologicznych.Giganci AI niemal instynktownie powiązali dominację DeepSeek z konsekwencjami bezpieczeństwa narodowego, próbując zebrać poparcie dla rozwoju podobnej technologii., ignorując fakt, że amerykańscy naukowcy, w tym z Uniwersytetu Stanforda, byli w stanie powtórzyć, a nawet przewyższyć technologię DeepSeek.Firmy inwestujące ogromne sumy w projekty infrastruktury danych mogą zapytać:: Czy ogromne wydatki na badania i rozwój modeli sztucznej inteligencji były na marne?
Historyczne trendy sugerują, że większość postępów AI rzeczywiście polegała na nadmiernych inwestycjach kapitałowych w skali.przekraczające to, co w tym czasie uważano za algorytmicznie optymalneNowe postępy technologiczne dowodzą, że możemy osiągnąć tę samą wydajność przy niższych kosztach.Zwiększenie liczby dostawców chmury w hiperskali nadal wymaga większych centrów danych i musi ponieść rosnące koszty wnioskowania.
Widzimy już wyścig zbrojeń o osiągnięcia DeepSeek, z takimi jak model Gemini Google,Microsoft Azure AI Foundry i Meta's open source LLaMA wszyscy walczą o dominacjęMark Zuckerberg, dyrektor generalny Meta, podkreślił znaczenie spersonalizowanej sztucznej inteligencji - czyli modeli dostosowanych do potrzeb, kultury i preferencji poszczególnych użytkowników..Ta wizja jest zgodna z szerszym trendem w rozwoju sztucznej inteligencji: mniejsze, bardziej wyspecjalizowane modele, które są w stanie zapewnić wysoką wydajność bez potrzeby ogromnej infrastruktury chmury.
Startupy wygrywają nowe żetony
Jednocześnie giganty open source i closed source mają różne cele, co jeszcze bardziej zwiększa przewagę rywala.Modele open source stworzone przez firmy takie jak Meta będą nadal konkurować i zmniejszać koszty w całym ekosystemie, podczas gdy modele z zamkniętym kodem źródłowym starają się pobierać wyższe opłaty dzięki lepszej technologii.jednocześnie zwiększając marże zysku.
Niezależnie od wielkości przedsiębiorstwa, przesłanie jest jasne: Skorzystaj z konkretnych korzyści, jakie mają - dynamiki rynku, mocy obliczeniowej i talentu - szybko lub nie.Cykl postępu technologicznego króci się, od miesięcy, a nawet lat potrzebnych do ustalenia nowych standardów wydajności, do przełomu technologicznego DeepSeek sugerującego, że teraz może to zająć zaledwie 41 dni.Innowacje rozwijają się w bezprecedensowym tempie, a przestrzeń tolerancji błędów gwałtownie się kurczy.