Natrag na Blog

OpenAI i Broadcom: Novi val prilagođenih AI čipova mijenja pravila igre

OpenAI i Broadcom: Novi val prilagođenih AI čipova mijenja pravila igre OpenAI prelazi iz faze...

OpenAI i Broadcom: Novi val prilagođenih AI čipova mijenja pravila igre

OpenAI prelazi iz faze razvoja modela u eru vertikalne integracije – od softvera do vlastitog hardvera. Prema više izvora, tvrtka će u partnerstvu s Broadcomom razviti vlastite AI čipove, a masovna proizvodnja trebala bi započeti već iduće godine, gledano iz perspektive rujna 2025., dok se prvi javni plasman očekuje 2026. Ovo nije eksperiment ili prototip za pokazivanje – riječ je o ozbiljnoj proizvodnji i integraciji, gdje Broadcom donosi stručnost u poluvodičima i mrežama, a OpenAI vlastite modele i radna opterećenja.

Zašto je ovo važno upravo sada? Lanci opskrbe su pod političkim pritiscima, cijene računalnih resursa rastu, a dostupnost GPU-ova postala je ključna prepreka za svaki veći AI projekt. Ako OpenAI i Broadcom uspješno isporuče vlastiti ASIC, to bi moglo redefinirati trošak po tokenu i performanse po vatu za inferenciju – pa čak i treniranje – na razini interneta.

OpenAI i Broadcom logotipi na pozadini podatkovnog centra

Partnerstvo za novu AI infrastrukturu

Signali s puta: što znamo, a što još čekamo

Prvi izvještaji sugeriraju da će masovna proizvodnja krenuti 2026., uz mogućnost ranijih uzoraka, što se uklapa u tipični 12–18-mjesečni ciklus razvoja prilagođenih ASIC-ova. No, ključne tehničke specifikacije još nisu objavljene: procesna tehnologija, kapacitet HBM memorije, tipovi međusobnog povezivanja, numerički formati (FP8/FP16/INT8) i potrošnja energije ostaju nepoznanica. Bez tih podataka, teško je procijeniti radi li se o čipovima za treniranje, inferenciju ili hibridnim rješenjima za optimizaciju ukupnog troška vlasništva (TCO).

"Smanjenje ovisnosti o NVIDIJI" – izričit je strateški cilj koji pokreće ovaj razvoj.

Vertikalna integracija donosi prednosti u kontroli troškova i performansi. Su-dizajn hardvera i modela može smanjiti latenciju, optimizirati memorijske tokove i standardizirati ključne operatore, što rezultira boljim omjerom cijene i performansi za produkcijske AI zadatke. No, time OpenAI preuzima i rizike – od životnog ciklusa hardvera, preko održavanja firmwarea i drivera, do dugoročne podrške za developere.

NVIDIA i dalje dominira tržištem, s CUDA/cuDNN ekosustavom koji stvara visoke troškove prelaska. Ipak, Broadcomova kombinacija ASIC-ova i mrežnih rješenja omogućuje im da ponude integrirane pakete – računalnu snagu i povezivanje u jednom. Ako OpenAI-ovi čipovi ispune očekivanja, dio tržišta mogao bi se odmaknuti od GPU-centric dizajna. U međuvremenu, izvozna ograničenja oblikuju tko može kupiti što i gdje.

Geopolitika je postala tehnička specifikacija. NVIDIA je u drugom kvartalu 2025. zabilježila nula prodaja H20 GPU-ova Kini zbog američkih izvoznih ograničenja, dok je za to tržište razvijen B30 model. Kineska domaća izgradnja AI infrastrukture je ogromna – procjenjuje se na 50 milijardi dolara u bliskoj budućnosti i čak 3–4 bilijuna dolara do 2030. Lokalni proizvođači poput Cambricona bilježe rast prihoda od čak 4.300% u prvoj polovici 2025., što pokazuje koliko politika može brzo promijeniti tržišne odnose.

Financijska tržišta reagiraju unaprijed. Broadcom (AVGO) je do rujna 2025. porastao 28% YTD, analitičari očekuju EPS od 1,66 dolara i prihode od 15,82 milijardi dolara za Q3, a uprava je odobrila otkup dionica vrijedan 10 milijardi dolara. Ipak, dio izvještaja nosi napomene da su AI-generirani ili nepotpuno provjereni – što znači da sentiment često ide ispred stvarnih rezultata.


Specijalizacija protiv fleksibilnosti: trendovi i protuteže

Trend je jasan: specijalizacija dobiva na važnosti. Veliki cloud igrači koji pokreću masovne inferencijske zadatke najviše profitiraju od ASIC-ova prilagođenih njihovim modelima. Kontrola nad kompilatorom i silicijem omogućuje optimizaciju svakog sloja modela prema mogućnostima čipa.

No, fleksibilnost još uvijek pobjeđuje u istraživačkim sprintovima. GPU-ovi su i dalje nezamjenjivi za razvoj novih arhitektura, brzu iteraciju i široku podršku ekosustava. Kupci koji razmatraju ASIC-ove suočavaju se s klasičnom dilemom – niži TCO za stabilne produkcijske zadatke nasuprot agilnosti za nove modele. Većina će birati kombinaciju, a ne potpunu zamjenu.

Drugi trend je integracija: Broadcomova mrežna rješenja omogućuju prodaju računalne snage, povezivanja i telemetrije u paketu. To može povećati iskorištenost klastera i smanjiti latenciju, posebno kod distribuirane inferencije.

No, vremenski okviri mogu odlučiti pobjednika. Ako OpenAI i Broadcom ne isporuče validirani silicij, drivere i kompilatore do 2026., postojeći lideri dobit će dodatno vrijeme za jačanje softverske prednosti i dugoročne ugovore.

PokretačiOgraničenja
Eksplozija troškova AI-aNedostatak tehničkih specifikacija
Ograničena dostupnost GPU-aZrelost alata u odnosu na CUDA
Potreba za boljim perf/wattIntegracija u podatkovne centre
Geopolitička fragmentacijaNepotpune objave i nesigurnost
Broadcomov kapital i portfelj

Podijeljena karta svijeta s lancima opskrbe čipovima i izvoznim barijerama

Geopolitika oblikuje AI hardver

Prilike i rizici za ključne aktere

Što OpenAI i Broadcom mogu dobiti ili izgubiti

  • Prilika: Smanjenje troška po tokenu za stabilnu inferenciju u velikim razmjerima. ASIC optimiziran za poznate operatore i memorijske tokove može nadmašiti opće GPU-ove u performansama po vatu i ukupnom trošku vlasništva.
  • Rizik: Softver određuje usvajanje. Kompilatori, alati za kvantizaciju, kernel biblioteke, alati za debuggiranje i performanse moraju biti na razini produkcije. Stabilnost firmwarea i putovi za oporavak od grešaka bit će ključni za povjerenje kupaca.
  • Rizik: Izvršenje programa. Zatvaranje RTL-a, fizički dizajn, validacija i upravljanje iskoristivošću pod pritiskom lokalizacije lanca opskrbe mogu produžiti rokove. Rezervacije kapaciteta u vodećim tvornicama (još nepoznate) su ograničavajući faktor.

NVIDIA i GPU ekosustav: prijetnje i prilike

  • Prilika: Ako OpenAI cilja inferenciju, potražnja za GPU-ovima za treniranje može ostati visoka ili čak rasti, jer se razvijaju novi modeli. NVIDIA bi mogla dodatno učvrstiti softversku prednost.
  • Rizik: Ako OpenAI pokaže znatno bolje performanse po vatu ili trošku po tokenu u idućih 18 mjeseci, veliki kupci će tražiti niže cijene GPU-ova, diversificirati nabavu i zahtijevati veću interoperabilnost.

Investitori: visoka očekivanja, ali i volatilnost

  • Prilika: Snažni signali Broadcoma – +28% YTD, EPS 1,66 dolara, prihodi 15,82 milijardi dolara, otkup dionica od 10 milijardi – ukazuju na povjerenje uprave. Ako prihodi od AI ASIC-a krenu već u fiskalnoj 2026., postoji potencijal za rast.
  • Rizik: Ishod je binaran. Kašnjenja ili manji doprinos prihodu mogu uzrokovati korekcije cijene dionica. Neki izvještaji su djelomično AI-generirani – volatilnost treba promatrati kao sentiment, a ne temeljnu vrijednost dok ne stignu službeni podaci.

Poduzeća i cloud pružatelji: balansiranje između inovacije i fragmentacije

  • Prilika: Višedobavljački stackovi smanjuju geopolitičke i opskrbne rizike te omogućuju arbitražu troškova između specijaliziranih i općih akceleratora. Ugovori će sve češće dijeliti radna opterećenja po klasi hardvera.
  • Rizik: Trošak fragmentacije. Održavanje više alata, kernela i runtime okruženja povećava integracijske i kadrovske troškove. Rizik od zaključavanja raste ako su čipovi vezani uz vlasničke runtime sustave.

Scenariji za sljedećih 24 mjeseca: što očekivati

Kratkoročno (6–12 mjeseci)

  • Osnovni scenarij: Inženjerski prekretnice su ostvarene; pojavljuju se prvi uzorci silicija ili emulacije; preliminarni prikazi kompilatora i alata za odabrane partnere. Komunikacija jasno definira ciljana radna opterećenja (vjerojatno inferenciju).
  • Negativni scenarij: Kašnjenje u kapacitetima tvornica ili validaciji; ograničena transparentnost; developeri oklijevaju zbog nezrelosti alata.

Srednjoročno (12–24 mjeseca, do kraja 2026.)

  • Pozitivni ishod: Mjerljiva poboljšanja u performansama po vatu i trošku po tokenu na vodećim OpenAI modelima; integrirani paketi računalne snage i mreže; prvi vanjski korisnici putem cloud API-ja.
  • Neutralni ishod: Paritet s konkurencijom na nekim metrikama, ali trenje u ekosustavu ograničava širu primjenu izvan OpenAI-jevih radnih opterećenja; GPU-ovi zadržavaju većinu tržišta za treniranje.
  • Negativni ishod: Kašnjenja, skromna poboljšanja ili nedostatak alata zadržavaju tržište oko GPU-ova; postojeći lideri učvršćuju poziciju kroz softver i ugovore.

Ključne preporuke i otvorena pitanja za 2025.

Što se događa?
OpenAI i Broadcom ulaze u masovnu proizvodnju prilagođenih AI čipova s lansiranjem 2026. i mogućim ranim uzorcima. Cilj je čvršća integracija hardvera i softvera te smanjenje ovisnosti o NVIDIJI.

Zašto je to važno?
Troškovi i kapacitet definiraju granice AI-a. Specijalizirani silicij mogao bi omogućiti povoljniju ekonomiju za produkcijski AI. Broadcomova mrežna rješenja čine integrirane podatkovne centre realnom opcijom. Geopolitika ubrzava eru višedobavljačkih rješenja.

Što dalje pratiti?
- Objavu tehničkih specifikacija: procesna tehnologija, HBM, međupovezivanje, numerički formati, potrošnja energije. - Softverski ekosustav: kompilatori, alati za kvantizaciju, kernel biblioteke, vodiči za migraciju. - Financijske izvještaje: prihodi od AI čipova, kapitalna ulaganja, signali o korisničkoj bazi.

Otvorena pitanja:
- Hoće li prva generacija biti optimizirana za treniranje ili inferenciju? - Koje tvornice i procesni čvorovi će se koristiti, i gdje će se proizvodnja odvijati? - Koliko će softver biti prenosiv – hoće li postojati podrška za CUDA, ONNX/TVM ili novi runtime? - Kakvi su komercijalni uvjeti – ekskluzivnost, licenciranje, dugoročna podrška? - Kako će se uskladiti s izvoznim režimima i regionalnim varijantama proizvoda?

Preporučene akcije: - CTO-ovi: Pokrenite dvostruku strategiju – testirajte ASIC-ove i GPU-ove na vlastitim zadacima; planirajte budžet za evaluaciju alata i pilot klastere u 2026. - CFO-ovi: Modelirajte osjetljivost na poboljšanja troška po tokenu i diversifikaciju nabave; izbjegavajte dugoročne ugovore s jednim dobavljačem. - Razvojni inženjeri: Ulažite u prenosive grafičke IR-ove i apstrakcijske slojeve (ONNX/MLIR/TVM); stabilizirajte skup operatora radi lakšeg portanja. - Investitori: Budite oprezni prema senzacionalističkim naslovima; tražite konkretne podatke, pilot projekte i korisničke reference prije procjene višegodišnjih prihoda.


Zaključak: Prava kombinacija specijalizacije i fleksibilnosti

Ako OpenAI i Broadcom uspješno pretvore najave u validirani silicij, težište produkcijskog AI-a moglo bi se pomaknuti s paradigme "GPU po defaultu" prema "pravi silicij za pravi zadatak". Pobjednici će biti oni koji znaju gdje specijalizacija donosi najveći povrat, a gdje je fleksibilnost ekosustava presudna.