← Kembali ke In-DepthIn-Depth Report

Dekonstruksi Monopoli Silikon: Analisis Arsitektur, Ekonomi Inferensi, dan Batasan Termodinamika NVIDIA GTC 2026

Diagram arsitektur sistem NVIDIA Vera Rubin NVL72 dan chip GPU R100
1

NVIDIA GTC 2026: Era Inferensi Agen

NVIDIA bergeser dari fokus pelatihan model ke era 'inferensi agen' dengan proyeksi permintaan infrastruktur AI mencapai $1 triliun pada 2027.

key_point
2

Platform Vera Rubin: Melampaui Batas Fisika

GPU Rubin R100 membawa 336 miliar transistor dan bandwidth memori 22 TB/s untuk menangani beban kerja agen AI yang intensif.

336 Miliar Transistor, 22 TB/s Bandwidth Memori, 50 PetaFLOPS FP4
statistic
3

Superkomputer Skala Rak: NVL72

Satu rak NVL72 mengintegrasikan 72 GPU Rubin, memberikan kinerja inferensi 3,6 ExaFLOPS dengan efisiensi biaya 10x lebih murah.

72 GPU per rak, 3.600 PetaFLOPS (3,6 ExaFLOPS), 20,7 TB HBM4
graph
4

Manuver $20 Miliar: Akuisisi Groq

NVIDIA mengakuisisi aset Groq untuk mengintegrasikan teknologi LPU guna menekan latensi inferensi yang tidak bisa dicapai GPU konvensional.

key_point
5

Tantangan Fisik: Krisis 600 kW

Arsitektur masa depan Rubin Ultra memerlukan daya 600 kW per rak, memicu tantangan infrastruktur listrik yang sangat berat.

600.000 Watt per rak, 100 GW kapasitas pusat data
conclusion