NVIDIA memperkenalkan platform komputasi AI rack-scale generasi berikutnya bernama Vera Rubin yang dirancang untuk pelatihan dan inferensi model AI skala besar dengan efisiensi biaya tinggi. Platform ini menggabungkan enam chip baru dalam satu arsitektur terpadu untuk menghadirkan superkomputer AI yang koheren, dijadwalkan tersedia melalui mitra NVIDIA pada paruh kedua 2026.
Enam Komponen Chip Platform Vera Rubin
Platform Vera Rubin terdiri dari NVIDIA Vera CPU yang dioptimalkan untuk workload AI dan reasoning agen, NVIDIA Rubin GPU untuk inferensi dan pelatihan AI skala besar, NVLink 6 Switch untuk interkoneksi antar GPU/CPU, ConnectX-9 SuperNIC untuk jaringan pusat data, BlueField-4 DPU untuk pemrosesan data dan keamanan, serta Spectrum-6 Ethernet Switch untuk skala data center.
“Platform ini menggunakan design co-engineering yang menyatukan seluruh komponen untuk menangani beban kerja agentic AI dan mixture-of-experts dengan biaya token inference lebih rendah hingga 10× dibanding platform sebelumnya,” menurut pengumuman NVIDIA.
Arsitektur terpadu ini memungkinkan CPU, GPU, jaringan, dan penyimpanan bekerja secara koheren untuk efisiensi tinggi dalam skenario produksi AI skala besar.
Performa dan Efisiensi untuk Model AI Besar
Platform Vera Rubin mampu memangkas kebutuhan jumlah GPU untuk pelatihan model besar hingga 4× lebih sedikit dibanding generasi Blackwell. Sistem ini juga mendukung deployment di skala data center yang luas dengan NVIDIA Confidential Computing generasi berikutnya yang menjaga keamanan data di CPU, GPU, dan komunikasi antar perangkat untuk beban kerja multi-tenant.
Nama platform diambil dari Vera Florence Cooper Rubin, astronom yang berkontribusi pada pemahaman materi gelap di alam semesta, melambangkan kemampuan platform dalam membuka kapabilitas baru AI.
Ekosistem dan Ketersediaan
NVIDIA mengembangkan ekosistem software dan dukungan luas yang memungkinkan partner seperti AWS, Google Cloud, dan Microsoft mengadopsi platform ini dalam infrastruktur AI mereka. Produk berbasis Vera Rubin akan tersedia melalui mitra NVIDIA mulai paruh kedua 2026 sebagai fondasi pusat data AI generasi berikutnya di berbagai industri.
Platform ini dirancang menjadi tulang punggung infrastruktur AI masa depan dengan menyatukan komputasi, jaringan, dan perangkat khusus dalam satu sistem terintegrasi yang terukur dan aman.
Disclosure: Artikel ini ditulis dengan bantuan AI dan dalam pengawasan editor