📑 Daftar Isi

Chip AI Jalapeño buatan OpenAI dan Broadcom untuk inferensi LLM

OpenAI dan Broadcom Rilis Chip AI Jalapeño untuk Inferensi LLM

Penulis:Nur Hamzah
Terbit:
Diperbarui:
⏱️5 menit membaca
Bagikan:
  • OpenAI dan Broadcom meluncurkan chip AI Jalapeño, prosesor inferensi kustom untuk LLM
  • Chip ini dirancang khusus (purpose-built ASIC), bukan akselerator training yang dialihfungsikan
  • Menggunakan compute chiplet besar dengan enam modul HBM untuk throughput tinggi dan latensi rendah
  • Ukuran die diperkirakan 840 mm², mendekati batas reticle sistem EUV
  • Diklaim memiliki performa per watt lebih tinggi dari hardware state-of-the-art saat ini
  • Sampel rekayasa sudah beroperasi di lab menjalankan GPT-5.3-Codex-Spark
  • Dirancang hanya dalam 9 bulan, tape-out sangat cepat untuk standar ASIC
  • Dijadwalkan deploy mulai akhir 2026 di pusat data berskala gigawatt
  • Mendukung tidak hanya beban kerja OpenAI tetapi juga LLM industri lainnya
  • Akan bersaing dengan AMD Instinct MI400-series dan Nvidia Rubin di masa depan

Telset.id – OpenAI dan Broadcom resmi memperkenalkan Jalapeño, prosesor inferensi kustom yang dirancang khusus untuk large language model (LLM) modern dan beban kerja agen AI di masa depan. Chip ini diklaim menawarkan performa per watt yang lebih tinggi dibandingkan perangkat keras terdepan saat ini.

Jalapeño merupakan proyek hardware strategis bagi OpenAI dan dianggap sebagai generasi pertama dari lini prosesor inferensi mereka. Yang membedakan chip ini dari produk lain di pasaran adalah pendekatan desainnya yang benar-benar baru, bukan sekadar akselerator training yang diubah fungsinya.

Bukan Sekadar AI Accelerator Biasa

OpenAI menegaskan bahwa Jalapeño adalah ASIC inferensi yang dibuat khusus (purpose-built), bukan prosesor AI serbaguna atau akselerator training yang dialihfungsikan. Arsitektur chip ini didasarkan pada pemahaman mendalam OpenAI tentang perilaku LLM dan dirancang untuk mengatasi hambatan praktis dalam inferensi skala besar.

Beberapa masalah utama yang menjadi fokus desain Jalapeño meliputi pergerakan data yang mahal (costly data movement), keseimbangan antara sumber daya komputasi dan memori, efisiensi jaringan, serta perilaku keseluruhan sistem. Untuk mencapai tujuan tersebut, OpenAI menggunakan compute chiplet berukuran besar dan memori HBM, bukan tipe DRAM yang lebih murah seperti yang digunakan banyak akselerator inferensi lainnya.

Pendekatan ini memungkinkan Jalapeño menggabungkan throughput tinggi dengan latensi rendah, yang akan sangat berguna untuk beban kerja reasoning dan agen AI. OpenAI dan Broadcom mengklaim prosesor ini mampu memberikan utilisasi efektif yang lebih tinggi dibandingkan akselerator AI konvensional dan mendekati performa teoretis maksimal.

Meski demikian, kedua perusahaan tidak mengungkapkan target performa spesifik untuk ASIC Jalapeño. Klaim-klaim tersebut perlu diterima dengan hati-hati mengingat belum ada angka pasti yang dirilis ke publik.

Menariknya, sampel rekayasa (engineering samples) Jalapeño sudah beroperasi di laboratorium pada kecepatan clock dan daya yang ditargetkan. OpenAI menyebutkan bahwa chip tersebut sudah menjalankan beban kerja machine learning seperti GPT-5.3-Codex-Spark. Pengujian internal awal juga menunjukkan bahwa efisiensi performa per watt Jalapeño secara substansial lebih baik dibandingkan hardware state-of-the-art saat ini.

Namun, perlu dicatat bahwa belum ada angka keras, benchmark, konfigurasi memori, atau detail lain yang diungkapkan. Selain itu, meskipun Jalapeño diklaim mampu mengalahkan akselerator AMD Instinct MI350-series dan Nvidia berbasis Blackwell, masih harus dilihat bagaimana daya saingnya melawan AMD Instinct MI400-series dan Nvidia berbasis Rubin di masa depan.

Richard Ho, yang memimpin program hardware OpenAI, menyatakan bahwa Jalapeño dirancang dari awal untuk inferensi LLM menggunakan wawasan detail dari kolaborasi erat dengan para peneliti OpenAI. “Kami mengoptimalkan arsitektur di sekitar kernel, pergerakan memori, jaringan, dan pola serving yang paling penting untuk model AI frontier. Berdasarkan pengujian awal, Jalapeño akan mengeksekusi beban kerja terpenting kami mendekati batas teoretis hardware,” ujarnya.

Chip Raksasa dengan Enam Modul HBM

Meskipun Broadcom dan OpenAI tidak mengungkapkan spesifikasi detail Jalapeño, mereka menampilkan wafer dan kemasannya yang memungkinkan analisis singkat. Paket chip tersebut tampaknya berisi satu compute chiplet besar yang dikelilingi oleh enam modul HBM dan chiplet lain yang kemungkinan berisi antarmuka input/output.

Dari gambar wafer, terlihat floorplan kolumnar yang sangat teratur dan berulang, konsisten dengan akselerator bergaya Broadcom dengan susunan systolic array. Namun, perlu diingat bahwa ini masih spekulasi dan gambar tidak cukup jelas untuk memastikan apakah Jalapeño menggunakan array systolic 2D murni, mesin matriks 1D/2D, kumpulan tile vektor atau tensor, atau jalur data inferensi lainnya.

Yang dapat dipastikan dari gambar adalah perkiraan ukuran die compute chiplet Jalapeño. Berdasarkan ukuran paket HBM3/4 (10,975 mm × 10,975 mm) di sekitarnya, chiplet tersebut diperkirakan berukuran 25,46 mm (lebar) × 33 mm (tinggi), dengan luas die sekitar 840 mm². Angka ini sangat dekat dengan ukuran reticle sistem litografi EUV (858 mm²).

Ukuran die yang besar ini mengindikasikan bahwa Jalapeño memiliki kekuatan komputasi yang signifikan, meskipun belum bisa dibuat perkiraan performa berdasarkan metrik ini. Yang jelas, compute die Jalapeño jauh lebih besar dibandingkan die akselerator inferensi lain di pasaran dan lebih mirip dengan prosesor untuk training AI.

Pilihan OpenAI dan Broadcom untuk menggunakan compute chiplet besar kemungkinan bertujuan mengurangi latensi sebanyak mungkin, berbeda dengan tren multi-chiplet yang semakin populer untuk beban kerja training AI seperti yang dilakukan AMD dan Nvidia.

Dirancang dalam Sembilan Bulan

Salah satu pencapaian paling mengesankan dari proyek Jalapeño adalah kecepatan pengembangannya. Kedua perusahaan menyatakan bahwa chip tersebut mencapai tape-out hanya dalam waktu sembilan bulan dan dijadwalkan untuk diterapkan mulai akhir 2026. Ini merupakan waktu yang sangat cepat dalam dunia desain ASIC, yang biasanya memakan waktu 1,5 hingga 2 tahun untuk merancang dari awal.

Tidak jelas apakah Broadcom dan OpenAI secara ekstensif menggunakan kecerdasan buatan untuk mendefinisikan dan mengembangkan Jalapeño, meskipun kedua perusahaan mengakui bahwa mereka menggunakan model OpenAI untuk mempercepat bagian dari pekerjaan desain dan optimasi chip. Faktor lain yang mempercepat siklus pengembangan adalah penggunaan ulang logika Broadcom secara ekstensif di berbagai desain kustom.

Menariknya, Jalapeño dirancang tidak hanya untuk mendukung beban kerja OpenAI sendiri, tetapi juga LLM saat ini dan masa depan di seluruh industri. Hal ini berpotensi memungkinkan OpenAI menjual hardware-nya ke pihak ketiga, asalkan pasokan dari Broadcom dan TSMC mencukupi.

Hock Tan, Presiden dan CEO Broadcom, mengindikasikan bahwa Jalapeño akan diterapkan di pusat data berskala gigawatt dengan Microsoft dan mitra lainnya mulai tahun ini. Namun, belum jelas apakah prosesor tersebut akan digunakan secara eksklusif untuk beban kerja OpenAI atau tersedia untuk penyewa lain juga.

“Kolaborasi kami dengan OpenAI merupakan komitmen fundamental untuk menskalakan infrastruktur fisik yang diperlukan untuk dekade AI berikutnya,” kata Hock Tan. “Ini baru awal dari peta jalan multi-generasi. Dengan mengembangkan silikon industri terdepan secara langsung bersama OpenAI, kami memungkinkan penerapan pusat data berskala gigawatt dengan Microsoft dan mitra lainnya mulai tahun 2026.”

Dengan peluncuran Jalapeño, persaingan di pasar chip AI semakin memanas. OpenAI dan Broadcom jelas ingin menjadi pemain utama, tidak hanya dalam pengembangan model AI tetapi juga dalam infrastruktur hardware yang mendukungnya. Ke depannya, akan menarik untuk melihat bagaimana chip ini bersaing dengan produk dari AMD, Nvidia, dan pemain lain di industri.

Bagi pengamat industri dan pengguna teknologi, kehadiran Jalapeño menandai babak baru dalam upaya menciptakan hardware yang benar-benar dioptimalkan untuk beban kerja AI generatif. Jika klaim performa terbukti akurat, chip ini berpotensi mengubah lanskap komputasi AI dalam beberapa tahun ke depan.

Ikuti Telset.id di Google NewsFollow

Komentar

Belum ada komentar.