Telset.id – Intel merilis hasil benchmark MLPerf v6.0 yang menunjukkan kartu grafis profesional terbarunya, Arc Pro B70, mengalami peningkatan kinerja inferensi AI hingga 80% dibandingkan generasi sebelumnya, Arc Pro B60. Data ini dilaporkan oleh media teknologi Wccftech berdasarkan publikasi resmi Intel.
Pengujian inti dilakukan dengan konfigurasi empat kartu Arc Pro B70 yang dipasangkan dengan prosesor Xeon 6 terbaru. Konfigurasi quad-GPU ini, dengan total memori video 128GB, diklaim mampu menangani model bahasa besar (Large Language Model/LLM) dengan parameter hingga 120 miliar. Dalam pengujian yang sama, konfigurasi empat Arc Pro B70 juga disebut memberikan kapasitas cache KV hingga 1,6 kali lipat lebih besar dibanding solusi pesaing saat beroperasi dalam mode multi-GPU, yang secara signifikan meningkatkan kemampuan pemrosesan teks panjang.
Berikut adalah tabel ringkasan hasil benchmark MLPerf v6.0 untuk inferensi model GPT-OSS-120B yang dirilis Intel:
- 4 x Arc Pro B70 (128 GB): Offline: 1536.90 Tokens/s | Server: 951.67 Tokens/s
- 4 x Arc Pro B60 Dual (192 GB): Offline: 1601.91 Tokens/s | Server: 884.24 Tokens/s
- 4 x Arc Pro B60 (96 GB): Offline: 841.04 Tokens/s | Server: 452.19 Tokens/s
Untuk model Llama2-70B, kinerjanya adalah:
- 4 x Arc Pro B70 (128 GB): Offline: 2459.18 Tokens/s | Server: 1698.57 Tokens/s
- 4 x Arc Pro B60 Dual (192 GB): Offline: 3270.66 Tokens/s | Server: 2199.50 Tokens/s
- 4 x Arc Pro B60 (96 GB): Offline: 1697.66 Tokens/s | Server: 1106.26 Tokens/s
Sementara pada model yang lebih kecil, Llama3.1 8B, hasilnya menunjukkan:
- 4 x Arc Pro B60 Dual (192 GB): Offline: 52.83 Tokens/s | Server: 49.17 Tokens/s
- 4 x Arc Pro B70 (128 GB): Offline: 36.07 Tokens/s | Server: 32.58 Tokens/s
- 4 x Arc Pro B60 (96 GB): Offline: 26.15 Tokens/s | Server: 24.57 Tokens/s
Baca Juga:
Laporan Wccftech menekankan bahwa peningkatan efisiensi inferensi AI tidak hanya bergantung pada kartu grafis, tetapi juga prosesor sebagai pusat komputasi. Prosesor Xeon 6 disebut memiliki mesin percepatan AMX dan AVX-512 bawaan yang mampu memberikan lompatan kinerja antargenerasi hingga 90%.
Selain peningkatan perangkat keras, Intel juga terus mengoptimalkan perangkat lunak AI-nya. Data pengujian menunjukkan bahwa pengguna kartu Arc Pro B60 yang ada saat ini dapat memperoleh peningkatan kinerja hingga 18% hanya melalui pembaruan perangkat lunak, tanpa perlu mengganti perangkat keras. Optimasi software semacam ini menjadi kunci dalam ekosistem komputasi modern.
Rilis kartu grafis profesional ini merupakan bagian dari persaingan ketat di pasar komputasi AI dan data center. Sebelumnya, NVIDIA juga meluncurkan platform komputasi intensifnya. Kemajuan di sektor ini turut mempengaruhi dinamika pasar global, termasuk isu regulasi seperti yang sempat disoroti NVIDIA terkait kebijakan ekspor.
Kehadiran Arc Pro B70 memberikan opsi tambahan bagi pengembang dan perusahaan yang membutuhkan solusi inferensi AI yang powerful. Kemampuannya menangani model besar dengan parameter 120 miliar membuka peluang untuk aplikasi AI yang lebih kompleks. Perkembangan teknologi pendukung seperti perangkat audio cerdas dan perangkat mobile berkinerja tinggi, seperti yang terlihat pada harga flagship Samsung, menunjukkan konvergensi kebutuhan komputasi di berbagai segmen.
Dengan klaim peningkatan 80% pada inferensi AI dan kemampuan menangani LLM skala besar, Intel Arc Pro B70 memposisikan diri sebagai pemain serius di arena komputasi profesional yang didorong AI. Optimalisasi perangkat lunak yang berkelanjutan juga menjadi nilai tambah bagi pengguna yang ingin memperpanjang siklus hidup investasi perangkat keras mereka.




