logo
Rumah Berita

berita perusahaan tentang Big Blue's Redbook pada Manajemen Cache Skala Storage KV

Sertifikasi
Cina Beijing Qianxing Jietong Technology Co., Ltd. Sertifikasi
Cina Beijing Qianxing Jietong Technology Co., Ltd. Sertifikasi
Ulasan pelanggan
Staf penjualan Beijing Qianxing Jietong Technology Co, Ltd sangat profesional dan sabar. Mereka dapat memberikan kutipan dengan cepat. Kualitas dan kemasan produk juga sangat baik. Kerjasama kami sangat lancar.

—— Festfing DV》LLC

Ketika saya sangat mencari CPU intel dan SSD Toshiba, Sandy dari Beijing Qianxing Jietong Technology Co., Ltd memberi saya banyak bantuan dan mendapatkan produk yang saya butuhkan dengan cepat. Saya sangat menghargai dia.

—— Kitty Yen

Sandy dari Beijing Qianxing Jietong Technology Co, Ltd adalah penjual yang sangat berhati-hati, yang dapat mengingatkan saya tentang kesalahan konfigurasi saat saya membeli server. Para insinyur juga sangat profesional dan dapat dengan cepat menyelesaikan proses pengujian.

—— Strelkin Mikhail Vladimirovich

Kami sangat senang dengan pengalaman kami bekerja dengan Beijing Qianxing Jietong. Kualitas produk sangat baik, dan pengiriman selalu tepat waktu. Tim penjualan mereka profesional, sabar, dan sangat membantu dengan semua pertanyaan kami. Kami sangat menghargai dukungan mereka dan berharap dapat menjalin kemitraan jangka panjang. Sangat direkomendasikan!

—— Ahmad Navid

Kualitas: Pengalaman yang baik dengan pemasok saya. MikroTik RB3011 sudah digunakan, tetapi dalam kondisi yang sangat baik dan semuanya bekerja dengan sempurna. Komunikasi cepat dan lancar,dan semua kekhawatiran saya segera ditangani. Penyedia yang sangat dapat diandalkan sangat direkomendasikan.

—— Geran Colesio

I 'm Online Chat Now
perusahaan Berita
Big Blue's Redbook pada Manajemen Cache Skala Storage KV

Sistem file paralel IBM Storage Scale mendukung manajemen cache KV terdistribusi yang dipasangkan dengan NVIDIA Dynamo, melayani skenario inferensi AI skala besar dengan beban kerja konteks besar.

berita perusahaan terbaru tentang Big Blue's Redbook pada Manajemen Cache Skala Storage KV  0

IBM telah merilis Redbook resmi berjudulKonteks Tanpa Batas: Platform Cache KV Berkinerja Tinggi untuk Inferensi AI Berskala BesarStack terintegrasi menggabungkan Supermicro Petascale Storage Server, jaringan Ethernet NVIDIA Spectrum-X,dan IBM Storage Scale Erasure Coding Edition (ECE) untuk membangun tingkat penyimpanan bersama berkinerja tinggi untuk inferensi AISebagai dokumen teknis resmi yang diterbitkan oleh IBM ITSO (International Technical Support Organization), IBM Redbooks menawarkan hands-on,panduan penyebaran mendalam untuk produk infrastruktur IBM tingkat perusahaan.

Ditulis bersama oleh tim insinyur dari IBM, Supermicro dan NVIDIA, Redbook membahas titik nyeri inti dari beban kerja AI konteks panjang.Aplikasi pengambilan RAG dan pipa agen otonom menghasilkan data cache KV besar di dalam GPU HBMSetelah data cache diusir dari sumber daya HBM terbatas, perhitungan ulang berulang akan memicu peningkatan latensi yang parah, membuat penyimpanan cache KV permintaan silang yang persisten sangat diperlukan.

Solusi ini mengadopsi arsitektur cache KV hierarkis lima tingkat yang mencakup permintaan latensi dan kapasitas yang berbeda:
  • Lapisan G1: GPU node lokal HBM
  • Lapisan G2: Sistem node CPU DRAM
  • Lapisan G3: SSD lokal yang terhubung langsung
  • G3.5 Lapisan: Storage flash bersama tingkat pod, di depan oleh NVIDIA BlueField DPU dengan interkoneksi langsung ke DPU server GPU
  • Lapisan G4: External cross-Ethernet shared storage pool yang terhubung ke semua GPU compute server
Mencakup memori ujung-ke-ujung dan hierarki penyimpanan, pengaturan multi-tier ini memberikan latensi terus menerus dan gradien kapasitas.Pengusiran otomatis dan pengisian ulang data dinamis di seluruh tumpukan penyimpanan, beradaptasi secara fleksibel dengan pola akses beban kerja yang bervariasi dan anggaran biaya total infrastruktur.

Digunakan pada Supermicro Petascale Storage Server, Storage Scale ECE berfungsi sebagai lapisan G4 cold cache.termasuk keadaan percakapan multi-turn yang tidak aktif, data konteks agen bersama dan catatan kueri historis yang tidak memerlukan respon instan.

Menurut hasil tes yang tercatat di Redbook, arsitektur referensi siap produksi ini secara efektif mempercepat layanan inferensi AI generatif dan agentik.Dalam tes TTFT (Time To First Token) permintaan tunggal dibandingkan dengan server GPU mandiri tanpa cache KV Storage Scale eksternal, sistem terintegrasi mempertahankan TTFT stabil terlepas dari perubahan panjang yang cepat.56x mempercepatdi bawah 130k-token urutan input dan benar-benar menghilangkan inference latency fluktuasi yang disebabkan oleh panjang prompt diperpanjang.

Di bawah tekanan inferensi serentak multi-pengguna solusi mencapai peningkatan kinerja dramatis: permintaan throughput lonjakan dari 0,19 RPS untuk 4,26 RPS, menandai22x peningkatan throughputSementara itu, total waktu pemrosesan untuk 200 permintaan inferensi turun sebesar 95%, sangat meningkatkan efisiensi pemanfaatan GPU dan skalabilitas cluster inferensi secara keseluruhan.

Stack ini juga mempertahankan kinerja yang kuat di bawah tes stres tetangga berisik yang keras.Sistem terintegrasi masih berjalan stabil pada 3.6 RPS, menyelesaikan semua 200 permintaan kesimpulan dalam 55,56 detik.18x lebih tinggidibandingkan dengan arsitektur perhitungan ulang GPU-only.

Tim peneliti menyimpulkan dalam Redbook: Untuk perusahaan yang bertujuan memaksimalkan ROI pada investasi perangkat keras GPU yang mahal, arsitektur terintegrasi yang diverifikasi ini memberikan solusi yang mudah,pendekatan siap produksi untuk meningkatkan throughput kesimpulan, mengurangi latensi end-to-end, mendukung serangkaian layanan yang lebih tinggi, dan membangun infrastruktur inferensi AI skala besar yang lebih hemat biaya.

Kata kunci: SUPERMICRO, IBM Storage Scale, NVIDIA Dynamo

Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Direktur Strategi Global
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Situs web: www.qianxingdata.com/www.storagesserver.com
Fokus Bisnis:
Distribusi Produk ICT/Integrasi Sistem & Layanan/Solusi Infrastruktur
Dengan 20+ tahun pengalaman distribusi TI, kami bermitra dengan merek global terkemuka untuk memberikan produk yang dapat diandalkan dan layanan profesional.
¢Menggunakan Teknologi untuk Membangun Dunia yang Cerdas ¢Penyedia Layanan Produk ICT yang Anda Percayai!
Pub waktu : 2026-06-12 11:09:46 >> daftar berita
Rincian kontak
Beijing Qianxing Jietong Technology Co., Ltd.

Kontak Person: Ms. Sandy Yang

Tel: 13426366826

Mengirimkan permintaan Anda secara langsung kepada kami (0 / 3000)