Hal-Hal Utama
- Flash pertama NVMe RAID:PERC13 H975i bergerak dari SAS/SATA sepenuhnya, dibangun di Broadcom SAS51xx untuk NVMe-native, AI-siap arsitektur.
- Salto generasi besar:PCIe Gen5 x16 dengan hingga 16 drive NVMe per controller (32 dengan dua) memberikan 52,5 GB / s dan 12,5M IOPS per controller dalam pengujian, dengan keuntungan vs PERC12 termasuk + 88% lebar band baca,+318% bandwidth menulis, +31% 4K membaca IOPS, dan +466% 4K menulis IOPS.
- Server AI yang cocok:Desain terintegrasi depan membebaskan slot PCIe belakang untuk GPU, memperpendek jalan MCIO, dan memungkinkan pipa penyimpanan khusus per akselerator untuk throughput yang lebih stabil dan lebih deterministik tanpa overhead CPU.
- Ketahanan di bawah tekanan:Cache yang dilindungi supercapacitor dan rebuild yang lebih cepat mengurangi waktu hingga 10 min/TiB sambil mempertahankan kinerja tinggi selama rebuild (hingga 53,7 GB/s dibaca, 68 GB/s ditulis, 17,3M/5,33M 4K IOPS).
- Keamanan dari ujung ke ujung:Hardware Root of Trust, identitas perangkat SPDM, dan enkripsi spektrum penuh yang mencakup drive, data dalam penerbangan, dan cache pengontrol.
Dell PERC12 H965i dan PERC13 H975i Spesifikasi
| Fitur | PERC12 H965i Bagian depan | PERC13 H975i Bagian depan |
|---|---|---|
| Tingkat RAID | 0, 1, 5, 6, 10, 50, 60 | 0, 1, 5, 6, 10, 50, 60 |
| Non-RAID (JBOD) | Ya, aku tahu. | Ya, aku tahu. |
| Jenis Bus Host | PCIe Gen4 x16 | PCIe Gen5 x16 |
| Manajemen pita sisi | I2C, PCIe VDM | I2C, PCIe VDM |
| Pengangkutan per Pelabuhan | Tidak berlaku | Tidak berlaku |
| Prosesor / Chipset | Broadcom RAID-on-Chip, SAS4116W | Broadcom RAID-on-Chip, SAS5132W |
| Energy Pack / Power-backup | Baterai | Superkondensator |
| Keamanan Manajemen Kunci Lokal | Ya, aku tahu. | Ya, aku tahu. |
| Manajer Kunci Perusahaan Aman | Ya, aku tahu. | Ya, aku tahu. |
| kedalaman antrian pengontrol | 8,192 | 8,192 |
| Cache non-volatile | Ya, aku tahu. | Ya, aku tahu. |
| Memori Cache | 8 GB DDR4 3200 MT/s | Cache RAID terintegrasi |
| Fungsi Cache | Menulis kembali, membaca ke depan, menulis melalui, selalu menulis kembali, tidak membaca ke depan | Menulis kembali, menulis melalui, selalu menulis kembali, tidak membaca ke depan |
| Max Komplek Virtual Disk | 64 | 16 |
| Disk Virtual Sederhana Max | 240 | 64 |
| Kelompok Disk Maksimal | 64 | 32 |
| VD maksimal per kelompok disk | 16 | 8 |
| Perangkat suku cadang panas maksimum | 64 | 8 |
| Perangkat hot-swap didukung | Ya, aku tahu. | Ya, aku tahu. |
| Auto-configure (Primary & Execute once) | Ya, aku tahu. | Ya, aku tahu. |
| Mesin XOR Hardware | Ya, aku tahu. | Ya, aku tahu. |
| Peningkatan Kapasitas Online | Ya, aku tahu. | Ya, aku tahu. |
| Dedicated & Global Hot Spare | Ya, aku tahu. | Ya, aku tahu. |
| Tipe drive yang didukung | NVMe Gen3 dan Gen4 | NVMe Gen3, Gen4 dan Gen5 |
| Ukuran elemen strip VD | 64KB | 64KB |
| Dukungan NVMe PCIe | Gen4 | Gen5 |
| Konfigurasi Max NVMe Drives | 8 drive per pengontrol | 16 drive per pengontrol |
| Ukuran Sektor yang Didukung | 512B, 512e, 4Kn | 512B, 512e, 4Kn |
| Dukungan Boot Storage | Hanya UEFI | Hanya UEFI |
PERC13 H975i Front controller di server Dell PowerEdge dirancang untuk integrasi yang mulus ke dalam arsitektur sistem.H975i terhubung langsung ke backplane drive depan dan antarmuka dengan konektor MCIO depan pada motherboard melalui PCIe 5 khususDesain terintegrasi ini mempertahankan slot PCIe belakang untuk GPU berkinerja tinggi dan perluasan PCIe tambahan, sementara secara signifikan mengurangi panjang kabel.Hal ini membantu dalam menjaga integritas sinyalHasilnya adalah tata letak internal yang lebih bersih dan aliran udara yang lebih baik untuk penyebaran yang padat dan komputasi intensif.
H975i mengimplementasikan arsitektur keamanan yang komprehensif yang mencakup dari sertifikasi perangkat keras tingkat silikon melalui enkripsi data spektrum penuh data di tempat dengan drive SED.,Hardware Root of Trust menetapkan rantai verifikasi kriptografi yang tidak dapat diubah dari ROM Boot Internal melalui setiap komponen firmware,memastikan bahwa hanya firmware yang disertifikasi Dell yang dapat dijalankan pada pengontrolKeamanan berbasis perangkat keras ini diperluas melalui implementasi Protokol Keamanan dan Model Data (SPDM),dimana setiap pengontrol berisi sertifikat Identitas Perangkat unik yang memungkinkan iDRAC untuk melakukan verifikasi otentikasi real-time. Kontroler memperluas perlindungan kriptografi melampaui skenario data tradisional pada istirahat untuk mencakup memori cache.Ini mempertahankan kunci enkripsi di daerah memori aman yang tidak dapat diakses oleh firmware yang tidak sahAkibatnya, data sensitif tetap terlindungi apakah berada di drive atau secara aktif diproses di cache.
Perlindungan daya di H975i adalah evolusi signifikan lainnya dari sistem berbasis baterai tradisional melalui integrasi superkondensator.Supercapacitor menyediakan pengiriman daya instan selama kejadian kehilangan daya yang tidak terdugaSelain itu, tidak seperti sistem berbasis baterai yang membutuhkan 4-8 jam untuk siklus belajar,superkondensator H975i ̇s menyelesaikan Siklus Belajar Transparan dalam waktu 5-10 menit tanpa degradasi kinerja selama kalibrasiDesain ini menghilangkan biaya pemeliharaan dan masalah degradasi yang melekat pada solusi baterai, sambil memberikan keandalan yang unggul untuk perlindungan data misi kritis.
Pemantauan dan Manajemen Terintegrasi
Pengendali RAID PERC13 Dell, seperti banyak solusi RAID Dell, dapat dikelola dan dipantau dengan berbagai cara, termasuk selama boot platform melalui Sistem Setup di BIOS, melalui iDRAC web GUI,utilitas PERC12, dan bahkan Dell OpenManage UI dan CLI.
Manajemen pengontrol iDRAC
Saat melihat antarmuka manajemen iDRAC, tab pengontrol menawarkan gambaran keseluruhan perangkat keras penyimpanan server.lengkap dengan informasi tentang versi firmware, memori cache, dan kesehatan baterai. Ringkasan ini memungkinkan Anda untuk dengan cepat memverifikasi kesiapan dan konfigurasi pengontrol tanpa perlu mengakses BIOS atau menggunakan alat CLI.
Tab Virtual Disks di iDRAC menunjukkan array penyimpanan yang telah dibuat, termasuk tingkat RAID, ukuran, dan kebijakan caching.Dari sudut pandang ini, administrator dapat mengkonfirmasi volume online, membuat disk virtual baru, atau menggunakan menu Tindakan untuk menyesuaikan atau menghapus konfigurasi yang ada.
Utilitas Konfigurasi Kontroler RAID
Gambar di atas menunjukkan contoh memasukkan PERC H975i Front Configuration Utility System Setup pada platform PowerEdge R7715. Dari antarmuka ini,Anda dapat mengelola semua pengaturan kontroler RAID kunci, termasuk Manajemen Konfigurasi, Manajemen Controller, Manajemen Perangkat, dan banyak lagi.Utilitas ini menyediakan cara yang efisien untuk mengatur disk virtual dan memantau komponen perangkat keras langsung selama proses boot platform.
Setelah memilih tingkat RAID, kita beralih ke memilih disk fisik untuk array. Dalam contoh ini semua NVMe SSD yang tersedia terdaftar dan ditandai sebagai RAID-capable.2 TiB Dell DC NVMe drive dari kolam kapasitas yang tidak dikonfigurasi. Filter seperti jenis media, antarmuka, dan ukuran sektor logis membantu mempersempit pilihan.kita dapat melanjutkan dengan mengklik OK untuk menyelesaikan pemilihan disk dan terus membuat Virtual Disk.
Sebelum menyelesaikan pembuatan virtual disk, sistem menampilkan peringatan yang mengkonfirmasi semua data pada disk fisik yang dipilih akan dihapus secara permanen.kita centang kotak "Konfirmasi" dan pilih "Ya" untuk mengizinkan operasiPerlindungan ini membantu mencegah kehilangan data yang tidak disengaja selama proses penciptaan RAID.
Setelah disk virtual dibuat, ia akan muncul di bawah menu "Virtual Disk Management". Dalam contoh ini, disk virtual RAID 5 baru kami terdaftar dengan kapasitas 43.656 TiB dan status "Ready".Dengan beberapa langkah sederhana, penyimpanan dikonfigurasi dan siap digunakan.
Sementara PERC BIOS Configuration Utility dan antarmuka iDRAC menawarkan opsi intuitif untuk manajemen lokal dan jarak jauh, Dell juga menyediakan alat baris perintah yang kuat yang disebut PERC CLI (perccli2).Utilitas ini mendukung Windows, Linux, dan VMware, menjadikannya ideal untuk skrip, otomatisasi, atau mengelola pengontrol PERC di lingkungan tanpa kepala.Dell juga menyediakan dokumentasi rinci tentang pemasangan dan penggunaan perintah untuk PERC CLI di situs dukungan mereka.
Dell PERC13 Performance Testing
Sebelum menyelam ke dalam pengujian kinerja, kami mempersiapkan lingkungan kami menggunakan Dell PowerEdge R7715 platform dikonfigurasi dengan dual PERC H975i front controller.2TB Dell NVMe drive, masing-masing dinilai hingga 12.000 MB/s membaca berurutan dan 5.500 MB/s menulis berurutan menggunakan ukuran blok 128 KiB.Yayasan kinerja tinggi ini memungkinkan kita untuk mendorong batas-batas dari PERC13 controller's throughput dan mengevaluasi perilaku RAID pada skala.
- Platform:Dell PowerEdge R7715
- CPU:Prosesor AMD EPYC 9655P 96-Core
- Ram:768GB (12 x 64GB) DDR5-5200 ECC
- Pengontrol Raid:2 x PERC13 H975i
- Penyimpanan:32 x 3.2TB Dell CD8P NVMe Drive
- Akselerator PCIe:2 x GPU NVIDIA H100
NVIDIA Magnum IO GPU Direct Storage: AI Meets Storage
Pipeline AI modern seringkali I/O-bound, bukan compute-bound. Batch data, embedding, dan checkpoint harus ditransfer dari penyimpanan ke memori GPU dengan cukup cepat untuk membuat akselerator sibuk.NVIDIA Magnum IO GDS (melalui cuFile) memotong jalur tradisional SSD → CPU DRAM → GPU dan memungkinkan data DMA langsung dari NVMe ke memori GPUYang menghilangkan overhead CPU bounce-buffer, menurunkan latensi, dan membuat throughput lebih dapat diprediksi di bawah beban, semua yang diterjemahkan ke penggunaan GPU yang lebih tinggi, waktu epoch lebih pendek,dan siklus penyelamatan/pemuatan titik pemeriksaan yang lebih cepat.
Tes GDSIO kami diarahkan untuk mengukur jalur data penyimpanan ke GPU itu sendiri, menyapu ukuran blok dan jumlah thread untuk menunjukkan seberapa cepat set NVMe yang didukung PERC13 dapat mengalir ke memori H100.Dengan setiap H975i pada PCIe 5.0 x16 link (teoritis ~ 64 GB / s per pengontrol, unidirectional), dua pengontrol menetapkan langit-langit agregat dekat ~ 112 GB / s; di mana dataran tinggi kurva kami memberitahu Anda apakah Anda link atau media terbatas.Untuk praktisi, membaca grafik sebagai proxy untuk beban kerja nyata: besar sekuensial membaca peta ke dataset streaming dan titik pemeriksaan mengembalikan; besar sekuensial menulis peta ke titik pemeriksaan menyimpan;transfer yang lebih kecil dengan paralel mencerminkan data loader shuffles dan prefetchSingkatnya, skala GDSIO yang kuat berarti lebih sedikit stand GPU dan kinerja yang lebih konsisten selama pelatihan dan kesimpulan throughput tinggi.
GDSIO Read Sequential Throughput
Dimulai dengan pembacaan berurutan, throughput mulai sederhana pada ukuran blok yang lebih rendah dan jumlah thread, mulai sekitar 0,3 GiB / s pada blok 8K dengan satu thread.Kinerja meningkat tajam antara 16K dan 512K blok, terutama ketika meningkatkan jumlah benang dari 4 menjadi 16. keuntungan yang paling substansial terjadi pada ukuran blok 1M, 5M, dan 10M, di mana throughput melonjak secara dramatis,mencapai puncak pada 103 GiB/s pada ukuran blok 10M dengan 256 threadProgressi ini menunjukkan bahwa array PERC13 mendapat manfaat dari ukuran blok yang lebih besar dan paralelisme multithreaded, dengan saturasi optimal sekitar 64-128 thread, di luar yang mendapatkan dataran tinggi.
GDSIO Baca Sequential Throughput Differential
Dalam pengujian pembacaan berurutan di seluruh ukuran blok dari 8K hingga 10M, PERC13 (H975i) secara konsisten melampaui PERC12 (H965i),dengan persentase keuntungan berskala dramatis pada ukuran blok yang lebih besar dan jumlah benang yang lebih tinggi.
Pada ukuran blok yang lebih kecil (8K-16K), perbaikan sederhana (biasanya berkisar dari 0-20%), dan dalam beberapa kasus terisolasi, H975i sedikit tertinggal karena variabilitas tes pada kedalaman antrian rendah.Dengan ukuran blok 32K-64K, keuntungan menjadi lebih konsisten, dengan H975i memberikan 30-50% throughput yang lebih tinggi di sebagian besar jumlah benang.
Perbedaan yang paling signifikan diamati pada ukuran blok yang lebih besar (128K hingga 10M), di mana pengontrol PERC13 membuka potensi membaca berurutan penuh dari sistem.H975i menunjukkan peningkatan 50-120% dibandingkan dengan H965iMisalnya pada ukuran blok 1M dengan 8-16 thread, throughput lebih dari 55 GiB/s lebih tinggi, setara dengan sekitar 90% uplift. pada ukuran blok 5M dan 10M, perbaikan secara teratur melebihi 100%,dengan beberapa konfigurasi menunjukkan hampir dua kali kinerja dibandingkan dengan generasi sebelumnya.
Secara keseluruhan, PERC13 (H975i) membangun memimpin dalam beban kerja membaca berurutan, terutama sebagai ukuran blok dan jumlah thread skala.pada 256K dan di atas, pengendali yang lebih baru secara konsisten memberikan kinerja 50-100% + lebih tinggi, dengan jelas menyoroti kemajuan arsitektur di platform RAID terbaru Dell.
GDSIO Baca Latensi Berurutan
Karena throughput membaca berurutan meningkat, latensi tetap dapat dikelola pada ukuran blok yang lebih kecil dan jumlah thread yang lebih rendah.menunjukkan penanganan yang efisien dari pembacaan dalam kisaran ituSetelah ukuran blok dan jumlah thread meningkat, terutama pada 5M dan 10M dengan 64 thread atau lebih, latensi naik dengan cepat, mencapai puncak pada 211,8 ms pada ukuran blok 10M dengan 256 thread.Ini menyoroti bagaimana kendali atau antrian kemacetan muncul di bawah beban kerja yang ekstrim, meskipun throughput tetap tinggi.
Keseimbangan kinerja dan efisiensi terbaik diamati pada ukuran blok 1M dengan 8-16 thread, di mana array mempertahankan throughput 87,5-93,7 GiB/s sambil menjaga latensi antara 179-334 μs.Zona ini mewakili titik manis untuk memaksimalkan bandwidth sambil menjaga keterlambatan jauh di bawah milidetik.
GDSIO Write Sequential Throughput
Kinerja menulis menunjukkan skala awal yang kuat karena ukuran blok meningkat, dengan throughput naik dari 1,2 GiB / s pada 8K dan 1 thread menjadi 13,9 GiB / s dengan 256K.Pertumbuhan yang paling substansial muncul antara ukuran blok 128K dan 1M, di mana throughput mencapai lebih dari 80 GiB/s pada 8 hingga 16 thread. Kinerja puncak datang pada ukuran blok 5M dan 10M, mempertahankan 100 hingga 101 GiB/s dari 8 thread dan seterusnya.
Kinerja rata di 8 sampai 64 thread untuk blok yang lebih besar ini, menunjukkan pengontrol mencapai jenuh awal dalam kurva skala.,Stabilitas throughput bervariasi, tetap stabil pada blok besar 5M dan 10M pada 101 GiB/s tetapi menurun untuk ukuran blok rentang menengah, seperti 256K, turun dari 61.2 GiB/s pada 32 thread menjadi 45.3 GiB/s pada 256 benang.
GDSIO Write Sequential Throughput Differential
Dalam pengujian penulisan berurutan, PERC13 (H975i) memberikan keuntungan yang substansial dibandingkan dengan PERC12 (H965i), terutama sebagai ukuran blok dan jumlah thread yang diskalakan.Perbaikan sederhana, umumnya dalam kisaran 0-10%, dengan kebisingan tes sesekali menunjukkan perbedaan yang tidak signifikan.
Dari 64K ke depan, keuntungan H975i menjadi lebih jelas. Pada ukuran blok 64K, peningkatan mencapai 40-70%, dengan throughput meningkat lebih dari 12-17 GiB / s dibandingkan dengan H965i. Pada 128K-256K,Uplift menjadi lebih kuat, di mana H975i secara konsisten memberikan throughput 50-70% lebih tinggi pada jumlah benang sedang hingga tinggi.
Kesenjangan kinerja yang paling dramatis muncul pada ukuran blok yang lebih besar (512K hingga 10M). Pada 512K, H975i mencapai keuntungan +31 hingga +56 GiB / s, setara dengan peningkatan 60-80% dibandingkan dengan H965i.Pada ukuran blok 1M, kepemimpinan diperpanjang lebih lanjut, dengan lompatan throughput +40 ke +68 GiB/s, mewakili keuntungan 70-90%.dengan delta +75 sampai +79 GiB/s, yang berarti peningkatan 100% dalam beberapa skenario yang kaya dengan benang.
Secara keseluruhan, pengendali PERC 13 menunjukkan lompatan generasi yang jelas dalam kinerja menulis berurutan.H975i secara konsisten memberikan 50~100% throughput yang lebih tinggi, dengan tegas menetapkan superioritasnya atas H965i dalam beban kerja berurutan yang intensif menulis.
GDSIO Tulis Latensi Berurutan
Latensi selama penulisan berurutan tetap sangat rendah pada ukuran blok yang lebih kecil dan jumlah thread yang lebih rendah, sering tetap di bawah 50 μs melalui blok 128K dengan hingga 8 thread.Saat jumlah benang meningkatMisalnya, latensi mencapai 392 μs pada 512K dengan 32 thread dan melebihi 1 ms pada ukuran blok 1M dengan 64 thread.
Efek saturasi menjadi lebih jelas pada ukuran blok terbesar dan tingkat paralel tertinggi. latensi meningkat menjadi 12,4 ms pada 5M dengan 128 thread dan memuncak pada 50,3 ms pada 10M dengan 256 thread.
Titik operasi yang paling efisien untuk beban kerja penulisan berurutan terjadi pada ukuran blok 1M atau 5M dengan 8 hingga 16 thread, di mana throughput mencapai 87,9 hingga 101.2 GiB/s sementara latensi tetap dalam 178 μs0,7 ms, memberikan kinerja yang kuat tanpa memicu keterlambatan antrian tulis yang berlebihan.
MLPerf Storage 2.0 Kinerja
Untuk mengevaluasi kinerja dunia nyata dalam lingkungan pelatihan AI, kami memanfaatkan paket uji coba MLPerf Storage 2.0.Simulasi beban kerja pembelajaran mendalamHal ini memberikan wawasan tentang bagaimana sistem penyimpanan menangani tantangan seperti pemeriksaan dan pelatihan model.
Perbandingan Penentuan Titik Pemeriksaan
Ketika melatih model pembelajaran mesin, titik pemeriksaan sangat penting untuk secara berkala menyimpan keadaan model.memungkinkan berhenti lebih awal selama pelatihan, dan memungkinkan peneliti untuk cabang dari berbagai titik pemeriksaan untuk eksperimen dan ablasi.
Perbandingan waktu penyimpanan titik pemeriksaan menunjukkan bahwa Dell PERC13 secara konsisten melampaui PERC12 di semua konfigurasi model.sementara PERC12 membutuhkan 10Perbedaan kinerja yang paling jelas dengan model parameter 1T,dimana PERC13 selesai menyimpan dalam waktu sedikit lebih dari 10 detik dibandingkan dengan PERC12 ′s 20+ detikHal ini mewakili pengurangan sekitar 50% dalam waktu yang disimpan untuk model terbesar.
Memeriksa hasil throughput Save, data menunjukkan pemanfaatan bandwidth PERC13 yang unggul, secara konsisten memberikan tingkat transfer data yang lebih tinggi.81 GB/s, dengan kinerja puncak pada model 1T. Sebaliknya, PERC12 puncak di 9,49 GB / s dan turun ke 6,98 GB / s untuk konfigurasi terbesar.Pengendali yang lebih baru mempertahankan kinerja yang lebih stabil di berbagai ukuran model, yang menunjukkan optimasi yang lebih baik untuk menangani tulisan berurutan besar yang khas dari operasi titik pemeriksaan.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Direktur Strategi Global
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Situs web: www.qianxingdata.com/www.storagesserver.com
Fokus Bisnis:
Distribusi Produk ICT/Integrasi Sistem & Layanan/Solusi Infrastruktur
Dengan 20+ tahun pengalaman distribusi TI, kami bermitra dengan merek global terkemuka untuk memberikan produk yang dapat diandalkan dan layanan profesional.
¢Menggunakan Teknologi untuk Membangun Dunia yang Cerdas ¢Penyedia Layanan Produk ICT yang Anda Percayai!



