Kami menggunakan Dell PowerEdge R760 yang menjalankan Ubuntu 22.04.02 LTS sebagai platform pengujian kami untuk semua beban kerja dalam ulasan ini.2, E1.S, E3.S, dan M.2 SSD. konfigurasi sistem kami diuraikan di bawah ini:
Kinerja CDN
Untuk mensimulasikan beban kerja CDN konten campuran yang realistis, SSD menjalani urutan patokan multi-fase yang dirancang untuk mereplikasi pola I/O server tepi berat konten.Proses pengujian mencakup berbagai ukuran blok besar dan kecil yang didistribusikan melalui operasi acak dan berurutan, dengan tingkat paralel yang berbeda.
Sebelum pengujian kinerja utama, setiap SSD menyelesaikan pengisian perangkat penuh melalui pas tulis 100% berurutan menggunakan blok 1MB.memungkinkan empat pekerjaan secara bersamaanFase ini memastikan drive memasuki kondisi steady-state yang mencerminkan penggunaan dunia nyata.menggunakan distribusi ukuran blok tertimbang (ukuran blok/persentase) dengan fokus yang kuat pada transfer 128K (98.51%), dilengkapi dengan kontribusi kecil dari sub-128K blok turun ke 8K. Langkah ini meniru terfragmentasi, tidak merata pola tulis yang umum terlihat di lingkungan cache terdistribusi.
Suite pengujian utama difokuskan pada operasi membaca dan menulis acak berskala untuk mengukur kinerja drive di bawah kedalaman antrian variabel dan kerja bersamaan.Setiap tes berlangsung selama lima menit (300 detik), diikuti oleh periode tidak aktif tiga menit untuk memungkinkan mekanisme pemulihan internal untuk menstabilkan metrik kinerja.
Pengujian dilakukan menggunakan distribusi ukuran blok tetap yang mendukung 128K (98,51%), dengan 1,49% operasi yang tersisa terdiri dari ukuran transfer yang lebih kecil mulai dari 64K hingga 8K.Setiap konfigurasi bervariasi di seluruh 1, 2, dan 4 pekerjaan bersamaan, dengan kedalaman antrian 1, 2, 4, 8, 16, dan 32, untuk profil skalabilitas throughput dan latensi di bawah kondisi tipikal edge-write.
Profil ukuran blok yang sangat beragam, meniru pengambilan konten CDN juga digunakan, dimulai dengan komponen dominan 128K (83,21%),diikuti oleh ekor panjang lebih dari 30 ukuran blok yang lebih kecil (4K hingga 124K)Distribusi ini mencerminkan pola permintaan yang beragam yang ditemui selama pengambilan segmen video, akses thumbnail, dan pencarian metadata.Tes ini juga dijalankan di seluruh matriks jumlah pekerjaan dan kedalaman antrian.
Kombinasi ini pra-kondisi, kejenuhan, dan campuran ukuran tes akses acak dirancang untuk mengungkapkan bagaimana SSD melakukan dalam berkelanjutan CDN seperti lingkungan,menekankan responsif dan efisiensi dalam bandwidth-berat, skenario yang sangat paralel.
CDN Workload Bacaan 1
Dalam tes pembacaan beban kerja CDN kami (1 pekerjaan), Kingston DC3000ME memberikan kinerja yang solid yang secara efektif berskala dengan meningkatnya kedalaman antrian.menyusul SanDisk SN861 sekitar 26%Namun, ketika kedalaman antrian meningkat, DC3000ME mempersempit kesenjangan dan mengungguli beberapa drive Gen5. Pada QD4, Kingston DC3000ME mencapai 3,390MB/s, sekitar 42% lebih cepat daripada Micron 9550,40% di depan Pascari X200P, dan sekitar 25% lebih cepat dari Solidigm PS1010, meskipun sedikit di belakang SanDisk SN861 sekitar 2,6%. pada QD16, DC3000ME mencapai 9,645MB/s,melebihi Solidigm PS1010 sebesar ~13% dan Micron 9550 sebesar ~20%Pada kedalaman pengujian maksimum QD32, Kingston mencapai 14,131MB/s, secara efektif menyamai Micron 9550 dan mengungguli Solidigm PS1010 sebesar ~15% dan SanDisk SN861 hampir 10%.
Kingston DC3000ME - CDN Workload Baca 1 pekerjaan
CDN Workload Bacaan 2
Dalam beban kerja membaca CDN 2 pekerjaan, Kingston DC3000ME mempertahankan kinerja yang kuat di semua kedalaman antrian. pada QD1, ia mencatat 1,854MB/s √ lebih cepat dari Micron 9550 (1,548MB/s) sebesar 20%,Pascari X200P (1,519MB/s) sebesar 22%, dan Solidigm PS1010 (2,011MB/s) sebesar sekitar 8%, meskipun tertinggal dari SanDisk SN861 (2,487MB/s) sebesar 34%.
Pada QD4, Kingston mencapai 6,335MB/s, secara nyata mengungguli Micron (5,337MB/s), Pascari (5,249MB/s), dan Solidigm (5,609MB/s).yang menempati posisi teratas di 6,996MB/s.
Pada QD16, Kingston mencapai 14.131MB/s, memimpin paket pada titik ini. Pada titik uji akhir (QD32), ia mencapai peningkatan sedikit menjadi 14.336MB/s ̇ menyusul Pascari (15.257MB/s) dan Micron (15.257MB/s).052MB/s) sebesar ~ 6% dan 5%, masing-masing, sambil mempertahankan keunggulan yang solid atas SanDisk (13,619MB/s) dan Solidigm (13,721MB/s).
CDN Workload Bacaan 4
Dengan empat pekerjaan aktif, Kingston DC3000ME terus mempertahankan sendiri dalam kinerja membaca CDN. pada QD1, ia mencapai 3,639MB/s ̇ melebihi Micron 9550 (3,070MB/s) dan Pascari X200P (2,982MB/s),tapi masih 22% di belakang SanDisk SN861, yang memimpin tingkat ini pada 4.443MB/s. Pada QD4, Kingston memberikan 10.854MB/s15% peningkatan atas Micron (9.427MB/s), 20% di depan Pascari (9.070MB/s), dan sedikit di atas Solidigm (9.627MB/s).,itu masih tertinggal SanDisk's 11,161MB/s.
Pada QD8, Kingston memposting 13,926MB/s hampir identik dengan Micron dan kira-kira sejalan dengan SanDisk (13,619MB/s) dan Solidigm (12,800MB/s).233MB/s untuk Kingston, sedikit di belakang Micron dan Pascari (keduanya sekitar 15.052 ¢ 15.257 MB/s), tetapi masih nyaman di depan SanDisk (13.619 MB/s) dan Solidigm (13.721 MB/s).
CDN Workload Tulis 1
Dalam beban kerja menulis CDN kami (1 Pekerjaan), Kingston DC3000ME menunjukkan skala yang konsisten di seluruh kedalaman antrian. di QD1, mencapai 2,118MB / s ¢ lebih cepat dari Micron 9550 (2,004MB / s), Pascari X200P (1,885MB / s),dan Solidigm PS1010 (1,718MB/s), sementara menyusul SanDisk SN861 hanya dengan rambut (2,164MB/s). Pada QD4, Kingston mencatat 4,318MB/s ⭐ 55% lebih cepat dari Solidigm (2,789MB/s), 26% lebih cepat dari Pascari (3,437MB/s), tetapi 10% lebih lambat dari Micron (4,807MB/s) dan 19% di belakang SanDisk (5,353MB/s).
Pada QD16, ia memberikan 5.880MB/s √ edging out Pascari (4.921MB/s) sebesar 20% dan lebih dari dua kali lipat Solidigm (2.664MB/s), tetapi masih 11% di belakang Micron (6.686MB/s) dan 15% off SanDisk (6.939MB/s). Pada QD32,Kingston cap pada 5,987MB/s ̇lagi dekat dengan Pascari (5,913MB/s), tetapi tertinggal Micron (7,422MB/s) dan SanDisk (7,521MB/s) masing-masing sebesar ~ 20% dan 25%.
Kingston DC3000ME - Tulis kinerja CDN beban kerja 1 pekerjaan
CDN Workload Tulis 2
Dalam beban kerja menulis CDN 2 pekerjaan, Kingston DC3000ME menunjukkan kinerja yang konsisten, meskipun umumnya tertinggal dari SSD kelas perusahaan Gen5 tercepat.651MB/s2di bawah Micron 9550 (2,813MB/s) dan Pascari X200P (2,762MB/s), dan sekitar 33% di belakang SanDisk SN861 (3,972MB/s).
Ketika kedalaman antrian meningkat, DC3000ME tetap mengikuti langkah. pada QD4, ia mencapai 4.807MB/s ≈ sekitar 23% lebih lambat daripada Micron 9550 (5.902MB/s) dan 13% di belakang SanDisk SN861 (5.508MB/s),tapi di depan Solidigm PS1010 pada 3,154MB/s.
Pada QD16, Kingston mengirimkan 5.772MB/s masih tertinggal dari Micron (7.896MB/s) dan SanDisk (6.709MB/s), namun terus mengungguli model tingkat bawah seperti Solidigm PS1010 (3,820MB/s) dan Pascari X200P (5Pada QD32, DC3000ME memuncak pada 5.870MB/s, sekitar 32% di belakang Micron 9550 (8.670MB/s) dan 22% di bawah SanDisk SN861 (7.537MB/s), tetapi masih di depan Solidigm PS1010 (2,010MB/s).817MB/s) dan Pascari (4,585MB/s).
CDN Workload Tulis 4
Dalam beban kerja menulis CDN 4 pekerjaan, Kingston DC3000ME berskala stabil di semua kedalaman antrian, meskipun umumnya tertinggal dari dua drive Gen5 teratas.202MB/s2 menempatkannya di belakang Pascari X200P (2,845MB/s), Micron 9550 (2,703MB/s), dan SanDisk SN861 (3,544MB/s), tetapi di depan Solidigm PS1010 (2,020MB/s). Pada QD2, Kingston mencapai 3,165MB/s ̇lagi tertinggal di belakang SanDisk (4,010MB/s).863MB/s) dan Micron (4,457MB/s), tetapi mempertahankan keunggulan atas Solidigm (2,872MB/s).
Pada kedalaman antrian jarak menengah, Kingston DC3000ME mencapai 3.647MB/s pada QD4 dan 4.410MB/s pada QD8.478MB/s) dan drive SanDisk (5Pada QD16, Kingston memberikan keuntungan 4,865MB/s?? sederhana dibandingkan QD8 tetapi masih tertinggal dari drive SanDisk (6,011MB/s) dan drive Micron (7,474MB/s).DC3000ME mencapai puncaknya pada 5,307MB/s ∙ memegang jauh di depan Solidigm (3,894MB/s) tetapi secara signifikan di belakang Micron (7,941MB/s) dan SanDisk (7,212MB/s).drive Kingston mempertahankan skala konsisten dan efisiensi.
Perbandingan Checkpointing DLIO
Untuk mengevaluasi kinerja dunia nyata SSD di lingkungan pelatihan AI, kami menggunakan Data dan Learning Input / Output (DLIO) benchmark tool.DLIO dirancang khusus untuk menguji pola I / O dalam beban kerja pembelajaran mendalam, memberikan wawasan tentang bagaimana sistem penyimpanan menangani tantangan seperti pemeriksaan, pengambilan data, dan pelatihan model.Bagan di bawah ini menggambarkan bagaimana kedua drive menangani proses di 36 titik pemeriksaanKetika melatih model pembelajaran mesin, titik pemeriksaan sangat penting untuk menyimpan status model secara berkala, mencegah kehilangan kemajuan selama gangguan atau kegagalan listrik.Permintaan penyimpanan ini membutuhkan kinerja yang kuatKami menggunakan versi benchmark DLIO 2.0 dari rilis 13 Agustus 2024.
Untuk memastikan benchmarking kami mencerminkan skenario dunia nyata, kami mendasarkan pengujian kami pada arsitektur model LLAMA 3.1 405B. Kami menerapkan titik pemeriksaan menggunakan torch.save() untuk menangkap parameter model,keadaan pengoptimalkanSetup kami mensimulasikan sistem delapan GPU, menggunakan strategi paralelisme hibrida dengan paralelisme tensor 4 arah dan pengolahan paralel pipa 2 arah didistribusikan di delapan GPU.Konfigurasi ini menghasilkan ukuran titik pemeriksaan sebesar 1.636GB, yang mewakili persyaratan pelatihan model bahasa besar modern.
Dalam hasil rata-rata lulus DLIO, Kingston DC3000ME 7.68TB tertinggal sedikit di belakang pesaing teratas, mendarat di tengah paket lima drive.04 detik di pass pertama, 584.38 detik di lewat kedua, dan 590.30 detik di lewat ketiga. sementara secara konsisten lebih cepat dari Pascari X200P 7.68TB (yang diposting waktu tertinggi di semua tiga lewat,mencapai 674.48 detik di pass 3), Kingston DC3000ME tertinggal dari Micron 9550 7.68TB dan Solidigm PS1010 7.68TB, yang keduanya tetap di bawah 565 detik di pass terakhir.
Seperti yang ditunjukkan dalam grafik di bawah ini, Kingston DC3000ME memulai dengan baik, dengan waktu checkpoint awal yang sangat cocok dengan pesaing tingkat atas.27 detik di belakang Micron 9550 pada 464.01 detik dan di depan Pascari X200P pada 472.65 detik. Dari titik pemeriksaan 2 sampai 4, ia mempertahankan kisaran yang stabil dari 461.92 hingga 465.44 detik lagi tinggal dekat dengan Micron 9550 dan Solidigm PS1010, yang keduanya melayang di 453 ∼ 465 kedua kurung.
Pada pertengahan tes (titik pemeriksaan 5 sampai 8), Kingston DC3000ME mengalami lompatan waktu titik pemeriksaan, mencapai puncaknya pada 613,01 detik selama titik pemeriksaan 7. Ini lebih tinggi daripada Micron 9550 (570.42s) dan SanDisk SN861 7.68TB (559.56s), meskipun masih jauh lebih baik daripada Pascari X200P (yang mencapai setinggi 694.38 detik selama interval yang sama).Kingston DC3000ME sedikit stabil, selesai pada 571,36 detik untuk checkpoint 12 ≈ kira-kira 28 detik lebih lambat dari Micron 9550 tetapi masih melampaui Pascari X200P (yang ditutup pada 689,68 detik)..68TB menunjukkan kinerja yang konsisten dan tetap berada dalam kisaran kompetitif sepanjang beban kerja pemeriksaan, menempatkannya di tengah paket.
Patokan Kinerja FIO
Untuk mengukur kinerja penyimpanan dari setiap SSD melalui metrik industri umum, kami menggunakan FIO.termasuk langkah pra-kondisi dari dua drive penuh mengisi dengan beban kerja menulis berurutan, diikuti dengan pengukuran kinerja steady-state. sebagai setiap jenis beban kerja berubah, kami menjalankan isian pra-kondisi lain dari ukuran transfer baru.
Dalam bagian ini, kami fokus pada patokan FIO berikut:
- 128K berurutan
- 64K acak
- 16K acak
- 4K acak
Dengan kapasitas tinggi QLC SSD dirancang untuk ukuran transfer besar, tes kecepatan tulis kami terbatas pada 16K acak.kami menggunakan keadaan pra-diisi dari beban kerja 16K untuk mengukur hanya 4K kinerja membaca acak.
128K Prasyarat berurutan (IODepth 256 / NumJobs 1)
Dalam tes preconditioning yang berat ini, Kingston DC3000ME mempertahankan bandwidth tulisan yang stabil sebesar 8,944.9MB/s sepanjang 1.000 detik berjalan (mengakhiri hanya melewati tanda 800 detik). Meskipun tidak tercepat (sedikit di belakang Micron 9550, yang memuncak pada 10,3GB/s),Kingston DC3000ME menunjukkan throughput yang konsisten dengan varian minimal.
128K Sequential Precondition Latency (IODepth 256 / NumJobs 1)
Dalam tes latensi 128K Sequential Write Precondition, Kingston DC3000ME menunjukkan latensi rata-rata 3,577ms (tetap stabil dari waktu ke waktu dengan fluktuasi minimal),Menempatkannya kedua di belakang drive Micron.
128K Sequential Write (IODepth 16 / NumJobs 1)
Dalam tes menulis berurutan 128K, Kingston DC3000ME mencapai 8,477.4MB/s ∙ menempatkan hanya di belakang Micron 9550 (yang memimpin kelompok di 10,354.6MB/s). Kingston DC3000ME mengalahkan Pascari X200P dan mempertahankan keunggulan yang kuat atas Solidigm PS1010 dan SanDisk SN861 (masing-masing melayang sekitar 7.100MB/s).Kinerja Kingston mencerminkan keseimbangan antara kecepatan dan konsistensi.
128K Sequential Write Latency (IODepth 16 / NumJobs 1)
Dalam tes 128K Sequential Write Latency, Kingston DC3000ME memberikan hasil yang solid dengan rata-rata latensi 235,6μs.7μs) dan Solidigm PS1010 (280Meskipun tidak cukup cepat seperti Micron 9550 (yang memimpin pada 192.9μs), Kingston DC3000ME tetap kompetitif.
128K Sequential Read (IODepth 64 / NumJobs 1)
Dalam tes Sequential Read 128K pada kedalaman antrian 64 dengan satu pekerjaan, Kingston DC3000ME mencapai 13,513.8MB/s. Meskipun menempati posisi keempat di antara drive yang diuji, ia masih memberikan throughput yang kuat (dengan perbedaan dunia nyata minimal).242.1MB/s) sebesar ~ 5,1%, Solidigm PS1010 (14,163.3MB/s) sebesar 4,6%, dan Micron 9550 (14,050.1MB/s) sebesar ~3,8%, tetapi dengan nyaman mengungguli SanDisk SN861 (12,631Secara keseluruhan, hasil Kingston DC3000ME® kuat, dengan penurunan minimal dibandingkan dengan drive yang diuji.
128K Sequential Read Latency (IODepth 64 / NumJobs 1)
Untuk latensi, Kingston DC3000ME mencatat rata-rata 591.6μs, menempatkan di tengah kelompok.4% lebih rendah dari Solidigm PS1010 (564Pascari X200P memimpin sedikit pada 561,4 μs, sementara SanDisk SN861 menunjukkan respons terlambat pada 633,0 μs.Kingston DC3000ME mempertahankan latensi yang relatif rendah di bawah kondisi membaca kedalaman antrian tinggi.
64K Tulis acak
Dalam tes Random Write 64K, Kingston DC3000ME secara konsisten memberikan kinerja tinggi di berbagai kedalaman antrian dan kombinasi benang, mencapai puncak pada 6,649MB/s dalam konfigurasi 32 ( kedalaman IO)/8 (jumlah pekerjaan).
Sepanjang grafik, Kingston DC3000ME mempertahankan tren bandwidth stabil 4.000 hingga 5.000MB/s, dengan pertunjukan yang sangat kuat di setup paralel menengah hingga tinggi (misalnya, 32/4 pada 5,380MB/s dan 16/8 pada 5,017MB/s). Bahkan dalam kondisi yang lebih ringan (1/4 dan 2/4), ia mempertahankan di atas 4.200MB/s. Dibandingkan dengan drive lain, Kingston DC3000ME umumnya memimpin atau tetap di dekat puncak di sebagian besar titik uji,menawarkan baik throughput puncak tinggi dan kinerja yang konsisten.
64K Random Write Latency
Dalam tes 64K Random Write Latency, Kingston DC3000ME secara konsisten memberikan waktu respons yang rendah di sebagian besar kedalaman antrian dan kombinasi pekerjaan,menunjukkan efisiensi menulis yang kuat bahkan di bawah beban berat.
Misalnya:
- Pada 4/1, menunjukkan 49μs
- Pada 8/1, latensi tetap rendah pada 102μs
- Pada 16/4, ia diukur 1,486μs
- Dan pada beban yang paling tinggi diuji, 32/8, itu mencapai 2.402μs
Hasil ini menunjukkan Kingston DC3000ME skala diprediksi, menghindari lonjakan latensi yang parah terlihat di drive lain, terutama model Pascari dan Solidigm,yang menunjukkan lompatan tidak teratur di atas 3,000-6,000μs (terutama pada 16/8).
64K Bacaan acak
Dalam tes Random Read 64K, Kingston DC3000ME memberikan kinerja yang kuat dan konsisten di seluruh matriks IOdepth / NumJobs, finis keempat pada akhir tes (dengan selisih kecil).Bandwidth puncak mencapai 13,515MB/s pada 32/4, dengan throughput yang sama tinggi pada 16/4 (13,482MB/s) dan 32/8 (13,512MB/s) demonstrasikan skalabilitas yang sangat baik di bawah beban kerja membaca paralel yang berat. pada beban yang lebih rendah (1/4 dan 2/2),Kingston DC3000ME diukur 2, 298MB/s dan 2,234MB/s, masing-masing.
64K Random Read Latency
Kingston DC3000ME 64K latensi tetap relatif rendah di semua titik uji.meskipun SanDisk SN861 memuncak terlihat lebih tinggi dari yang lain pada akhir tesDimulai pada 1/2, Kingston DC3000ME mengukur 106μs, diikuti oleh 108μs pada 1/4, 131μs pada 8/1, 133μs pada 4/4, dan 177μs pada 8/4. pada paralel yang lebih tinggi meningkat menjadi 305μs pada 16/4, 174μs pada 32/1,301μs pada 32/2Secara keseluruhan, profil latensi Kingston DC3000ME diikuti erat dengan performa terbaik,dengan getaran minimal atau lonjakan yang luar biasa (umum untuk semua drive yang diuji).
16K Tulis acak
Dalam tes 16K Random Write, Kingston DC3000ME memberikan bandwidth yang kuat di seluruh rentang kedalaman antrian dan jumlah thread, finis kedua di antara drive yang bersaing.592 IOPS dengan konfigurasi 32/16Titik-titik kinerja tinggi lainnya termasuk 338.521 IOPS pada 32/8, 251.428 IOPS pada 16/4, dan 226.606 IOPS pada 1/8, semuanya menunjukkan efisiensi pengontrol yang sangat baik di bawah beban paralel yang bervariasi.Bahkan dalam pengaturan beban sedang (2/16 dan 1/4), drive mencapai 218.300 IOPS dan 204.867 IOPS, masing-masing. Secara keseluruhan, Kingston DC3000ME secara konsisten mencapai IOPS di atas 160.000 di seluruh matriks uji (kecuali di beberapa area),membuatnya salah satu drive yang lebih seimbang dalam beban kerja ini.
16K Random Write Latency
Kingston DC3000ME 16K menulis latensi kinerja sangat baik, menyelesaikan di bagian atas leaderboard (dengan drive Pascari sedikit tertinggal).19μs pada 1/4, dan 29μs pada 1/2. Ketika beban meningkat, Kingston mempertahankan profil latensi yang kuat: 126μs pada 8/4, 146μs pada 2/16, 254μs pada 16/4, dan 575μs pada 16/8. Bahkan pada konfigurasi terberat (32/16),latensi tetap terkendali pada 1,197 μs.
16K Bacaan acak
Di bawah kondisi pembacaan acak 16K, Kingston DC3000ME menunjukkan kinerja yang kuat secara konsisten sampai mencapai 8/8, pada saat itu ia mulai sedikit tertinggal.Puncak IOPS mendarat di bawah 800K (648,686) di QD32 dengan empat pekerjaan, diikuti oleh 641K IOPS di QD4 dengan 16 pekerjaan dan 623K di QD16 dengan empat pekerjaan.Kingston DC3000ME selesai di dekat bagian bawah leaderboard di samping drive SanDisk.
16K Random Read Latency
Pada throughput puncak (QD8/8), latensi Kingston DC3000ME ′s diukur hanya 99μs, tinggal dalam pita sempit, latensi rendah di sebagian besar konfigurasi sampai sekitar 16/8, ketika mulai goyah.Latensi terbaik diamati pada QD1/4 (74μs), dengan beberapa hasil sub-80μs lainnya pada kedalaman antrian rendah hingga sedang. pada beban yang lebih berat (misalnya, QD32/16),Kingston DC3000ME mencatat 826μs ̊ secara signifikan lebih tinggi daripada drive yang diuji lainnya (kecuali SanDisk).
4K Bacaan acak
Dalam tes membaca acak 4K, Kingston DC3000ME menunjukkan skala yang sangat baik di seluruh rentang tes, memuncak pada 1,957.92K IOPS dengan konfigurasi 16/16.923.42K IOPS pada 32/8, 1,361.32K IOPS pada 8/16, dan 1,326.03K IOPS pada 16/8 ̊ secara konsisten peringkat di atas leaderboard bersama Solidigm dan Micron.
4K Random Read Latency
Kingston DC3000ME mempertahankan latensi rendah sepanjang tes membaca acak 4K, dimulai pada 60μs di bawah konfigurasi 1/1.tetap stabil pada 63μsDengan meningkatnya paralel, latensi meningkat secara diprediksi: 66μs pada 2/4, 67μs pada 2/16, 71μs pada 4/4, dan 80μs pada 8/4. Konfigurasi yang lebih berat melihat kenaikan sederhana: 94μs pada 16/4, 99μs pada 16/8, 135μs pada 32/8,dan puncak 266μs pada 32/16.
4K Random Write
Dalam penulisan acak 4K, Kingston DC3000ME memberikan tampilan yang kuat dengan maksimum 979.636 IOPS pada 32/16 dan 979.173 IOPS pada 32/82 menempatkannya jauh di belakang pemain top (Pascari X200P,yang melebihi 1.6M IOPS di puncak). yang mengatakan bahwa Kingston DC3000ME diposting angka yang layak di beban midrange: 879K IOPS pada 8/16, 944K IOPS pada 16/16, dan 745K IOPS pada 16/4.
4K Random Write Latency
Dalam latensi penulisan acak, Kingston DC3000ME dimulai pada 11μs di bawah 1/1, tinggal sekitar 20 ¢ 50μs sampai mencapai kedalaman 8/8 dan diskalakan menjadi 261μs pada 32/8 dan 522μs pada 32/16.Meskipun tidak terendah dalam latensi, Kingston DC3000ME mempertahankan skala yang dapat diprediksi dan moderat tanpa lonjakan yang terlihat pada drive seperti Solidigm dan Pascari, yang menunjukkan volatilitas yang lebih besar di luar 16 thread.
GPU Direct Storage
Salah satu tes yang kami lakukan di testbench ini adalah tes Magnum IO GPU Direct Storage (GDS).GDS adalah fitur yang dikembangkan oleh NVIDIA yang memungkinkan GPU untuk melewati CPU saat mengakses data yang disimpan pada drive NVMe atau perangkat penyimpanan berkecepatan tinggi lainnyaAlih-alih memutar data melalui CPU dan memori sistem, GDS memungkinkan komunikasi langsung antara GPU dan perangkat penyimpanan, secara signifikan mengurangi latensi dan meningkatkan throughput data.
Bagaimana GPU Direct Storage Bekerja
Secara tradisional, ketika GPU memproses data yang disimpan pada drive NVMe, data harus terlebih dahulu melewati CPU dan memori sistem sebelum mencapai GPU.karena CPU bertindak sebagai perantara, menambahkan latensi dan mengkonsumsi sumber daya sistem yang berharga. GPU Direct Storage menghilangkan inefisiensi ini dengan memungkinkan GPU untuk mengakses data langsung dari perangkat penyimpanan melalui bus PCIe.memungkinkan lebih cepat, transfer yang lebih efisien.
beban kerja AI khususnya pembelajaran mendalam sangat intensif data.dan penundaan dalam transfer data dapat menyebabkan GPU yang kurang dimanfaatkan dan waktu pelatihan yang lebih lama. GPU Direct Storage mengatasi tantangan ini dengan memastikan data dikirim ke GPU secepat mungkin, meminimalkan waktu kosong dan memaksimalkan efisiensi komputasi.
Selain itu, GDS sangat bermanfaat untuk beban kerja yang melibatkan streaming dataset besar (misalnya, pemrosesan video, pemrosesan bahasa alami, atau inferensi real-time).Dengan mengurangi ketergantungan pada CPU, GDS mempercepat pergerakan data dan membebaskan sumber daya CPU untuk tugas-tugas lain, meningkatkan kinerja sistem secara keseluruhan.
Membaca throughput
Di seluruh GDSIO tes membaca berurutan kami, Kingston DC3000ME menunjukkan konsisten, efisiensi throughput skala di 16K, 128K,dan ukuran blok 1MB meskipun tren kinerja bervariasi sedikit berdasarkan ukuran transferDengan blok 16K, throughput meningkat secara konstan dengan meningkatnya jumlah thread, mencapai puncaknya pada 3,70GiB/s dengan 32 thread sebelum secara bertahap menyusut menjadi 3,41GiB/s pada 128 thread.drive mencapai hasil terbaiknya dari 5.88GiB/s pada 16 thread, mempertahankan tingkat itu melalui 32 thread sebelum turun menjadi ~5.35GiB/s oleh 128 thread. pada 1MB, throughput plateaued lebih awal mencapai 6.54GiB/s pada 16 benang dan menurun sedikit ke 5.91GiB/s pada 128 benang.
Membaca Latensi
Dalam hal latensi, DC3000ME menunjukkan skala yang dapat diprediksi (sesuai dengan semua drive yang diuji): jumlah thread yang lebih rendah menghasilkan waktu respons yang lebih rendah di semua ukuran blok,dengan latensi meningkat sebagai benang ditingkatkanPada 16K, latensi dimulai pada 504μs dan secara bertahap meningkat menjadi 582μs dengan 128 thread. Untuk 128K, latensi dimulai pada 260μs dan meningkat menjadi 3,228μs pada jumlah thread tertinggi.latensi menunjukkan lompatan yang lebih besar karena muatan yang lebih berat,609μs dengan satu benang dan meningkat menjadi 2.703μs pada 128 benang.
Tulis throughput
Untuk operasi baca, rata-rata latensi dengan blok 16K dimulai pada 2.247μs dengan satu thread dan menurun menjadi 504μs pada 128 thread menunjukkan skala yang efisien di bawah paralel.latensi awalnya dimulai pada jam 4Dengan blok 1M, Kingston DC3000ME memiliki latensi terendah secara keseluruhan, mulai dari 2.609μs dengan satu thread dan tersisa di 2.500 ̊2,700μs rentang melalui 128 benang, menunjukkan responsif yang konsisten untuk pembacaan berurutan besar.
Tulis Latency
Rata-rata latensi tetap relatif stabil di seluruh jumlah thread dari 1 hingga 16, berputar sekitar 12.234 hingga 14.247μs. Pada 32 thread latensi sedikit meningkat menjadi 15.559μs dan naik menjadi 20,944μs pada 64 benangSebuah lonjakan yang signifikan terjadi pada 128 thread, di mana latensi Kingston DC3000ME melonjak menjadi 28.725μs lebih dari dua kali lipat dari tingkat sebelumnya.
Kesimpulan
Kingston DC3000ME diposisikan sebagai solusi praktis untuk perusahaan arus utama dan penyebaran pusat data di mana keandalan, kinerja yang konsisten,dan serangkaian fitur perusahaan yang solid adalah persyaratan utama. Drive ini melayani integrator sistem, reseller nilai tambah (VAR), dan tim TI di lingkungan UKM dan UKM yang membangun dan mengelola infrastruktur mereka sendiri.2 dan dukungan PCIe Gen5 memberikan kompatibilitas luas dan bandwidth siap masa depan, menjadikannya kandidat yang kuat untuk penyebaran yang didorong saluran.
Kingston DC3000ME sudut
Dari perspektif kinerja, DC3000ME memberikan throughput kompetitif dan efisiensi di berbagai beban kerja.dan skala latensi yang konsisten di bawah beban kerja campuran dan acakMeskipun kadang-kadang tertinggal dari kinerja Gen5 teratas (misalnya, Micron dan SanDisk) dalam CDN berat atau patokan pemeriksaan tertentu, ia tetap kompetitif.