Qdrant, penyedia solusi pencarian vektor dan database yang dapat disusun telah meluncurkan kinerja pengindeksan yang ditingkatkan, mekanisme failover cluster triple-zone,dan fitur log audit yang berfokus pada kepatuhan.
Perusahaan mengembangkan basis data vektor mandiri untuk menyimpan embeddings yang dibutuhkan oleh model bahasa besar (LLM) dan agen AI otonom,yang biasanya menggerakkan alur kerja inferensi AI seperti Retrieval-Augmented Generation (RAG)Menurut Qdrant, tim pengadaan perusahaan selalu mengevaluasi alat pencarian vektor berdasarkan tiga kriteria utama: skalabilitas untuk beban kerja yang meningkat, kontinuitas layanan di tengah kegagalan infrastruktur,dan audit operasional yang dapat dilacak.
André Zayarni, Co-Founder dan CEO Qdrant, berkomentar: GPU tidak lagi terbatas pada inferensi model; mereka juga mengoptimalkan pengindeksan data.Kami telah mengaktifkan konstruksi HNSW dipercepat GPU dalam versi open source kami sejak v1.13, dan kemampuan ini sekarang tersedia secara resmi di Qdrant Cloud.suite terintegrasi membekali perusahaan untuk menerapkan Qdrant untuk beban kerja produksi kritis.
Peningkatan produk terbaru Qdrant mencakup tiga peningkatan utama:
Pengindeksan dipercepat GPU: Tes patokan mengkonfirmasi GPU khusus meningkatkan kecepatan konstruksi indeks HNSW hingga empat kali lipat di Qdrant Cloud.Pengguna dapat memasang sumber daya GPU ke kluster yang ada untuk menangani ledakan indeksasi intensitas tinggi secara efisien.
Kelompok Zona Multi-Disponibilitas (AZ): Mekanisme replikasi lintas AZ menduplikasi data di tiga zona ketersediaan di satu wilayah.Memastikan operasi membaca dan menulis tanpa gangguan bahkan jika satu zona ketersediaan mengalami gangguan.
Pendaftaran audit: Fungsi ini mencatat semua operasi berbasis API, termasuk kueri data, upserts, penghapusan, manajemen koleksi dan tugas snapshot.menandai identitas penggunaKetika sistem otonom menjalankan tugas berdasarkan data yang diambil, log memberikan jejak audit yang jelas untuk sumber permintaan,waktu pelaksanaan dan keabsahan aksesPengguna dapat menyesuaikan siklus retensi log dan ekspor catatan secara eksternal melalui API untuk arsip jangka panjang.
Saat ini, indeksasi yang dipercepat GPU dapat diakses di AWS, dengan rencana yang sedang berlangsung untuk memperluas cakupan ke lebih banyak vendor dan wilayah cloud.memberikan uptime yang didukung oleh SLA sebesar 99.95%. Fitur log audit terbuka untuk semua Kluster Cloud Qdrant berbayar.
Dokumen resmi memberikan rincian lebih lanjut tentang tiga kemampuan baru.
Catatan kaki
Hierarchical Navigable Small World (HNSW) adalah algoritma yang dirancang untuk mengidentifikasi tetangga vektor terdekat.yang berkembang secara drastis dengan meningkatnya volume data. HNSW menumpuk beberapa lapisan grafik virtual: lapisan tipis atas berisi vektor minimal untuk pencarian awal yang cepat,sedangkan lapisan bawah menyimpan semakin banyak vektor sampai lapisan bawah mencakup semua titik dataSetiap lapisan bertindak sebagai titik masuk yang dioptimalkan untuk yang berikutnya, sangat memperpendek keseluruhan penelusuran latensi.
Pinecone juga mengadopsi algoritma HNSW dan memanfaatkan GPU NVIDIA untuk mengoptimalkan kinerja embedding dan re-ranking.Zilliz memberikan kompatibilitas HNSW dan percepatan GPU; basis data Milvus yang mendasari mengintegrasikan Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) dari perpustakaan RAPIDS cuVS untuk memungkinkan pengindeksan GPU.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Direktur Strategi Global
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Situs web: www.qianxingdata.com/www.storagesserver.com
Fokus Bisnis:
Distribusi Produk ICT/Integrasi Sistem & Layanan/Solusi Infrastruktur
Dengan 20+ tahun pengalaman distribusi TI, kami bermitra dengan merek global terkemuka untuk memberikan produk yang dapat diandalkan dan layanan profesional.
¢Menggunakan Teknologi untuk Membangun Dunia yang Cerdas ¢Penyedia Layanan Produk ICT yang Anda Percayai!