**Qdrant, tăng cường "doanh nghiệp" cơ sở dữ liệu vector bằng chỉ mục GPU, nhiều AZ và nhật ký kiểm tra**

robot
Đang tạo bản tóm tắt

Nguồn mở công ty khởi nghiệp cơ sở dữ liệu vector Qdrant Solutions GmbH đã bổ sung 3 tính năng “doanh nghiệp” cho dịch vụ đám mây của mình. Các tính năng công khai lần này bao gồm chỉ mục tăng tốc GPU, cụm nhiều vùng khả dụng và nhật ký kiểm tra, nhằm đáp ứng đồng thời các yêu cầu về hiệu suất, khả dụng và tuân thủ quy định của dịch vụ trí tuệ nhân tạo.

Qdrant cho biết, cùng với sự gia tăng của các ứng dụng tăng cường truy vấn (RAG) gần đây và AI thông minh dần trở thành công cụ kinh doanh cốt lõi, tầm quan trọng của hạ tầng truy vấn vector ngày càng nổi bật. Cơ sở dữ liệu vector như một động cơ chính giúp chatbot và AI thông minh tìm kiếm dựa trên ý nghĩa, cung cấp thông tin theo thời gian thực, giảm “ảo tưởng” và nâng cao độ chính xác của phản hồi.

Tăng cường chức năng đáp ứng nhu cầu hạ tầng AI

Tăng tốc chỉ mục bằng GPU

Giám đốc điều hành kiêm đồng sáng lập Qdrant Andre Zayarni cho biết: “GPU không chỉ dùng cho suy luận mô hình, mà còn cần thiết trong quá trình tạo chỉ mục.”

Chỉ mục là cấu trúc nội bộ của cơ sở dữ liệu vector dùng để tổ chức dữ liệu một cách hiệu quả. Nhờ đó, ngay cả trong các tập dữ liệu lớn, có thể thực hiện tìm kiếm độ tương đồng nhanh chóng. Nó sử dụng các thuật toán như phân cấp có thể điều hướng nhỏ thế giới (HNSW) hoặc tệp đảo ngược (IVF) để nhóm các vector tương tự, thay thế phương pháp so sánh thủ công chậm chạp của các cơ sở dữ liệu truyền thống.

Cấu trúc chỉ mục này gần như không thể thiếu để đạt tốc độ phản hồi gần như của con người cho dịch vụ AI. Nếu hiệu suất của chỉ mục giảm, phản hồi của chatbot hoặc AI thông minh cũng sẽ chậm lại, làm khó khăn cho tương tác tự nhiên. Các hệ thống đề xuất và công cụ tìm kiếm cũng sử dụng công nghệ này rộng rãi.

Mở rộng khả năng chịu lỗi qua cụm nhiều vùng khả dụng

Qdrant không chỉ nâng cao hiệu suất mà còn tăng cường độ ổn định. Tính năng cụm nhiều vùng khả dụng mới sẽ sao chép dữ liệu và giữ nó trong 3 vùng khả dụng trong cùng một khu vực. Ngay cả khi một ví dụ bị ngắt kết nối, các hoạt động đọc ghi trong các vùng còn lại vẫn có thể tiếp tục không gián đoạn, nhằm đảm bảo liên tục dịch vụ.

Công ty nhấn mạnh rằng, dịch vụ có thể vận hành liên tục mà không cần chuyển đổi lỗi riêng biệt hoặc sự can thiệp của khách hàng. Trong xu hướng dịch vụ AI chuyển sang môi trường “liên tục trực tuyến”, kiến trúc này trực tiếp đáp ứng yêu cầu về liên tục vận hành của khách hàng doanh nghiệp.

Đáp ứng yêu cầu quản lý và tuân thủ qua nhật ký kiểm tra

Tính năng thứ ba là nhật ký kiểm tra, ghi lại toàn bộ hoạt động của API Qdrant, bao gồm truy vấn tìm kiếm, xóa, quản lý bộ sưu tập, quản lý ảnh chụp nhanh, v.v. Nhật ký cung cấp dưới dạng JSON có cấu trúc, bao gồm khóa API người dùng, dấu thời gian và các siêu dữ liệu khác, cho phép truy vết đầy đủ lịch sử thao tác.

Thời hạn lưu trữ có thể thiết lập; khách hàng cần lưu trữ lâu dài có thể tải xuống nhật ký riêng để lưu trữ hoặc làm tài liệu tuân thủ. Cùng với sự gia tăng của các ứng dụng AI, nhu cầu ghi lại lịch sử truy cập dữ liệu và nhật ký hoạt động cũng tăng lên, do đó tính năng này đã vượt ra ngoài tiện ích đơn thuần, trở thành nền tảng mở rộng kinh doanh doanh nghiệp.

Thúc đẩy phổ biến RAG, cạnh tranh trong cơ sở dữ liệu vector

Việc ra mắt lần này cho thấy, thị trường cơ sở dữ liệu vector đang chuyển từ việc tập trung vào hiệu suất truy vấn đơn thuần sang đáp ứng nhu cầu vận hành của doanh nghiệp. Hiện nay, điểm chú ý của thị trường đã vượt ra ngoài “truy vấn nhanh và nhiều”, mà tập trung vào “vận hành ổn định” và “có thể đáp ứng yêu cầu quản lý”.

Đặc biệt, cùng với sự phổ biến của RAG và AI thông minh, tìm kiếm vector đã trở thành hạ tầng cốt lõi, do đó các tính năng như tăng tốc chỉ mục GPU, cụm nhiều vùng khả dụng và nhật ký kiểm tra đang gần như trở thành điều kiện cơ bản để giành khách hàng doanh nghiệp lớn. Việc cập nhật của Qdrant được xem như một tín hiệu: thị trường hạ tầng AI đang chuyển từ giai đoạn tập trung vào “hiệu suất” sang giai đoạn mới tập trung vào “độ tin cậy vận hành”.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim