Trang chủBlogRa mắt Kiến trúc lưu trữ chính ZStack Cloud Vhost: Đạt được sự hài hòa hoàn hảo giữa triệu IOPS trên mỗi đĩa và độ trễ 100 micro giây

Ra mắt Kiến trúc lưu trữ chính ZStack Cloud Vhost: Đạt được sự hài hòa hoàn hảo giữa triệu IOPS trên mỗi đĩa và độ trễ 100 micro giây

2025-03-19 11:54

Mục lục

Phiên bản ZStack Cloud 5.0.0 hỗ trợ Bộ lưu trữ phân tán toàn flash hiệu suất cao thế hệ tiếp theo. Bài viết này khám phá kiến trúc tích hợp lưu trữ chính ZStack Cloud Vhost từ góc độ triển khai kỹ thuật.

Giới thiệu

Với sự phát triển của trí tuệ nhân tạo, nhu cầu về hệ thống lưu trữ dữ liệu của doanh nghiệp đã vượt xa khả năng và sự ổn định cơ bản, tập trung nhiều hơn vào hiệu suất, khả năng xử lý đồng thời cao và khả năng mở rộng linh hoạt. Điều này đặc biệt đúng đối với các ngành như tài chính, chăm sóc sức khỏe và sản xuất, những ngành đang phải đối mặt với áp lực lưu trữ dữ liệu chưa từng có.

Ngành tài chính, nổi tiếng với tính ổn định, cũng có những yêu cầu nghiêm ngặt về hiệu suất đối với các hệ thống ứng dụng của mình. Ví dụ: các tình huống kinh doanh điển hình như giao dịch, kiểm soát rủi ro và quản lý tài sản phải đối mặt với những thách thức mới về hiệu suất lưu trữ, đặc biệt là về băng thông và độ trễ, khi xử lý dữ liệu đồng thời và phân tích dữ liệu theo thời gian thực trên quy mô lớn, như đã thấy trong hoạt động kinh doanh internet hiện tại.

Trong ngành chăm sóc sức khỏe, hơn 80% dữ liệu lưu trữ y tế bắt nguồn từ dữ liệu hình ảnh y tế đang phát triển nhanh chóng, với tốc độ tăng trưởng hàng năm là 30-40%. Các tổ chức y tế cũng được yêu cầu lưu giữ hồ sơ y tế điện tử nội trú trong ít nhất 30 năm và hồ sơ y tế điện tử ngoại trú trong ít nhất 15 năm. Ngoài ra, các khoa lâm sàng khác nhau có các yêu cầu cụ thể liên quan đến thời gian đối với việc lưu trữ dữ liệu, điều này áp đặt các tiêu chuẩn cao hơn đối với kiến ​​trúc lưu trữ hiện có.

Công nghiệp 4.0 đã có tác động to lớn đến sản xuất hiện đại, đặc biệt là trong các tình huống kinh doanh thời gian thực như MES (Hệ thống thực thi sản xuất). Toàn bộ dây chuyền sản xuất phụ thuộc rất nhiều vào hiệu suất lưu trữ, vì bất kỳ sự chậm trễ nào vượt quá phạm vi chấp nhận được đều có thể dẫn đến sự cố trong sản xuất, ảnh hưởng trực tiếp đến sự phát triển của doanh nghiệp.

Các giải pháp lưu trữ truyền thống như SAN thường gặp phải tình trạng tắc nghẽn về hiệu suất, độ trễ cao và khó khăn khi mở rộng khi xử lý dữ liệu phức tạp và tần số cao, cản trở sự phát triển của doanh nghiệp người dùng. Để vượt qua tình thế tiến thoái lưỡng nan này, một hệ thống lưu trữ phân tán toàn flash hiệu suất cao dựa trên giao thức vhost-user đã xuất hiện. Hệ thống này, với các khái niệm thiết kế sáng tạo và các tính năng kỹ thuật tiên tiến, cung cấp giải pháp hiệu suất cao, có thể mở rộng và tiết kiệm chi phí cho các ngành như tài chính, y tế và sản xuất.

Nguyên tắc kỹ thuật

Giải pháp virtio chủ đạo là mẫu thiết bị được thiết kế đặc biệt cho môi trường ảo hóa, cung cấp giao diện và cách triển khai tiêu chuẩn cho các thiết bị I/O ảo. Trình điều khiển virtio được thiết kế để giảm thiểu các hoạt động phụ trợ máy chủ (vmexit) nhằm cải thiện hiệu quả I/O. Mặc dù virtio đã được tối ưu hóa đáng kể so với các giải pháp ảo hóa thuần túy, việc xử lý I/O trong luồng QEMU IO vẫn không hiệu quả. Lấy virtio-blk với phần phụ trợ tệp làm ví dụ, đường dẫn I/O của nó bao gồm:

Đường dẫn này bao gồm hai chuyển đổi ngữ cảnh giữa không gian người dùng máy chủ và không gian kernel, làm tăng độ trễ.

giải pháp tài năng

Công nghệ vhost chuyển quá trình xử lý dữ liệu phụ trợ của các thiết bị virtio ra ngoài quy trình QEMU, tránh chuyển đổi trạng thái và lệnh gọi hệ thống trong QEMU. Thay vào đó, nó gọi trực tiếp trình điều khiển thiết bị trên máy chủ (chẳng hạn như chặn đọc/ghi thiết bị hoặc gửi/nhận mạng) để thực hiện các thao tác I/O thực tế, nâng cao đáng kể hiệu suất phụ trợ.

Là một trong những công nghệ cốt lõi của lưu trữ hiệu suất cao, giao thức vhost-user cho phép truyền dữ liệu trực tiếp giữa các ứng dụng trong không gian người dùng và máy ảo, giảm đáng kể chuyển đổi ngữ cảnh giữa nhân và không gian người dùng, giảm chi phí xử lý ngắt CPU một cách hiệu quả và cải thiện hiệu suất tổng thể. So với virtio truyền thống, vhost-user đơn giản hóa đường dẫn I/O:

giải pháp người dùng vhost

Khi triển khai vhost trong không gian người dùng, người dùng vhost giao tiếp với quy trình QEMU thông qua các ổ cắm Unix để lấy thông tin cấu hình hàng đợi và bố cục bộ nhớ. Sau đó, nó sử dụng mmap để triển khai giao tiếp bộ nhớ dùng chung giữa QEMU và khách. Cơ chế này cho phép các ứng dụng trong không gian người dùng trên máy chủ (chẳng hạn như cổng lưu trữ) truy cập trực tiếp vào hàng đợi của thiết bị virtio mà không cần đi qua các hàng đợi khác, do đó cải thiện đáng kể hiệu suất I/O.

Tính năng kỹ thuật

Tuy nhiên, chỉ dựa vào giao thức người dùng vhost là không đủ để đạt được IOPS cấp triệu và độ trễ dưới một trăm micro giây với một đĩa đơn. Để giải quyết vấn đề này, ZStack Cloud đã triển khai một số công nghệ chính:

Kiến trúc không khóa

Bằng cách sử dụng ID Sharding để phân phối các tác vụ I/O trên các kênh xử lý khác nhau, việc phân chia tài nguyên sẽ đạt được và kiến trúc không khóa được xây dựng, giúp giảm độ trễ I/O một cách hiệu quả. ZStack Cloud áp dụng kênh dữ liệu hoàn toàn không có không gian người dùng, không khóa kết hợp với mô hình xử lý I/O RTC. Điều này đạt được khả năng xử lý I/O mạng không bị gián đoạn, không bị gián đoạn, không khóa, toàn bộ không gian người dùng từ đầu đến cuối, cùng với các chiến lược thăm dò không đồng bộ và ràng buộc cốt lõi. Thiết kế này giảm thiểu độ trễ của ngăn xếp phần mềm xuống còn 20–40μs, một cải tiến đáng kể so với 400μs điển hình trong ngăn xếp I/O phân tán truyền thống. Nó giải phóng hoàn toàn khả năng của công nghệ mạng và phần cứng thế hệ mới.

Bộ nhớ đầy đủ không sao chép

ZStack Cloud tối ưu hóa việc truyền dữ liệu bằng cách sử dụng công nghệ không sao chép, tránh nhiều bản sao dữ liệu giữa không gian người dùng và không gian kernel. Dữ liệu được truyền trực tiếp từ bộ đệm của người gửi sang bộ đệm của người nhận mà không cần sự can thiệp của CPU, giúp giảm đáng kể thời gian xử lý dữ liệu và mức tiêu thụ tài nguyên hệ thống. Với sự hỗ trợ của bộ nhớ chia sẻ trang lớn và mạng RDMA, tính năng không sao chép được triển khai từ bộ nhớ I/O của máy ảo đến các cổng lưu trữ và OSD, trong khi bộ nhớ trang lớn được quản lý tập trung để đảm bảo việc phân bổ bộ nhớ xem xét hiệu suất truy cập NUMA trong cùng một nút NUMA.

Giảm chi phí thông báo phụ trợ của GuestOS

Trong cổng lưu trữ, phần phụ trợ vhost sử dụng cơ chế thăm dò để tránh máy ảo kích hoạt bộ lưu trữ phụ trợ mỗi khi xảy ra thao tác I/O, do đó cải thiện hiệu suất hệ thống.

Đồng thời đa lõi

ZStack Cloud tận dụng khả năng xử lý mạnh mẽ của CPU đa lõi hiện đại để hỗ trợ nhiều hàng đợi. Sử dụng thuật toán cân bằng, nó phân bổ đồng đều các đặc tính trên các lõi, cho phép tính đồng thời cao. Điều này cân bằng tải một cách hiệu quả đồng thời cải thiện đáng kể thông lượng I/O của khách và tốc độ phản hồi cho từng ổ đĩa.

Xác minh hiệu suất

Để xác minh hiệu suất thực tế của bộ lưu trữ chính Vhost, chúng tôi đã sử dụng cấu hình cụm máy chủ điển hình với môi trường mạng RDMA hiệu quả. Cấu hình môi trường thử nghiệm cụ thể như sau:

Cấu hình mạng RDMA:

 

Cấu hình ba máy chủ:

Trong quá trình thử nghiệm, bộ lưu trữ chính Vhost cho thấy hiệu năng vượt trội:

Hiệu suất độ trễ thấp

Trong các điều kiện kiểm tra độ trễ nghiêm ngặt, với các tham số kiểm tra fio được đặt thành độ sâu=1 và numjob=1, các thao tác đọc/ghi ngẫu nhiên 4KB trong máy ảo được kiểm soát ở độ trễ khoảng 100 micro giây.

Khả năng thông lượng cao

Để kiểm tra khả năng xử lý đồng thời cao của hệ thống, chúng tôi đã điều chỉnh các tham số kiểm tra fio thành độ sâu=64 và số công việc=8. Hệ thống đã đạt được thành công IOPS nhỏ ngẫu nhiên cấp triệu trong khi vẫn duy trì hiệu suất đọc và ghi dẫn đầu ngành.

Sử dụng CPU hiệu quả

Với thiết kế nhiều hàng đợi (hàng đợi=4), hiệu suất IOPS tăng gấp 2 đến 3 lần so với chế độ một hàng đợi, đồng thời duy trì độ trễ thấp ngay cả khi thông lượng cao.

Kiểm tra cơ sở dữ liệu

Trong MySQL 5.7 với cấu hình 8 nhân 16GB, so với bộ lưu trữ phân tán truyền thống, bộ lưu trữ chính Vhost đã cải thiện 30% TPS và độ trễ 95% giảm khoảng 3 lần. Khi số lượng luồng tăng lên 96, QPS được cải thiện 38%.

Ở Oracle 19c với cấu hình 8 nhân 16GB, so với bộ lưu trữ phân tán truyền thống, bộ lưu trữ chính Vhost đạt TPM tăng gấp 6 lần, đạt 420.000 TPM.

Thực hành kịch bản

Thực hành xử lý hàng loạt tổ chức tài chính

Một tổ chức tài chính ở khu vực Đồng bằng sông Dương Tử đã thực hiện thử nghiệm POC sử dụng bộ lưu trữ chính Vhost và so sánh với sản phẩm nước ngoài có cùng cấu hình, thời gian xử lý hàng loạt đã giảm 62%, cải thiện đáng kể hiệu quả hoạt động.

Thực hành kiểm tra hiệu suất khách hàng sản xuất cao cấp

Một doanh nghiệp sản xuất ô tô ở miền trung Trung Quốc đã đạt được hiệu suất đọc-ghi cải thiện 21% so với các sản phẩm mảng lưu trữ cao cấp bằng cách thử nghiệm bộ lưu trữ chính Vhost trong ZStack Cloud 5.0.0.

Thử nghiệm đồng thời đăng ký bệnh viện hạng ba Thiên Tân

Một bệnh viện lớn ở Thiên Tân đã cải thiện 63% công suất đăng ký đồng thời bằng cách sử dụng bộ lưu trữ chính Vhost trong ZStack Cloud 5.0.0, giảm 30% thời gian chờ đợi, cải thiện đáng kể trải nghiệm của bệnh nhân.

Kết luận

Hệ thống lưu trữ chính Vhost thế hệ tiếp theo, với các nguyên tắc kỹ thuật tiên tiến và giá trị kinh doanh quan trọng, cung cấp các giải pháp lưu trữ dữ liệu hiệu quả, đáng tin cậy và tiết kiệm chi phí cho các ngành khác nhau. Nó cho phép các doanh nghiệp đối phó với những thách thức dữ liệu hiện đại và đạt được những đột phá về công nghệ.

Là một công ty điện toán đám mây tập trung vào đổi mới sản phẩm, ZStack cố gắng làm cho các sản phẩm đám mây dễ sử dụng hơn và hạ thấp ngưỡng cho người dùng. Sự ra mắt của tính năng lưu trữ chính Vhost là một minh chứng mạnh mẽ cho triết lý này. Trong tương lai, chúng tôi sẽ tiếp tục giới thiệu nhiều tính năng sản phẩm điện toán đám mây phong phú và hữu ích hơn để tạo ra giá trị cho người dùng.

 

//