Là Developer không nên bỏ qua kiến thức này về Raid

0
180

Sự gia tăng nhanh chóng của lượng dữ liệu khổng lồ cần được lưu trữ vào năm 1990 đặt ra vấn đề làm sao để tìm ra ổ cứng có khả năng cao trên các máy chủ. Để giải quyết vấn đề này thì RAID đã ra đời. Vậy, RAID là gì? RAID mang lại lợi thế như thế nào cho ngành công nghệ thông tin? Bài viết sau đây sẽ giúp bạn có thể làm rõ triệt để những vấn đề này. 

RAID là gì?

 RAID là viết tắt của cụm từ Redundant Array of Inexpensive Disks có nghĩa là hệ thống đĩa dự phòng. Đây là một loại hệ thống có khả năng kết nối dãy các ổ cứng có chi phí thấp lại với nhau để hình thành một thiết bị nhớ đơn với dung lượng lớn nhằm hỗ trợ hiệu quả hơn và đáng tin cậy hơn so với các giải pháp trước đây. 

Raid là gì?

Raid là gì?

RAID thường được dùng và triển khai thành những biện pháp lưu trữ trong doanh nghiệp và máy chủ. Tuy nhiên, trong 5 năm sau đó thì  RAID được sử dụng trở nên phổ biến hơn với mọi đối tượng người dùng. 

Lịch sử phát triển của RAID

RAID được phát minh và ra đời lần đầu tiên vào năm 1987 tại trường đại học California ở Berkeley. Chỉ với việc ghép các phần đĩa cứng nhỏ hơn thông qua phần mềm để tạo ra hệ thống đĩa dung lượng lớn hơn nhằm thay thế cho các ổ cứng có dung lượng đắt trong thời đại bấy giờ. 

Mặc dù không còn tồn tại, tuy nhiên vào năm 1992 hội đồng tư vấn sáng lập và phát triển  RAID đã định hướng, đưa ra tiêu chuẩn và định dạng cho  RAID. Họ đã phân tích cấp độ của  RAID và đề xuất các tiêu chuẩn phần cứng nhằm sử dụng RAID. Khi đó, RAB đã phân ra 7 loại cấp độ từ 0 đến 6, những cấp độ này không phải theo dạng cấp cao đến cấp thấp. Mà chúng phân biệt giữa loại RAID này và loại  RAID khác. 

Bạn đọc tham khảo thêm : 

Tuyển dụng python lương cao chế độ hấp dẫn

Tuyển dụng javascript lương cao chế độ hấp dẫn

Những hiệu quả của RAID là gì?

Hiện nay, RAID đang được áp dụng vô cùng phổ biến vì 3 lý do cơ bản sau: 

Dự phòng

Dự phòng là  một trong những yếu tố vô cùng quan trọng đối với quá trình phát triển của RAID trong môi trường máy chủ. Dự phòng sẽ cho phép người dùng có thể sao chép dữ liệu của bộ nhớ khi có sự cố phát sinh. Khi một ổ cứng trong dãy xuất hiện trục trặc thì nó có thể hoán đổi sang những ổ cứng khác mà không cần phải tắt hệ thống hoặc sử dụng ổ cứng dự phòng. Biện pháp dự phòng này phụ thuộc nhiều vào phiên bản RAID mà bạn đang sử dụng. 

Mang lại hiệu quả cao

Khi áp dụng các phiên bản RAID mạnh người dùng có thể nhận thấy sự hiệu quả vô cùng rõ ràng của nó. Hiệu quả này còn phụ thuộc vào số lượng ổ cứng được liên kết với nhau cũng như các mạch điều khiển. 

RAID mang lại những hiệu quả vô cùng nổi bật cho hệ thống máy tính

RAID mang lại những hiệu quả vô cùng nổi bật cho hệ thống máy tính

Giá thành thấp và hợp lý

Khi ra đời, RAID đã được gắn liền với mục tiêu cung cấp bộ nhớ tốt hơn cho hệ thống so với việc sử dụng các ổ đĩa có dung lượng lớn riêng biệt. Vì vậy, giá thành của RAID luôn là vấn đề chủ chốt và đảm bảo mọi tập đoàn CNTT đều sẽ được đáp ứng. 

Hiện nay có những loại RAID nào?

RAID 0, RAID 1 và RAID 5 là 3 cấp độ chuyên được sử dụng dành riêng cho hệ thống máy tính để bàn. Với nhiều trường hợp khác thì chỉ có hai trong 3 cấp độ trên mang lại hiệu lực và một trong 2 kỹ thuật sẽ được sử dụng mà không phải là một cấp độ của RAID. 

RAID 0

RAID không được xem là cấp độ RAID hợp lệ bởi nó được đưa ra nhưng không thể cung cấp cấp độ dự phòng nào cho các dữ liệu được lưu trữ. Bởi vậy, nếu như có một ổ cứng bị lỗi thì rất có khả năng gây ra nguy hiểm cho dữ liệu. 

RAID 0 thường sử dụng một kỹ thuật có tên gọi là Striping. Striping có nhiệm vụ phân chia khối dữ liệu đơn trong hình vẽ và trải chúng thông qua các ổ cứng. Tác dụng của nó là làm tăng hiệu quả thực thi, từ đó có thể ghi được hai khối dữ liệu cùng lúc tới hai ổ cứng so với một ổ cứng trước đây. 

Điểm mạnh: Gia tăng hiệu quả lưu trữ và không làm mất đi dung lượng của dữ liệu. 

Điểm yếu: Không có ổ dự phòng

RAID 1

RAID 1 là phiên bản RAID thực sự đầu tiên, nó cung cấp phương pháp dự phòng dữ liệu đơn giản thông qua kỹ thuật mirroring (nhân bản dữ liệu). Kỹ thuật này cần phải có 2 ổ cứng riêng biệt có cùng chung một dung lượng. Mỗi một ổ sẽ hoạt động và một ổ còn lại sẽ là dự phòng. Nếu dữ liệu được ghi vào ổ hoạt động thì đồng thời nó sẽ được ghi luôn vào ổ dự phòng. 

RAID có khả năng cung cấp một phiên bản dự phòng dữ liệu hoàn toàn đầy đủ cho hệ thống. Nếu một ổ gặp phải sự cố thì ổ còn lại vẫn có thể hoạt động. Tuy nhiên, kỹ thuật này lại có hạn chế là dung lượng RAID chỉ bằng dung lượng nhỏ nhất của hai ổ cứng nếu như dung lượng được lưu trữ trên 2 ổ được dùng một cách độc lập. 

Điểm mạnh: Có thể cung cấp dự phòng dữ liệu trên toàn diện

Điểm yếu: Dung lượng được lưu trữ sẽ chỉ lớn bằng dung lượng ổ nhỏ nhất. Xuất hiện nhiều thời gian chết để thay đổi ổ hoạt động nếu như có sự cố. RAID 1 không thể tăng hiệu suất thực thi. 

RAID cấp độ 1

RAID cấp độ 1

RAID 2

Loại RAID này có cơ chế kiểm tra lỗi ở mức Bit sử dụng cơ chế Hamming code. Tuy nhiên, chúng gần như mặc định ổ cứng hiện tại đều đã được tích hợp kiểm tra mức bit bằng Hamming code. Do vậy, loại RAID này không còn được sử dụng phổ biến hiện nay. 

RAID 3

RAID 3 là loại đầu tiên sử dụng cơ chế dự phòng dữ liệu bằng Parity. Trong đó, Parity là kết quả được tạo ra thông qua tính toán XOR giữa các bit trong block dữ liệu đã được lưu trữ. 

Tuy nhiên, theo thực tế thì loại RAID này không còn được sử dụng rộng rãi do mang lại hiệu năng thấp. Nó đặc biệt thấp với Database do việc xử lý theo từng Bit sẽ làm mất rất nhiều thời gian khi lưu trữ và truy xuất. 

RAID 4

Tương tự với RAID 3, tuy nhiên RAID lại nằm ở mức độ của các khối dữ liệu lớn hơn chứ không phải đến từ byte. Chúng thường yêu cầu tối thiểu 3 đĩa cứng (2 đĩa dành cho dữ liệu, 1 đĩa dùng cho dữ liệu Parity).

Tuy nhiên, hiện nay loại RAID này không còn được sử dụng quá nhiều.

 RAID 5

RAID 5 là cấp độ RAID mạnh nhất dành riêng cho hệ thống các máy tính để bàn. Đặc trưng của chúng là có một bộ điều khiển phần cứng để quản lý các dãy ổ cứng nhưng một số hệ điều hành máy tính chỉ có thể thực hiện điều này thông qua phần mềm. Biện pháp này sử dụng phân chia parity để có thể duy trì dự phòng dữ liệu. Cần phải có ít nhất 3 ổ cứng có năng suất cao như nhau mới có thể áp dụng và sử dụng RAID 5. 

Parity là một phép toán nhị phân so sánh 2 khối dữ liệu với một khối dữ liệu thứ 3 dựa trên 2 khối đầu tiên. Biện pháp này sẽ được giải thích thông qua chẵn và lẻ. Nếu như tổng của 2 khối dữ liệu này là số chẵn thì số bit là chẵn còn nếu tổng của 2 khối dữ liệu này là lẻ thì bit sẽ là lẻ. Do vậy, bạn cần dựa vào phép toán nhị phân 0+0 and 1+1 đều bằng 0 hoặc 0+1 or 1+0 bằng 1 để đảm bảo một ổ trong dãy bị trục trặc thì sẽ cho phép những bit này khôi phục lại dữ liệu khi ổ đó được thay thế. 

Nếu các bit “parity” luân chuyển giữa 2 ổ cứng thì chúng sẽ giúp gia tăng hiệu suất cũng như độ tin cậy cho dữ liệu. Vì vậy, dải ổ cứng sẽ tăng hiệu suất thông qua các ổ riêng lẻ vì nếu quá nhiều ổ thì khả năng ghi dữ liệu sẽ nhanh hơn so với một ổ. Ngoài ra, dữ liệu cũng sẽ được dự phòng toàn bộ nhờ vào các bit parity.

Trường hợp cả 2 ổ đều bị lỗi thì dữ liệu sẽ được phục hồi dựa vào dữ liệu và các bit trên 2 ổ còn lại. Dung lượng dữ liệu sẽ bị giảm đi do các khối dữ liệu chẵn lẻ. Trong thực tế, thì nếu n là số lượng ổ và z là dung lượng thì ta sẽ có công thức: 

(n-1)*z – Dung lượng. 

Điểm mạnh: Gia tăng dung lượng lưu trữ, dữ liệu sẽ được dự phòng toàn bộ và có khả năng hoán đổi nhanh lên đến 24/7.

Điểm yếu: Giá thành cao, hiệu quả thực thi sẽ bị giảm trong quá trình phục hồi. 

RAID cấp độ 5

RAID cấp độ 5

Tổng kết

RAID là một yếu tố quan trọng giúp hỗ trợ các hệ thống với nhiều loại tiện ích khác nhau dựa vào nhiều phiên bản khác và cấp độ khác nhau. Hiện nay, RAID 0, RAID 1 và RAID 5 là một trong những loại RAID được sử dụng phổ biến nhất hiện nay. Hy vọng, từ những kiến thức trên bạn đã hiểu rõ RAID là gì cũng như các cấp độ RAID hiện hành phổ biến nhất hiện nay.

LEAVE A REPLY

Please enter your comment!
Please enter your name here