Thứ Tư, 1 tháng 1, 2014
Xây dựng cơ sở dữ liệu phân tán cho hệ thống thi trắc nghiệm tại trường cao đẳng kinh tế kỹ thuật kiên giang
3
công cụ SQL Server và Visual Studio để quản trị CSDL phân tán và
công cụ thiết kế giao diện và cuối cùng đánh giá kết quả đạt được.
Đề tài đã đạt được một số kết quả như sau: đề tài đã trình bày
một cách hệ thống, chi tiết theo hướng thực nghiệm là một tài liệu
cần thiết, bổ ích cho những người muốn tìm hiểu, thiết kế CSDL
phân tán và triển khai ứng dụng phân tán. Qua kết quả thực nghiệm,
bước đầu cài đặt ứng dụng cho kết quả khả quan. Trong tương lai
dựa vào lý thuyết thiết kế CSDL phân tán này có thể ứng dụng vào
các hệ thống lớn và có đối tượng sử dụng rộng.
5. Bố cục đề tài
Báo cáo luận văn được tổ chức thành 3 chương: Chương 1, tôi
trình bày các vấn đề liên quan đến CSDL phân tán, đặc biệt làm rõ
ưu và nhược điểm của CSDL phân tán, các mô hình có thể triển khai
hệ thống phân tán, các loại truy xuất, các mức trong suốt của CSDL
phân tán. Chương 2, trình bày các chiến lược phân tán, các phương
pháp thiết kế, các vấn đề thiết kế, các phương pháp phân mảnh, cấp
phát cho các mảnh. Chương 3, trình bày quy trình thiết kế CSDL
phân tán cho hệ thống thi trắc nghiệm, trình bày công cụ quản trị
CSDL phân tán và các bước triển khai trên hệ thống mạng.
6. Tổng quan tài liệu nghiên cứu
Tài liệu nghiên cứu về cơ sở dữ liệu phân tán, thiết kế CSDL
bằng các công cụ quản trị CSDL; Nghiên cứu tính năng Replication
trong SQL Server 2005; Nghiên cứu hiện trạng mạng nội bộ và quy
trình thi trắc nghiệm; Cài đặt cấu hình máy tính và tạo các CSDL lưu
ở các Server đúng quy định.
Ngoài ra tham khảo các tài liệu giáo viên hướng dẫn về cơ sở
dữ liệu, hệ quản trị CSDL, phân tích thiết kế hệ thống và các trang
web.
4
CHƯƠNG 1
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
Trong chương này tôi sẽ trình bày những vấn đề liên quan đến
CSDL phân tán. Nội dung của chương bao gồm giới thiệu CSDL
phân tán, hệ quản trị CSDL phân tán, các đặc trưng của CSDL phân
tán, so sánh CSDL phân tán với CSDL tập trung, các hình thức tổ
chức hệ thống phân tán, đặc trưng của loại hình hệ thống phân tán,
ưu nhược điểm các loại truy xuất, các mức trong suốt của CSDL
phân tán, thuật toán nhiều bản sao và đồng bộ dữ liệu.
1.1. CƠ SỞ DỮ LIỆU PHÂN TÁN
1.1.1. Định nghĩa
CSDL phân tán là một tập hợp nhiều CSDL có liên quan logic
và được phân bố trên một mạng máy tính.
1.1.2. Các đặc trưng của CSDL phân tán
Vô hình kết mạng: Trong môi trường phân tán, người dùng
được tách khỏi mọi chi tiết hoạt động của mạng.
Vô hình nhân bản: Vì lý do về hiệu năng, độ tin cậy và tính sẵn
sàng, người ta mong muốn có thể nhân dữ liệu thành nhiều bản trên
các máy trạm.
Vô hình phân mảnh: Phân hoạch dữ liệu cho các vị trí khác
nhau là yêu cầu tất yếu của hệ phân tán.
1.2. HỆ QUẢN TRỊ CSDL PHÂN TÁN
1.2.1. Định nghĩa
Hệ quản trị CSDL phân tán là một hệ thống phần mềm cho
phép quản lý các hệ CSDL phân tán và làm cho việc phân tán trở nên
vô hình đối với người sử dụng.
1.2.2. Các thành phần của hệ quản trị CSDL phân tán
5
Gồm các thành phần sau: Phần quản trị dữ liệu; Phần truyền
thông dữ liệu; Phần từ điển dữ liệu và Phần CSDL phân tán.
1.3. SO SÁNH CSDL PHÂN TÁN VÀ CSDL TẬP TRUNG
Dựa trên 4 yếu tố để so sánh: Điều khiển tập trung, độc lập dữ
liệu, giảm dư thừa dữ liệu, biệt lập và bảo mật dữ liệu.[3]
1.3.1. Điều khiển tập trung
Trong CSDL tập trung: Điều khiển tập trung là động cơ mạnh
nhất cho việc ra đời CSDL.
Trong CSDL phân tán: Điều khiển tập trung ít được nhấn mạnh
hơn, điều này phụ thuộc vào kiến trúc của CSDL phân tán.
1.3.2. Độc lập dữ liệu
Trong CSDL phân tán, độc lập dữ liệu cũng quan trọng giống
như trong CSDL truyền thống. Tuy nhiên, một khía cạnh mới được
thêm vào trong ý niệm của độc lập dữ liệu là trong suốt phân tán.
1.3.3. Giảm dư thừa dữ liệu
Trong CSDL truyền thống, dữ liệu dư thừa được giảm đến mức
tối thiểu bởi hai lý do: (i) Sự không tương thích giữa nhiều bản sao
của cùng một tập dữ liệu; (ii) Tiết kiệm không gian lưu trữ bằng cách
loại bỏ các dư thừa.
Trong CSDL phân tán, việc giảm dư thừa phức tạp hơn vì ngoài
hai lý do trên còn nhiều lý do để giảm dư thừa như: (i) Hoạt động
của các trình ứng dụng có thể bị tăng lên khi dữ liệu được sao lại tất
cả các vị trí nơi trình ứng dụng cần có; (ii) Tính thường trực của hệ
thống sẽ tăng lên bởi vì khi có lỗi xảy ra ở một trạm nào nó sẽ không
dừng việc thực hiện các ứng dụng của trạm khác nếu dữ liệu đã được
sao chép lại.
6
1.3.4. Biệt lập và bảo mật
Trong CSDL truyền thống, hệ quản trị CSDL tập trung có thể
bảo đảm chỉ truy cập đến dữ liệu đã được ủy quyền.
Trong CSDL phân tán, hệ quản trị dữ liệu địa phương thực chất
phải đối mặt với các vấn đề giống như hệ quản trị CSDL trong
CSDL truyền thống.
1.4. CÁC HÌNH THỨC TỔ CHỨC HỆ THỐNG PHÂN TÁN
1.4.1. Mô hình Peer-to-Peer
Các máy tính cá nhân và máy trạm có thể được sử dụng như
một hệ thống độc lập. Mỗi thành viên trong mạng có vai trò ngang
nhau.
1.4.2. Mô hình File Server
Có một số máy dịch vụ file được gán trực tiếp vào mạng LAN.
Mỗi máy cá nhân được phân chia một dung lượng cố định trên ổ
cứng của File Server, chương trình ở các máy tính cá nhân có thể
tham chiếu đến các file trên phần đĩa tương ứng của nó bằng một đặc
tả đường dẫn.
1.4.3. Mô hình Client/Server
Server có chức năng điều khiển, lưu trữ CSDL, xử lý truy vấn
và quản lý việc khai thác tài nguyên trên mạng của các máy tính
khác. Client được sử dụng để chỉ người khai thác tài nguyên mạng.
1.5. CÁC ĐẶC TRƯNG CỦA CÁC LOẠI HÌNH HỆ THỐNG
PHÂN TÁN
1.5.1. Đặc trưng của hệ thống File Server và kiến trúc
Client/Server
1.5.2. Các chức năng của kiến trúc Client/Server
a) Trình diễn thông tin phân tán
b) Trình diễn từ xa
7
c) Quản lý dữ liệu từ xa
d) Phân tán chức năng
1.6. ƯU VÀ NHƯỢC ĐIỂM CỦA PHÂN TÁN
1.6.1. Ưu điểm:
Đáp ứng nhanh hầu hết các ứng dụng sử dụng dữ liệu tại các
trạm.
Tăng cường các đơn thể ứng dụng và CSDL mà không làm cản
trở người sử dụng hiện tại.
Kiểm soát dữ liệu địa phương theo hướng hoàn thiện sự tích
hợp và quản trị dữ liệu từ xa.
Tăng cường khả năng của hệ thống liên quan đến sự dư thừa dữ
liệu.
1.6.2. Nhược điểm:
Phần mềm đắt và phức tạp
Phải xử lý các thay đổi thông báo trong mọi địa điểm
Khó kiểm soát tính toàn vẹn dữ liệu với nhiều bản sao dữ liệu
được phân bố khắp mọi nơi.
Đáp ứng chậm nhu cầu của các trạm trong trường hợp các phần
mêm ứng dụng không được phân bố phù hợp với việc sử dụng
chung.
1.7. CÁC LOẠI TRUY XUẤT CSDL PHÂN TÁN
1.7.1. Truy xuất từ xa thông qua các tác vụ cơ bản
Ứng dụng phát ra một yêu cầu truy xuất CSDL ở một vị trí nào
đó. Yêu càu này sẽ được hệ quản trị CSDL phân tán gửi đến vị trí
chứa dữ liệu đó. Thực hiện xong sẽ gửi kết quả về.[3]
1.7.2. Truy xuất từ xa thông qua chương trình phụ trợ
8
Một ứng dụng yêu cầu thực hiện một chương trình phụ trợ đặt
tại vị trí từ xa. Chương trình phụ trợ này sẽ truy xuất CSDL từ xa và
trả lại kết quả cho ứng dụng đang yêu cầu.[3]
1.8. CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN
1.8.1. Kiến trúc cơ bản của một CSDL phân tán
Hình 1.8. Kiến trúc cơ bản của CSDL phân tán
a) Sơ đồ tổng thể
b) Sơ đồ phân đoạn
c) Sơ đồ định vị
d) Sơ đồ ánh xạ địa phương
1.8.2. Các đặc điểm chính của hệ phân tán
a) Chia sẻ tài nguyên
Chia sẻ tài nguyên được thực hiện thông qua mạng. Mỗi tài
nguyên cần phải được quản lý bởi một chương trình có giao diện.
Các tài nguyên có thể được truy nhập, cập nhật một cách tin cậy và
nhất quán.s
b) Tính mở
Tính mở của hệ thống phân tán là tính dễ dàng mở rộng phần
cứng của nó.
9
c) Khả năng song song
Khả năng làm việc song song trong hệ thống phân tán được thể
hiện qua hai tình huống sau:
- Nhiều người sử dụng đồng thời đưa ra các lệnh hay các tương
tác với chương trình ứng dụng.
- Nhiều tiến trình Server chạy đồng thời, mỗi tiến trình phải đáp
ứng yêu cầu từ các Clients.
d) Khả năng mở rộng
Khả năng mở rộng của hệ thống phân tán được đặc trưng bởi
tính không thay đổi phần mềm hệ thống và phần mềm ứng dụng khi
hệ được mở rộng.
e) Khả năng thứ lỗi
Việc thiết kế dựa trên hai giải pháp sau:
- Dùng khả năng thay thế để đảm bảo sự hoạt động liên tục và
hiệu quả.
- Dùng các chương trình hồi phục dữ liệu khi xảy ra sự cố.
f) Đảm bảo tính tin cậy và nhất quán
Hệ phân tán phải đảm bảo về khả năng bảo mật của dữ liệu, các
chức năng khôi phục hư hỏng phải đảm bảo. Ngoài ra, các yêu cầu
của hệ thống về tính nhất quán cũng thể hiện như: không có mâu
thuẫn trong nội dung cơ sở dữ liệu.
1.8.3. Tính trong suốt phân tán
Tính trong suốt của một hệ thống phân tán được hiểu như là
việc che khuất đi các thành phần riêng biệt của hệ đối với người sử
dụng và những người lập trình ứng dụng.
a) Trong suốt phân đoạn
b) Tính trong suốt về vị trí
c) Trong suốt ánh xạ địa phương
10
1.9. THUẬT TOÁN NHIỀU BẢN SAO VÀ ĐỒNG BỘ HÓA DỮ
LIỆU
1.9.1. Nhu cầu thực tế và vấn đề quan tâm
1.9.2. Mô hình giải thuật
Mô hình và giải thuật nghiên cứu phải đảm bảo các đặc tính
toàn vẹn và tuân thủ theo các giai đoạn thể hiện trong hình vẽ sau.
Mỗi giai đoạn cập nhật thể hiện những đặc điểm riêng biệt về sự gắn
bó dữ liệu giữa các bản sao:
Hình 1.13. Trạng thái dữ liệu trong các giai đoạn cập nhật
1.9.3. Tổng quát
Việc phát hiện và xử lý lỗi trong quá trình xử lý được tiến hành
ngay sau khi tác tử nhận được yêu cầu cập nhật. Nếu mọi cố gắng
sửa lỗi không thể thực hiện có kết quả, thì thông điệp sẽ được phát đi
để yêu cầu tác tử gửi phát lại thông tin. Trong trường hợp công việc
cập nhật kết thúc tốt đẹp, một thông điệp khẳng định cũng được phát
đi bởi tác tử nhận. Sau khi phát đi thông điệp, tác tử gửi chuyển sang
trạng thái chờ thông điệp mới, còn tác tử nhận thông điệp chỉ chuyển
sang trạng thái chờ khi đã nhận đủ các thông điệp khẳng định.[6]
11
Hình 1.15. Sơ đồ tổng quát xử lý nhiều bản sao
1.9.4. Đồng bộ hóa dữ liệu
Đồng bộ hóa dữ liệu Replication cho phép chia sẻ dữ liệu giữa
các CSDL tại nhiều điểm khác nhau. Với một dữ liệu gốc, ta có thể
tạo nhiều bản sao và sử dụng tại nhiều nơi. Dữ liệu gốc thay đổi, các
dữ liệu bản sao cũng sẽ thay đổi và ngược lại.
Tóm lại, trong chương này tôi đã trình bày được các vấn đề liên
quan đên CSDL phân tán. Từ những lý thuyết trên giuos người sử
dụng biết được CSDL, hệ quản trị CSDL là gì? Và cũng cho chúng ta
biết được các đặc trưng của CSDL phân tán, điểm khác với CSDL
tập trung, các ưu điểm của CSDL phân tán, các hình thức tổ chức hệ
thống phân tán và các loại truy xuất CSDL phân tán. Đặc biệt đối với
các mức trong suốt của CSDL phân tán giúp người sử dụng biết được
kiến trúc cơ bản của CSDL phân tán và đây cũng là điều kiện tốt để
tôi nghiên cứu lý thuyết thiết kế CSDL phân tán ở chương sau.
12
CHƯƠNG 2
THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ
CÁC VẤN ĐỀ VỀ THI TRẮC NGHIỆM
Thiết kế một hệ thống máy tính phân tán cần phải chọn những
vị trí đặt dữ liệu và các chương trình trên một mạng máy tính và rất
có thể phải kể luôn cả việc thiết kế hệ thống mạng.
Đối với hệ quản trị CSDL phân tán, việc phân tán các ứng dụng
đòi hỏi hai điều: Phân tán hệ quản trị CSDL và phân tán các chương
trình ứng dụng chạy trên các hệ quản trị đó.
Trong chương này, tôi tập trung nghiên cứu về thiết kế CSDL
phân tán. Nội dung của chương trình bày các vấn đề gồm nội dung
thiết kế một hệ thống phân tán, các chiến lược phân tán và các vấn đề
về thi trắc nghiệm của trường như: Nghiên cứu hiện trạng mạng nội
bộ, nghiên cứu chương trình và CSDL của hệ thống thi trắc nghiệm,
nghiên cứu tính Replication trong SQL Server 2005. Các nội dung
nghiên cứu này làm cơ sở lý thuyết vững chắc để thiết kế CSDL
phân tán cho hệ thống phân tán.
2.1. NỘI DUNG THIẾT KẾ MỘT HỆ THỐNG PHÂN TÁN
2.1.1. Các công việc cần phải làm để thiết kế hệ thống phân
tán
Xác định kiến trúc mô hình phân tán tổng thể
Định vị các địa phương cần phân tán, loại hình phân tán sử
dụng cho mỗi địa phương.
Tiến hành cân đối các yếu tốt được phân tán bao gồm các phần
tử dữ liệu và các hoạt động xử lý trên mỗi trạm.
Thiết kế CSDL phân tán.
Thiết kế các chương trình ứng dụng.
2.1.2. Các sản phẩm yêu cầu sau khi phân tích thiết kế
Đăng ký:
Đăng Nhận xét (Atom)
Không có nhận xét nào:
Đăng nhận xét