Data Warehouse là gì? Kho lưu trữ dữ liệu lưu trữ bằng thiết bị điện tử

Data Warehouse là gì?

Data Warehouse tạm dịch kho dữ liệu là một kỹ thuật thu thập và quản lý dữ liệu từ nhiều nguồn khác nhau để cung cấp những thông tin kinh doanh có ý nghĩa. Data Warehouse là sự pha trộn của các công nghệ và các thành phần hỗ trợ trong việc sử dụng chiến lược dữ liệu.

Đó là lưu trữ điện tử một lượng lớn thông tin của một doanh nghiệp được thiết kế để truy vấn và phân tích thay vì xử lý giao dịch và cũng là một quá trình chuyển đổi dữ liệu thành thông tin và cung cấp cho người dùng kịp thời để tạo sự khác biệt.

data warehouse, logo data warehouse
Giá bánMiễn phí
Chủ đềĐa phương tiện
Bảo mật★★★★ ☆
Quyền riêng tư★★★★ ☆
Phổ biến★★★★ ★
Hệ điều hànhiOS, Android, Windows

Cơ sở dữ liệu hỗ trợ quyết định Data Warehouse được duy trì tách biệt với cơ sở dữ liệu hoạt động của tổ chức. Tuy nhiên, Data Warehouse không phải là một sản phẩm mà là một môi trường. Đây là một cấu trúc của một hệ thống thông tin cung cấp cho người dùng thông tin hỗ trợ quyết định hiện tại và quá khứ, cái mà khó truy cập hoặc hiện diện trong kho dữ liệu vận hành truyền thống.

Data Warehouse là cốt lõi của hệ thống BI được xây dựng để phân tích và báo cáo dữ liệu.

Bạn có biết rằng một cơ sở dữ liệu được thiết kế 3NF cho một hệ thống kiểm kê, nhiều cơ sở có các bảng liên quan với nhau. Ví dụ: một báo cáo về thông tin hàng tồn kho hiện tại có thể bao gồm hơn 12 điều kiện tham gia. Điều này có thể nhanh chóng làm chậm thời gian phản hồi của truy vấn và báo cáo. Nhiệm vụ Data Warehouse cung cấp một thiết kế mới có thể giúp giảm thời gian phản hồi và giúp tăng cường hiệu suất của các truy vấn cho báo cáo và phân tích.

Hệ thống Data Warehouse còn được gọi bằng tên sau:

  • Hệ thống hỗ trợ quyết định (DSS)
  • Hệ thống điều hành thông tin
  • Hệ thống thông tin quản lý
  • Giải pháp kinh doanh thông minh
  • Ứng dụng phân tích
  • Kho dữ liệu
data warehouse là gì

Data Warehouse hoạt động như thế nào?

Data Warehouse hoạt động như một kho lưu trữ trung tâm nơi thông tin đến từ một hoặc nhiều nguồn dữ liệu. Dữ liệu chảy vào kho dữ liệu từ hệ thống giao dịch và các cơ sở dữ liệu liên quan khác.

Dữ liệu có thể là/được:

  1. Cấu trúc
  2. Bán cấu trúc
  3. Dữ liệu phi cấu trúc

Dữ liệu được xử lý, chuyển đổi và nhập để người dùng có thể truy cập dữ liệu đã xử lý trong Data Warehouse thông qua các công cụ Business Intelligence, SQL client và bảng tính. Data Warehouse hợp nhất thông tin đến từ các nguồn khác nhau vào một cơ sở dữ liệu toàn diện.

Bằng cách hợp nhất tất cả các thông tin này ở một nơi, một tổ chức có thể phân tích khách hàng của mình một cách toàn diện hơn. Điều này giúp đảm bảo rằng nó đã xem xét tất cả các thông tin có sẵn. Data Warehouse làm cho khai thác dữ liệu là có thể làm được. Khai thác dữ liệu đang tìm kiếm các mẫu trong dữ liệu để có được doanh thu và lợi nhuận cao hơn.

Các loại Data Warehouse

Ba loại Data Warehouse chính là:

1. Enterprise Data Warehouse (Data Warehouse doanh nghiệp)

Data Warehouse doanh nghiệp hay còn gọi kho dữ liệu doanh nghiệp là một kho tập trung. Chức năng cung cấp dịch vụ hỗ trợ quyết định trên toàn doanh nghiệp. Ngoài ra cung cấp một cách tiếp cận thống nhất để tổ chức và đại diện dữ liệu. Và thêm nữa là cung cấp khả năng phân loại dữ liệu theo chủ đề và cấp quyền truy cập theo các bộ phận đó.

2. Operational Data Store ( Kho lưu trữ dữ liệu hoạt động)

Kho lưu trữ dữ liệu hoạt động, còn được gọi là ODS, không có gì ngoài kho lưu trữ dữ liệu cần thiết khi cả Data Warehouse và hệ thống OLTP không hỗ trợ các tổ chức báo cáo nhu cầu. Trong ODS, kho dữ liệu được làm mới theo thời gian. Do đó, nó được ưa thích rộng rãi cho các hoạt động thường ngày như lưu trữ hồ sơ của nhân viên.

3. Data Mart

Một data mart là một tập hợp con của Data Warehouse, được thiết kế đặc biệt cho một ngành kinh doanh cụ thể, chẳng hạn như bán hàng, tài chính, bán hàng hoặc tài chính. Trong một data mart độc lập, dữ liệu có thể thu thập trực tiếp từ các nguồn.

Các thành phần Data Warehouse

Bốn thành phần của Data Warehouse là:

Quản lý phụ tải: Quản lý phụ tải còn được gọi là quản lý phía cầu. Nó thực hiện với tất cả các hoạt động liên quan đến việc trích xuất và tải dữ liệu vào kho. Các hoạt động này bao gồm các phép biến đổi để chuẩn bị dữ liệu để nhập vào kho dữ liệu.

Quản lý warehouse: Quản lý warehouse thực hiện các hoạt động liên quan đến việc quản lý dữ liệu trong kho, được thực hiện các hoạt động như phân tích dữ liệu để đảm bảo tính nhất quán, tạo các chỉ mục và khung nhìn, tạo ra sự không chuẩn hóa và tổng hợp, chuyển đổi và hợp nhất dữ liệu nguồn và lưu trữ và dữ liệu.

Trình quản lý truy vấn: Trình quản lý truy vấn còn được gọi là thành phần phụ trợ.  Nó thực hiện tất cả các hoạt động liên quan đến việc quản lý các truy vấn của người dùng. Các hoạt động của các thành phần Data Warehouse này là các truy vấn trực tiếp đến các bảng thích hợp để lên lịch thực hiện các truy vấn.

Công cụ truy cập của người dùng cuối:

Công cụ này được phân loại thành năm nhóm khác nhau như:1. Báo cáo dữ liệu; 2. Công cụ truy vấn; 3. Công cụ phát triển ứng dụng; 4. Công cụ EIS; 5. Công cụ OLAP và công cụ khai thác dữ liệu.

Ai nên sử dụng Data Warehouse?

Data Warehouse là cần thiết cho tất cả các loại người dùng như:

  • Những người ra quyết định dựa vào khối lượng dữ liệu
  • Người dùng sử dụng các quy trình phức tạp, tùy chỉnh để lấy thông tin từ nhiều nguồn dữ liệu.
  • Nó cũng được sử dụng bởi những người muốn công nghệ đơn giản để truy cập dữ liệu
  • Nó cũng cần thiết cho những người muốn có một cách tiếp cận có hệ thống để đưa ra quyết định.
  • Nếu người dùng muốn hiệu suất nhanh trên một lượng dữ liệu khổng lồ cần thiết cho các báo cáo, lưới hoặc biểu đồ, thì Data Warehouse sẽ trở nên hữu ích.
  • Data Warehouse là bước đầu tiên nếu bạn muốn khám phá ‘các mẫu ẩn’ của luồng dữ liệu và nhóm.

Bài viết liên quan