Data-Warehouse-la-gi-dizibrand-1

DATA WAREHOUSING LÀ GÌ?

Data Warehousing (tạm dịch: kho dữ liệu) được định nghĩa là một kỹ thuật thu thập và quản lý dữ liệu từ nhiều nguồn khác nhau để cung cấp những hiểu biết kinh doanh có ý nghĩa. Nó là sự pha trộn của các công nghệ và các thành phần hỗ trợ việc sử dụng dữ liệu chiến lược.

Đó là lưu trữ điện tử một lượng lớn thông tin của một doanh nghiệp được thiết kế để truy vấn và phân tích thay vì xử lý giao dịch. Đó là một quá trình chuyển đổi dữ liệu thành thông tin và cung cấp cho người dùng kịp thời để tạo sự khác biệt.

Cơ sở dữ liệu hỗ trợ quyết định (Kho dữ liệu) được duy trì tách biệt với cơ sở dữ liệu hoạt động của tổ chức. Tuy nhiên, kho dữ liệu không phải là một sản phẩm mà là một môi trường. Đây là một cấu trúc kiến ​​trúc của một hệ thống thông tin cung cấp cho người dùng thông tin hỗ trợ quyết định hiện tại và lịch sử, cái mà khó truy cập hoặc hiện diện trong kho dữ liệu vận hành truyền thống.

Kho dữ liệu là cốt lõi của hệ thống BI được xây dựng để phân tích và báo cáo dữ liệu.

Bạn có biết rằng một cơ sở dữ liệu được thiết kế 3NF cho một hệ thống kiểm kê, nhiều cơ sở có các bảng liên quan với nhau. Ví dụ: một báo cáo về thông tin hàng tồn kho hiện tại có thể bao gồm hơn 12 điều kiện tham gia. Điều này có thể nhanh chóng làm chậm thời gian phản hồi của truy vấn và báo cáo. Kho dữ liệu cung cấp một thiết kế mới có thể giúp giảm thời gian phản hồi và giúp tăng cường hiệu suất của các truy vấn cho báo cáo và phân tích.

Hệ thống kho dữ liệu còn được gọi bằng tên sau:

  • Hệ thống hỗ trợ quyết định (DSS)
  • Hệ thống điều hành thông tin
  • Hệ thống thông tin quản lý
  • Giải pháp kinh doanh thông minh
  • Ứng dụng phân tích
  • Kho dữ liệu
Data-Warehouse-la-gi-1-dizibrand

DATA WAREHOUSE HOẠT ĐỘNG NHƯ THẾ NÀO?

Kho dữ liệu hoạt động như một kho lưu trữ trung tâm nơi thông tin đến từ một hoặc nhiều nguồn dữ liệu. Dữ liệu chảy vào kho dữ liệu từ hệ thống giao dịch và các cơ sở dữ liệu liên quan khác.

Dữ liệu có thể là/được:

  1. Cấu trúc
  2. Bán cấu trúc
  3. Dữ liệu phi cấu trúc

Dữ liệu được xử lý, chuyển đổi và nhập để người dùng có thể truy cập dữ liệu đã xử lý trong kho dữ liệu thông qua các công cụ Business Intelligence, SQL client và bảng tính. Kho dữ liệu hợp nhất thông tin đến từ các nguồn khác nhau vào một cơ sở dữ liệu toàn diện.

Bằng cách hợp nhất tất cả các thông tin này ở một nơi, một tổ chức có thể phân tích khách hàng của mình một cách toàn diện hơn. Điều này giúp đảm bảo rằng nó đã xem xét tất cả các thông tin có sẵn. Kho dữ liệu làm cho khai thác dữ liệu là có thể làm được. Khai thác dữ liệu đang tìm kiếm các mẫu trong dữ liệu để có thể có được doanh thu và lợi nhuận cao hơn.

CÁC LOẠI DATA WAREHOUSE

Ba loại kho dữ liệu chính là:

1. Enterprise Data Warehouse (Kho dữ liệu doanh nghiệp):

Kho dữ liệu doanh nghiệp là một kho tập trung. Nó cung cấp dịch vụ hỗ trợ quyết định trên toàn doanh nghiệp. Nó cung cấp một cách tiếp cận thống nhất để tổ chức và đại diện dữ liệu. Nó cũng cung cấp khả năng phân loại dữ liệu theo chủ đề và cấp quyền truy cập theo các bộ phận đó.

2. Operational Data Store ( Kho lưu trữ dữ liệu hoạt động):

Kho lưu trữ dữ liệu hoạt động, còn được gọi là ODS, không có gì ngoài kho lưu trữ dữ liệu cần thiết khi cả kho dữ liệu và hệ thống OLTP không hỗ trợ các tổ chức báo cáo nhu cầu. Trong ODS, kho dữ liệu được làm mới theo thời gian. Do đó, nó được ưa thích rộng rãi cho các hoạt động thường ngày như lưu trữ hồ sơ của nhân viên.

3. Data Mart: 

Một data mart là một tập hợp con của kho dữ liệu. Nó được thiết kế đặc biệt cho một ngành kinh doanh cụ thể, chẳng hạn như bán hàng, tài chính, bán hàng hoặc tài chính. Trong một data mart độc lập, dữ liệu có thể thu thập trực tiếp từ các nguồn.

CÁC THÀNH PHẦN CỦA DATA WAREHOUSE

Bốn thành phần của kho dữ liệu là:

Quản lý phụ tải: Quản lý phụ tải còn được gọi là quản lý phía cầu. Nó thực hiện với tất cả các hoạt động liên quan đến việc trích xuất và tải dữ liệu vào kho. Các hoạt động này bao gồm các phép biến đổi để chuẩn bị dữ liệu để nhập vào kho dữ liệu.

Quản lý warehouse: Quản lý warehouse thực hiện các hoạt động liên quan đến việc quản lý dữ liệu trong kho. Nó thực hiện các hoạt động như phân tích dữ liệu để đảm bảo tính nhất quán, tạo các chỉ mục và khung nhìn, tạo ra sự không chuẩn hóa và tổng hợp, chuyển đổi và hợp nhất dữ liệu nguồn và lưu trữ và dữ liệu.

Trình quản lý truy vấn: Trình quản lý truy vấn còn được gọi là thành phần phụ trợ.  Nó thực hiện tất cả các hoạt động liên quan đến việc quản lý các truy vấn của người dùng. Các hoạt động của các thành phần kho dữ liệu này là các truy vấn trực tiếp đến các bảng thích hợp để lên lịch thực hiện các truy vấn.

Công cụ truy cập của người dùng cuối:

Công cụ này được phân loại thành năm nhóm khác nhau như:1. Báo cáo dữ liệu; 2. Công cụ truy vấn; 3. Công cụ phát triển ứng dụng; 4. Công cụ EIS; 5. Công cụ OLAP và công cụ khai thác dữ liệu.

AI CẦN PHẢI SỬ DỤNG DATA WAREHOUSE?

Kho dữ liệu là cần thiết cho tất cả các loại người dùng như:

  • Những người ra quyết định dựa vào khối lượng dữ liệu
  • Người dùng sử dụng các quy trình phức tạp, tùy chỉnh để lấy thông tin từ nhiều nguồn dữ liệu.
  • Nó cũng được sử dụng bởi những người muốn công nghệ đơn giản để truy cập dữ liệu
  • Nó cũng cần thiết cho những người muốn có một cách tiếp cận có hệ thống để đưa ra quyết định.
  • Nếu người dùng muốn hiệu suất nhanh trên một lượng dữ liệu khổng lồ cần thiết cho các báo cáo, lưới hoặc biểu đồ, thì kho dữ liệu sẽ trở nên hữu ích.
  • Kho dữ liệu là bước đầu tiên nếu bạn muốn khám phá ‘các mẫu ẩn’ của luồng dữ liệu và nhóm.
[Data Warehouse là gì?] Kho lưu trữ dữ liệu lưu trữ bằng thiết bị điện tử
5 (100%) 5 votes