Quản lí dữ liệu

Một sinh viên viết cho tôi: “Dữ liệu lớn là gì? Quản lí dữ liệu là gì? Chúng em có thể học về lĩnh vực mới này ở đâu? Xin thầy lời khuyên."

Đáp: Dữ liệu lớn là tuyển tập các dữ liệu lớn và phức tạp tới mức trở thành khó xử lí bằng việc cùng các công cụ quản lí cơ sở dữ liệu hiện thời hay các ứng dụng xử lí dữ liệu truyền thống. Vì tập dữ liệu quá lớn không được thu thập, lưu giữ, tìm kiếm, phân tích và cập nhật, nó cần cách tiếp cận mới tới quản lí dữ liệu. Lí do là ngày nay nhiều công ty đã được tự động hoá hoàn toàn cho nên khối lượng dữ liệu được thu thập đang tăng lên nhanh chóng và nhu cầu quản lí thông tin phụ suy dẫn từ việc phân tích tập lớp các dữ liệu này, khi so sánh với các tập nhỏ hơn của dữ liệu hiện sẵn có, để cho họ nhận diện được xu hướng kinh doanh và các ứng dụng khác trong chi tiết nhiều hơn.

Quản lí dữ liệu thành công yêu cầu nhiều hơn chỉ đầu tư vào việc mua nhiều phần cứng như một số nhà tư vấn công nghệ thường khuyến cáo. Công ty phải đầu tư vào việc có qui trình quản lí dữ liệu được xác định rõ tại chỗ cũng như những người có kĩ năng để quản lí mọi khía cạnh. Mọi dữ liệu đều phải được thu thập, lưu giữ, dùng, cập nhật, và rồi cho nghỉ. Với khối lượng xử lí dữ liệu tăng lên nhanh chóng, điều mấu chốt là đảm bảo rằng dữ liệu được cần cho ra quyết định và làm báo cáo quản lí là sẵn có, chính xác, đầy đủ và an ninh.

Không có cấp quản lí dữ liệu có kĩ năng tại chỗ, quan chức điều hành cấp cao có thể không nhận được thông tin đúng lúc để ra quyết định. Nếu họ nhận thông tin bị muộn hay không đáng tin, họ sẽ cần nhiều thời gian hơn để phân tích và kiểm nghiệm chúng; và trong thế giới thay đổi nhanh chóng này, quyết định muộn thường là quyết định kém. Không có hệ thống quản lí dữ liệu tại chỗ, cấp quản lí có thể nhận được các thông tin khác nhau từ các nguồn khác nhau và dạng thức dữ liệu và họ thường bị lẫn lộn. Quản lí dữ liệu hiệu quả cho phép cấp quản lí có đủ thông tin để ra quyết định tốt hơn.

Với dữ liệu lớn, quản lí dữ liệu đang trở thành phức tạp hơn trước đây và nó cần có cách tiếp cận có cấu trúc để hỗ trợ cho quá trình ra quyết định. Quản lí dữ liệu là môn mới thường được dạy trong chương trình Quản lí hệ thông tin. Nó bao gồm Qui quản dữ liệu hay quản lí và giám sát dữ liệu công ti; Cấu trúc dữ liệu hay định nghĩa dữ liệu; Kiến trúc dữ liệu hay lưu giữ và truy lục dữ liệu; Quản lí dữ liệu hay bảo trì dữ liệu trong toàn công ty và với đối tác kinh doanh và nhà cung cấp; Chất lượng dữ liệu hay độ chính xác, tính đầy đủ và tuân thủ pháp luật của dữ liệu và An ninh dữ liệu hay bảo vệ dữ liệu và cấp quyền dùng nó.

Tác phẩm, tác giả, nguồn

  • Tác phẩm: Xu hướng khoa học công nghệ toàn cầu
  • Nguồn: Blog của giáo sư John Vu, Carnegie Mellon University.
  • Wiki hóa: https://kipkis.com