Xu hướng Big Data

Trong nhiều năm, Ấn Độ đã chi phối thị trường làm khoán ngoài công nghệ thông tin (CNTT) nhưng sự việc có thể thay đổi nữa. Con sóng tiếp của khoán ngoài CNTT không còn là “viết mã và kiểm thử” hay “phát triển ứng dụng” mà là phân tích Dữ liệu lớn Big Data nơi các công ti toàn cầu sẵn lòng chi vài triệu cho tới tỉ đô la mỗi năm cho các công ti hay nước có thể cung cấp công nhân có kĩ năng trong lĩnh vực này. Một quan chức điều hành Ấn Độ than: “Qui tắc đã đổi rồi, không còn là chi phí thấp hơn mà là kĩ năng cao hơn và điều đó làm cho chúng tôi bị ngạc nhiên. Chúng tôi sẽ cần phát triển nhiều người với kĩ năng này một cách nhanh chóng.”

Big Data là về thu thập khối lượng thông tin bao la mà một công ti có trong nội bộ, tổ hợp chúng với các nguồn bên ngoài như internet rồi phân tích chúng để thu được thông tin có giá trị như xu hướng và cơ hội. Các công ti toàn cầu cần tới Big Data để nhận diện thị trường kinh doanh mới và dùng phân tích như vậy để giúp một cách hiệu quả cho người quản lí ra quyết định. Chẳng hạn, người phân tích Big Data dùng phân tích xu hướng để hiểu chiều hướng thị trường, nhu cầu của khách hàng để phát triển sản phẩm mới trước khi người khác thậm chí biết về nó. Nó cũng phân tích xu hướng của công nghiệp và thị trường tương lai để quản lí toàn thể dây chuyền cung cấp, từ vật tư thô tới chế tạo, từ các kênh phân phối cho tới đại lí bán lẻ, để cắt giảm chi phí vận hành và làm cực đại lợi nhuận.

Big Data cũng được dùng trong thị trường tài chính để dự báo xu hướng thương mại. Hiện thời thị trường chứng khoán là linh động do hiệu ứng của cuộc khủng hoảng tài chính cho nên hầu hết người làm thương mại đều rất thận trọng bởi vì kinh tế Mĩ vẫn còn đang phục hồi; Liên hiệp châu Âu đang trong khủng hoảng; thị trường Trung Quốc chậm hơn được mong đợi; Trung Đông đang dưới tình huống hỗn độn v.v. Trong tình huống này, ít người dám làm nước đi táo bạo nào. Nhưng với việc dùng Big Data, một số công ti thương mại có khả năng nhận diện những xu hướng nào đó một cách nhanh chóng và nắm lấy cơ hội. Khi phần lớn mọi người đang mất tiền vào thị trường chứng khoán, những công ti thương mại này đang thắng lớn. Nếu bạn nhìn vào việc làm được cần trong tạp chí Wall Street Journal, bạn có thể thấy mọi công ti thương mại đều đang thuê nhà khoa học dữ liệu và người phân tích dữ liệu và cạnh tranh là dữ dội.

Vì đây là lĩnh vực tương đối mới, chỉ có vài đại học hàng đầu mới cung cấp đào tạo cho nên có thiếu hụt lớn về công nhân Big Data và nhu cầu đang tăng nhanh. Theo báo cáo công nghiệp, một mình Mĩ sẽ cần 250,000 nhà khoa học dữ liệu đến năm 2015 và nhu cầu toàn thế giới có thể đẩy con số này lên tới triệu. Kĩ năng Big Data là tổ hợp của toán học, thống kê, học máy, và khoa học máy tính. Các nhà khoa học dữ liệu làm việc trên dữ liệu thời gian thực được thu thập từ nhiều nguồn để làm phân tích dự báo về xu hướng thị trường điều có thể giúp cho cấp quản lí đặt ra phương hướng, ra quyết định về thị trường tương lai. Tháng trước, tạp chí “Harvard Business Review” đã gọi Nhà khoa học Dữ liệu là “Nghề nghiệp được ham muốn nhất của thế kỉ 21.” Và các công ti thương mại chứng khoán Wall Street coi phân tích Big Data là tương lai của mọi giao tác kinh doanh tài chính.

Hiện thời, Big Data đang nổi lên như thị trường sinh lời nhất cho các công ti làm khoán ngoài CNTT với giá trị thị trường được ước lượng quãng $1 tỉ đô la năm 2015. Vì nó là khu vực mới mà có ít cạnh tranh cho nên cuộc đua nắm lấy cơ hội này và thâu tóm thị trường này đã bắt đầu giữa các công ti trên khắp thế giới. Một nhà phân tích Wall Street nói: “Sự phát triển nhanh của mạng xã hội và mạng trực tuyến khác đã cung cấp nhiều dữ liệu thế trên Internet. Điều chúng tôi cần là nắm lấy những dữ liệu có giá trị này, phân tích chúng về xu hướng để cho chúng tôi có thể ra quyết định thị trường một cách nhanh chóng. Chúng tôi cần nhà khoa học dữ liệu để tiêm thêm hào hứng vào trong thị trường chứng khoán.”

Nhiều sinh viên bị lẫn lộn vì khác biệt giữa Big Data và những lĩnh vực đã được thiết lập chắc khác như quản trị cơ sở dữ liệu, quản lí dữ liệu, khai phá dữ liệu và trinh sát doanh nghiệp. Khác biệt then chốt là các lĩnh vực khác đang thu thập và quản lí dữ liệu từ cơ sở dữ liệu quan hệ của công ti để phân tích và sinh ra báo cáo. Báo cáo này bị giới hạn vào dữ liệu được thu thập và được lưu giữ bên trong cơ sở dữ liệu của công ti và những dữ liệu này đều được xác định rõ và có cấu trúc.

Nhà khoa học dữ liệu lớn thu thập dữ liệu từ cả các nguồn bên trong VÀ bên ngoài như internet v.v. Điều này là khó hơn bởi vì dữ liệu từ các nguồn ngoài phần lớn là không được xác định rõ và không có cấu trúc rõ. Chẳng hạn, web đầy những “ứng dụng được dẫn lái bởi dữ liệu.” Gần như bất kì ứng dụng e-commerce nào cũng là ứng dụng được dẫn lái bởi dữ liệu. Các mạng xã hội như Facebook, Linkedln đầy những dữ liệu xã hội và cá nhân. Có mọi kiểu dữ liệu đằng sau từng mặt tiền web, và phần mềm giữa kết nối các cơ sở dữ liệu khác và dịch vụ dữ liệu như công ti thẻ tín dụng, ngân hàng v.v. Đó là lí do tại sao khối lượng dữ liệu là rất lớn. Về trung bình, nhà khoa học dữ liệu phải phân tích quãng 3.5 zettabytes một năm (Một zettabyte là một nghìn tỉ gigabytes hay một tỉ terabytes). VÀ những dữ liệu này lại thay đổi và tăng trưởng mọi giây hay phút. Đó là lí do tại sao nó cần các kĩ năng và thuật toán khác để thực hiện phân tích.

Cho dù nó là lĩnh vực tương đối mới, Big Data đã được dùng ở Mĩ nơi những phân tích như vậy đang sinh ra các thăm dò ý kiến công chúng, dự báo kết quả bầu cử, dự báo xu hướng thị trường chứng khoán, phân tích giao tác tài chính toàn cầu và phát triển các chiến lược cho chính phủ và các công ti tư nhân. Ngày nay mọi công ti đều tìm các công nhân có những kĩ năng này để làm việc trên các dự án dữ liệu lớn của họ và họ sẽ nắm lấy bất kì người tốt nghiệp nào có hay không có kinh nghiệm để đào tạo họ về Big Data. Một nhà phân tích công nghiệp nói: “Không có vấn đề là các công ti sẽ cần kĩ năng này để thu được ưu thế cạnh tranh trong thị trường cạnh tranh cao này và ai có công nhân có phẩm chất nhất sẽ thắng.”

Về căn bản có bốn loại việc làm trong khu vực Big Data:

1) Nhà khoa học dữ liệu: Việc làm này thường yêu cầu bằng cấp chuyên sâu (thạc sĩ hay tiến sĩ) trong khoa học máy tính, kĩ nghệ phần mềm, thống kê, trí tuệ nhân tạo, và học máy. Nhà khoa học dữ liệu thiết kế các chương trình đặc biệt và thuật toán để thu thập và phân tích dữ liệu. Người đó chịu trách nhiệm đặt ra chiến lược dữ liệu và thực hiện mọi sản phẩm dữ liệu cho công ti. Nhà khoa học dữ liệu làm việc với khối lượng dữ liệu lớn được thu thập từ cả bên trong và bên ngoài công ti để xác định những dữ liệu này có nghĩa gì và chúng tác động thế nào lên công ti.

2) Kiến trúc sư dữ liệu: Việc làm này yêu cầu bằng cấp chuyên sâu (thạc sĩ hay tiến sĩ) trong khoa học máy tính, kĩ nghệ phần mềm mà chuyên môn hoá trong quản lí dữ liệu hay trí tuệ nhân tạo. Kiến trúc sư dữ liệu lập kế hoạch, kiến trúc và tổ chức mọi công cụ tìm, thu thập và phân tích dữ liệu cho công ti.

3) Người phân tích dữ liệu: Việc làm này yêu cầu bằng cử nhân trong khoa học máy tính, kĩ nghệ phần mềm, hay quản lí hệ thông tin. Người phân tích dữ liệu dịch các phân tích thành thông tin mà người quản lí có thể dùng để ra quyết định. Người phân tích đặt chúng vào các báo cáo cho cấp quản lí và giúp họ hiểu xu hướng hiện thời.

4) Kĩ sư dữ liệu: Việc làm này yêu cầu bằng cử nhân trong khoa học máy tính, kĩ nghệ phần mềm, hay quản lí hệ thông tin. Kĩ sư dữ liệu phát triển và thực hiện các chương trình phần mềm phân tích, thu thập và phân tích dữ liệu cho công ti.

Tác phẩm, tác giả, nguồn

  • Tác phẩm: Xu hướng công nghệ
  • Nguồn: Blog của giáo sư John Vu, Carnegie Mellon University
  • Wiki hóa: https://kipkis.com