Các chức vụ về khoa học dữ liệu
Tôi đã nhận được nhiều emails từ các sinh viên hỏi về việc làm Dữ liệu lớn ở Mĩ cũng như yêu cầu kĩ năng. Ngày nay Khoa học dữ liệu hay Dữ liệu lớn là một trong những nghề nghiệp nóng nhất trong công nghiệp công nghệ do việc bùng nổ của nhiều kiểu dữ liệu, cả có cấu trúc lẫn phi cấu trúc từ Internet, di động và mọi thiết bị điện tử.
Lĩnh vực Khoa học dữ liệu đã tăng trưởng lớn trong thập kỉ qua; do đó, các kĩ năng bắt đầu chuyên môn hơn. Một cách điển hình, người tốt nghiệp đại học có bằng cử nhân thường bắt đầu như Kĩ sư dữ liệu hay người quản lí kết cấu nền dữ liệu và công cụ, người biết cách thu thập, tổ chức, lưu giữ và nhận kết quả từ khối lượng dữ liệu bao la. Chức vụ Phân tích dữ liệu thường yêu cầu bằng thạc sĩ tại đó người tốt nghiệp có kĩ năng phân tích giỏi bằng việc dùng thống kê và học máy. Nhà khoa học dữ liệu thường được liên kết với mức tiến sĩ, vị trí hội tụ chính vào nghiên cứu và dự báo xu hướng.
Tôi đã tìm nhiều việc làm được đăng từ Facebook, Google, Microsoft, và Amazon và đi tới mô tả chung như sau:
Chức vụ kĩ sư dữ liệu điển hình yêu cầu người tốt nghiệp:
- Có tri thức về hệ thống tính toán phân bố, biết cách quản lí cụm Hadoop, với mọi dịch vụ của nó.
- Thành thạo dùng Hadoop v2, MapReduce, HDFS và có khả năng giải quyết các vấn đề với việc vận hành của cụm
- Có tri thức tốt về các công cụ truy vấn dữ liệu lớn, như Pig, Hive, và Impala
- Có kinh nghiệm với cơ sở dữ liệu NoSQL, như HBase, Cassandra, MongoDB
- Có kinh nghiệm với Spark và việc tích hợp dữ liệu từ nhiều nguồn dữ liệu
- Có tri thức về các kĩ thuật ETL đa dạng và các khuôn khổ, như Flume
- Có kinh nghiệm với các hệ thống thông báo đa dạng, như Kafka hay RabbitMQ
- Có kinh nghiệm với các bộ công cụ, như Mahout, SparkML, hay H2O
- Có kinh nghiệm với Cloudera/MapR/Hortonworks
- Có kinh nghiệm với việc xây dựng các hệ thống xử lí luồng, dùng các giải pháp như Storm hay Spark-Streaming
Hiện thời (9/2018), có 6,500 vị trí mở ra ở Thung lũng Silicon (tôi thường tập trung ở đây vì tôi có thể truy nhập vào những bài đăng việc làm). Các chức vụ chạy từ kĩ sư dữ liệu, người phân tích dữ liệu, và nhà khoa học dữ liệu. Lương hàng năm cho nhà khoa học dữ liệu: $125,000 tới $210,000. Người phân tích dữ liệu: $110,000 tới $145,000 và kĩ sư dữ liệu: $95,000 tới $120,000. Đó là tất cả mức vào nghề cho người mới tốt nghiệp gần đây. Thung lũng Silicon có lẽ có nhiều vị trí hơn các thành phố khác như Seattle, Boston, New York cho dù chi phí sống cũng cao hơn.
Do nhu cầu cao và thiếu hụt công nhân, các công ti như Apple, Google, IBM, Ernst and Young sẽ KHÔNG yêu cầu bằng đại học, với giả định rằng người xin vào có những kĩ năng này mà họ đã thu nhận bên ngoài các đại học truyền thống (qua MOOC hay những bài học trực tuyến.) Phó chủ tịch của Google, ông Laszlo Bock đã tuyên bố: “Khi các bạn nhìn vào những người không vào trường và làm ra con đường của họ trong thế giới, những người đó là người ngoại lệ. Và chúng tôi phải làm mọi điều chúng tôi có thể làm để tìm ra những người này.”
Tác phẩm, tác giả, nguồn
- Tác phẩm: Xu hướng công nghệ
- Nguồn: Blog của giáo sư John Vu, Carnegie Mellon University
- Wiki hóa: https://kipkis.com