Trang chủ / Python / Khoa học dữ liệu (Data science)

Khoa học dữ liệu (Data science)

Khoa học dữ liệu là sự kết hợp của nhiều công cụ, thuật toán và nguyên tắc học máy với mục tiêu khám phá các mẫu ẩn từ dữ liệu thô (Blei & Smyth, 2017). Nhưng điều này khác với những gì các nhà thống kê đã làm trong nhiều năm? Câu trả lời nằm ở sự khác biệt giữa giải thích và dự đoán.  Một nhà phân tích dữ liệu thường giải thích những gì đang xảy ra bằng cách xử lý lịch sử dữ liệu. Mặt khác, nhà khoa học dữ liệu không chỉ thực hiện phân tích khám phá để khám phá thông tin chi tiết từ đó mà còn sử dụng các thuật toán học máy nâng cao khác nhau để xác định sự xuất hiện của một sự kiện cụ thể trong tương lai từ nhiều góc độ, đôi khi là những góc độ không được biết trước đó (Cao, 2017).

Vì vậy, Khoa học dữ liệu chủ yếu được sử dụng để đưa ra quyết định và dự đoán bằng cách sử dụng phân tích nhân quả dự đoán, phân tích mô tả (dự đoán cộng với khoa học quyết định) và học máy (Blei & Smyth, 2017; Cao, 2017).

  • Phân tích nhân quả dự đoán: Nếu bạn muốn một mô hình có thể dự đoán khả năng của một sự kiện cụ thể trong tương lai, bạn cần áp dụng phân tích nhân quả dự đoán.
  • Phân tích mô tả: Nếu bạn muốn một mô hình có khả năng đưa ra quyết định thông minh và khả năng sửa đổi mô hình đó với các tham số động, bạn chắc chắn cần phân tích mô tả cho nó.
  • Máy học để đưa ra dự đoán: Nếu bạn có dữ liệu giao dịch của một công ty tài chính và cần xây dựng mô hình để xác định xu hướng trong tương lai, thì thuật toán máy học là lựa chọn tốt nhất. Điều này thuộc mô hình học có giám sát. Nó được gọi là có giám sát vì bạn đã có dữ liệu mà dựa vào đó bạn có thể đào tạo máy của mình.

TÀI LIỆU THAM KHẢO

Blei, D. M., & Smyth, P. (2017). Science and data science. Proceedings of the National Academy of Sciences, 114(33), 8689-8692.

Cao, L. (2017). Data science: a comprehensive overview. ACM Computing Surveys (CSUR), 50(3), 1-42.

 

Thông tin Hỗ trợ luận văn

Tôi luôn mong muốn mang đến sự thành công cho tất cả mọi người. Phương châm sống "Càng hiểu biết, con người càng tự do"

Cũng Xem

Quy trình trainning-testing

Tách dữ liệu để trainning-testing Trước khi thực hiện hồi quy toàn bộ, Về cơ …