Trang chủ / Python / Hồi quy tuyến tính và máy học

Hồi quy tuyến tính và máy học

Hồi quy tuyến tính là một khái niệm quan trong trong thống kê. Đối với ngành khoa học dữ liệu, hồi quy tuyến tính là một thuật toán học có giám sát, trong đó đầu ra dự đoán là liên tục và có độ dốc không đổi (Acharya et al., 2019). Hồi quy tuyến tính được sử dụng để dự đoán các giá trị trong một phạm vi liên tục, ví dụ như giá cả, doanh số, thay vì cố gắng phân loại chúng thành các dianh mục hay nhóm, chẳng hạn cao, trung bình và thấp. Đối với hồi quy tuyến tính giống như một phương trình đường thẳng có dạng y = ax + b hoặc     y = ax + by +…+ z , trong đó a, b,..,z là các biến mà nhà nghiên cứu cố gắng “học” để với mỗi giá trị của x chúng ta có một giá trị dự đoán của y đúng nhất có thể (Forkuor et al., 2017).

Scikit-learn là một module Python mạnh mẽ cho việc học máy. Nó chứa hàm cho hồi quy, phân loại, phân cụm, lựa chọn mô hình (Alkan & Isik, 2019). Chúng ta sẽ khám phá module sklearn.linear_model có chứa “các phương thức để thực hiện hồi quy, trong đó giá trị mục tiêu sẽ là sự kết hợp tuyến tính của các biến đầu vào”. Trong scikit-learn cung cấp class sklearn.linear_model.LinearRegression, Class này dùng để biểu diễn công thức hồi quy tuyến tính sau đó dự đoán kết quả với data test (Cao, 2017). Để sử dụng scikit-learn, người sử dụng cần nạp các thư viện cần thiết .

TÀI LIỆU THAM KHẢO

Acharya, M. S., Armaan, A., & Antony, A. S. (2019). A comparison of regression models for prediction of graduate admissions. Paper presented at the 2019 International Conference on Computational Intelligence in Data Science (ICCIDS).

Alkan, C. B., & Isik, Z. (2019). Characterization of Cancer Types by Applying Machine Learning Methods on Blood RNA-Sequencing Data. Paper presented at the 2019 3rd International Symposium on Multidisciplinary Studies and Innovative Technologies (ISMSIT).

Cao, L. (2017). Data science: a comprehensive overview. ACM Computing Surveys (CSUR), 50(3), 1-42.

Forkuor, G., Hounkpatin, O. K., Welp, G., & Thiel, M. (2017). High Resolution Mapping of Soil Properties Using Remote Sensing Variables in South-Western Burkina Faso: A Comparison of Machine Learning and Multiple Linear Regression Models. PloS one, 12(1), e0170478. doi: https://10.1371/journal.pone.0170478

 

Thông tin Hỗ trợ luận văn

Tôi luôn mong muốn mang đến sự thành công cho tất cả mọi người. Phương châm sống "Càng hiểu biết, con người càng tự do"

Cũng Xem

Quy trình trainning-testing

Tách dữ liệu để trainning-testing Trước khi thực hiện hồi quy toàn bộ, Về cơ …