Mở đầu về hồi quy nhị phân- Binary Logistic

This entry is part 1 of 11 in the series Hồi quy nhị phân- Binary Logistic

Cập nhật: 16/09/2022 bởi admin0

Loạt bài viết về hồi quy nhị phân trên SPSS

Hồi quy nhị phân hay còn gọi là Binary Logistic là mô hình được dùng trong nghiên cứu dùng để ước lượng xác suất một sự kiện sẽ xảy ra.Trong mô hình này biến độc lập chỉ có 2 giá trị 1 và 0 tương ứng với việc CÓ và KHÔNG xảy ra sự việc.

Nếu biến phụ thuộc là biến nhiều hơn 2 giá trị các bạn có thể tìm kiếm các dạng mô hình khác như: Multinomial logistic hay phân tích biệt số

Ví dụ:

+ Mô hình các yếu tố ảnh hưởng đến việc có/ không tham gia một chương trình nào đó của sinh viên

+ Mô hình các yếu tố ảnh hưởng đến việc 1 khoản vay được xếp vào nhóm có/ không có rủi ro tài chính

Nếu coi biến phụ thuộc là 1 biến định lượng liên tục để chạy một hàm hồi quy tuyến tính thông thường thì có vẻ không phù hợp, vì nó sẽ gây ra việc vi phạm nghiêm trọng các giả định của hàm hồi quy cổ điển.

Nếu có ước lượng thì nó cũng có vẻ là 1 hàm không phù hợp (sai dạng hàm), như vậy nếu cố tình ước lượng cũng không để làm gì cả.

Nếu 0-1 chỉ đơn giản là một thang đo định danh (nếu thích người ta có thể ký hiệu là 4-7 chẳng hạn) thì hồi quy tuyến tính là một ước lượng hoàn toàn không phù hợp.

Như vậy câu hỏi đặt ra đó là làm sao để có một dạng hàm phù hợp để ước lượng được những mối quan hệ như thế này tốt hơn một hàm hồi quy tuyến tính.

Ý tưởng xây dựng một hàm hồi quy nhị phân

Xuất phát từ hàm hồi quy tuyến tính kinh điển

Y*=f(Xi)=β0 +β1*X1 +β2*X2 +…… (1)

với Y là một biến liên tục có tập xác định là R (hoặc một khoảng liên tục trên R)

Hiện tại ta đang có Y không phải một biến liên tục như Y* mà là một biến rời rạc và chỉ nhận 2 giá trị là 0 và 1. Như vậy nếu tìm được một hàm g(Y) mà khi Y chỉ nhận giá trị 0 và 1 thì g(Y) liên tục trên một khoảng nào đó (Thậm chí là trên toàn trục số thực R) thì bài toán sẽ được giải quyết “êm”.

Trước hết ta hiểu rằng Y=0 hay Y=1 thì 0 và 1 là giá trị quan sát được, Y là một rời rạc.

Nhưng với

E(Y|Xi)=p(Y=1|Xi) (2)

thì p(Y=1|Xi) là một biến liên tục nàm trong đoạn [0;1], vậy là một nữa bài toán đã được giải quyết.

(2) đọc là: kỳ vọng của Y với điều kiện các biến độc lập Xi chính bằng xác xuất Y nhận giá trị bằng 1 với điều kiện các biến độc lập Xi.

Đặt p(Y=1|Xi) =p

Quay lại với hàm (1), nếu như các Xi (tức là X1, X2,…. ) không bị chặn bởi điều kiện nào thì vế phải có tập xác định là R. Vậy nếu tìm được một hàm h(p) mà với 0<p<1 thì h có tập xác định là R thì bài toán được giải quyết hoàn toàn.

Trong bài tiếp theo chúng ta sẽ xem cách giải quyết phần 2 bài toán này.

Series NavigationMột số giả định trong mô hình hồi quy nhị phân >>

Trang: 1 2 3 4 5