- Mở đầu về hồi quy nhị phân- Binary Logistic
- Một số giả định trong mô hình hồi quy nhị phân
- Chạy mô hình Logit trên SPSS: Trường hợp biến độc lập là biến liên tục
- Phân tích output mẫu
- Một số thủ tục hồi quy nhị phân Binary Logistic nâng cao
- Tìm kiếm các quan sát dị biệt làm giảm chất lượng mô hình bằng đồ thị
- Hiệu chỉnh mô hình với phương pháp đưa dần biến vào từng bước (Forward Stepwise)
- Vấn đề đa cộng tuyến trong mô hình hồi quy logistic
- Biến điều tiết trong hồi quy nhị phân
- Một số bài dùng mô hình logistic hay gặp
- Hiện tượng các hệ số trong mô hình không có ý nghĩa thống kê dù R bình phương hay khả năng dự đoán đều rất tốt
Bài viết mình hoạ các thao tác và phân tích cơ bản mô hình hồi quy nhị phân trên SPSS
Sử dụng bộ dữ liệu về chỉ số hạnh phúc năm 2019, tên là happy 2019-ex1.sav, đường dẫn tải về các bạn xem ở đây: https://vaxidi.com/bo-du-lieu-ve-chi-so-hanh-phuc-nam-2019
Một số biến số trong tệp data
Xep_hang: Xếp hạng quốc gia, số càng nhỏ càng hạnh phúc
Quoc_gia: Tên quốc gia, vùng lãnh thổ
Diem_so: Điểm dùng để xếp hạng
GDP_bq: Điểm số về GDP bình quân
Ho_Tro_XH: Điểm số về hỗ trợ xã hội
T_tho: Điểm số về tuổi thọ khỏe mạnh
Tu_do: Điểm số về quyền tự do lựa chọn cuộc sống
Hao_phong: Điểm số về sự hào phóng
Tham_nhung: Điểm số về nhận thức về tham nhũng
Hanh_phuc: 1= hạnh phúc, là các quốc gia có điểm trên 5 (98 nước đầu tiên). 0= không hạnh phúc (59 nước còn lại)
Nội dung chính (Nếu bạn chưa đăng nhập, nhiều nội dung có thể đã bị ẩn đi)
Thủ tục chạy cơ bản
Bước 1: Analyze -> Regression -> Binary Logistic…
Bước 2: Đưa biến
Đưa biến độc lập và ô Dependent
Đưa các biến phụ thuộc vào ô Covariantes
Phương pháp đưa biến để mặc định là Enter
Bước 3: Tại mục Save bạn có thể chọn 1 số lựa chon
(Không bắt buộc- mà tùy mục đích ở sau)
+ Chọn Probabilities nếu muốn lưu lại các xác xuất dự đoán theo model
+ Chọn Group membership nếu muốn lưu lại các nhóm dự đoán theo model
+ Chọn 1 khoảng cách (từ điểm dự đoán đế điểm thực) tại mục Infuluence, Nếu chọn người ta hay chọn Cook’s
+ Tại mục Residuals (phần dư) có thể chọn các phần dư muốn lưu, người ta hay chọn Studentized
Bước 4: Tại mục Opptions…
Chọn kiểm định Hosmer-Lemeshow , (sau đây sẽ gọi là kiểm định H-L hoặc HL) để đánh giá độ phù hợp của mô hình
Cuối cùng nhấn OK để được kết quả ở output.
Cách đọc output sẽ có ở bài viết tiếp theo
Đọc kết quả mô hình Logit từ output
Tại output của SPSS có một số thông tin cơ bản như sau
Tại Beginning Block
Đây là lúc phần mềm bắt đầu ước lượng, từ việc chưa đưa biến độc lập nào vào, sau đó thử nghiệm mô hình với từng biến độc lập
còn nữa ...