- Dữ liệu minh hoạ
- Biến giả và hồi quy với biến giả
- Biến điều tiết và xử lý biến điều tiết trong mô hình hồi quy tuyến tính
- Biến điều tiết- Phần 2: Trường hợp biến điều tiết là biến phân loại
- Biến điều tiết- Phần 3: Trường hợp biến điều tiết là biến liên tục-kỹ thuật 1+2
- Biến điều tiết- Phần 4: (Kỹ thuật 3) Áp dụng kỹ thuật mean center biến trước khi nhân
- Biến điều tiết- Phần 5: (Kỹ thuật 4) Trực giao quan hệ điều tiết
- Biến điều tiết- Phần 6: Sống chung với đa cộng tuyến
- Phân tích biến điều tiết trên SPSS bằng PROCESS macro By Andrew F. Hayes
- Đọc thêm: Phân tích đa nhóm với mô hình hồi quy tuyến tính trên SPSS
- Biến trung gian
- Kiểm định Sobel
- Phân tích biến trung gian trên SPSS bằng PROCESS macro By Andrew F. Hayes
- Xem xét vai trò biến trung gian với plug-in Indirect Effect trên Amos
- Có đưa biến nhân khẩu vào mô hình hồi quy hay không?
- Kiểm tra hệ số hồi quy có bằng một số cho trước hay không
- Kiểm định sự bằng nhau của hai hệ số hồi quy
- Đọc thêm: PROCESS macro- Công cụ xử lý biến trung gian, biến điều tiết
- Các dạng mô hình được hỗ trợ trong PROCESS macro By Andrew F. Hayes
- So sánh hồi quy và 1 số phân tích trên SPSS- AMOS- Smart PLS
Nội dung chính (Nếu bạn chưa đăng nhập, nhiều nội dung có thể đã bị ẩn đi)
Định nghĩa biến giả
Trong phân tích hồi quy , biến giả là biến chỉ nhận giá trị 0 hoặc 1 để biểu thị sự vắng mặt hoặc hiện diện của một số tác động phân loại có thể thay đổi kết quả. Chúng có thể được coi là ký tự số cho các dữ kiện định tính trong mô hình hồi quy , sắp xếp dữ liệu thành các danh mục loại trừ lẫn nhau như giới tính : nam- nữ, miền: bắc- trung-nam
Một biến độc lập giả (còn gọi là biến giải thích giả) mà đối với một số quan sát có giá trị bằng 0 sẽ làm cho hệ số của biến đó không có vai trò ảnh hưởng đến biến phụ thuộc , trong khi khi biến giả nhận giá trị 1 thì hệ số của nó sẽ thay đổi sự đánh chặn . Ví dụ, giả sử thành viên trong nhóm là một trong những biến định tính liên quan đến một hồi quy. Nếu thành viên nhóm được gán giá trị 1 một cách tùy ý, thì tất cả những người khác sẽ nhận giá trị 0. Khi đó, phần chặn sẽ là số hạng không đổi đối với những người không phải là thành viên nhưng sẽ là số hạng không đổi cộng với hệ số của thành viên giả trong trường hợp nhóm các thành viên.
Căn cứ quyết định số biến giả
Với mỗi biến phân loại gồm n thuộc tính loại trừ nhau (1 quan sát chỉ có thể mang 1 thuộc tính) ta cần sử dụng n-1 biến giả để thể hiện tất cả các thuộc tính đó. Giả sử các biến giả là D1, D2,….Dn-1
Khi đó
+ Các quan sát có thuộc tính số 1 có D1=1, các D còn lại =0
+ Các quan sát có thuộc tính số 2 có D2=1, các D còn lại =0
+….
+ Các quan sát có thuộc tính số k có Dk=1, các D còn lại =0
+ Đặc biệt: Các quan sát có thuộc tính cuối cùng thì sẽ không thể có (n-1) các thuộc tính đầu tiên. Vì vậy tất cả các D bằng 0
Đọc kết quả hồi quy có biến giả
Ví dụ 1
Trở lại với bộ dữ liệu player2019. Xét mô hình hồi quy sau
Biến phụ thuộc: Lương (ngàn đô/ tuần)
Biến độc lập gồm
+ khả năng qua người/ crossing (điểm)
+ khả năng dứt điểm /finishing (điểm)
+ chân thuận : =0 nếu cầu thủ thuận chân trái và =1 nếu cầu thủ thuận chân phải
Cách thực hiện hồi quy với biến giả như với các biến liên tục
Giả sử ta thu được kết quả như sau
Với các biến liên tục , ta đã biết cách đọc kết quả, sẽ không nhắc lại. Các bạn có thể xem ở đây: https://vaxidi.com/cac-phan-tich-mo-hinh-hoi-quy-co-ban/4#He_so_hoi_quy_va_kiem_dinh_y_nghia_cua_he_so_hoi_quy-_Bang_Coefficients
Bây giờ ta sẽ phân tích ý nghĩa của biến chanthuan. Hệ số của biến này là 1.255, có nghĩa là
Nếu 2 cầu thù có cùng các kỹ thuật khác như nhau (2 kỹ thuật xét cùng), 1 cầu thủ thuận chân phải sẽ có lương cao hơn 1 cầu thủ thuận chân trái trung bình là 1.255 đô la/ 01 tuần.
Như vậy việc nhận xét hệ số hồi quy của biến giả không phải là nhận xét việc nó tăng giảm mà là so sánh nó với “thuộc tính gốc”. Thuộc tính gốc là thuộc tính không có biến giả đại diện.
Ví dụ 2
Tiếp tục với ví dụ ở bài viết này https://vaxidi.com/kiem-dinh-chow
Bây giờ ta đưa thêm biến giới tính vào trong mô hình này và thu được kết quả như sau
Như vậy ta cho 1 mô hình hồi quy tốt tương đương với việc hồi quy cho từng nhóm, và tất nhiên là tốt hơn hẳn mô hình chỉ có 2 biến là x2 và x3.
Ta có thể phân tích như sau: Trong cùng điều kiện của các biến số khác thì nam giới sẽ có y cao hơn trung bình 10.104 đơn vị
còn nữa ...