Biến giả và hồi quy với biến giả

This entry is part 2 of 20 in the series Hồi quy- Một số vấn đề mở rộng

Nội dung chính (Nếu bạn chưa đăng nhập, nhiều nội dung có thể đã bị ẩn đi)

Định nghĩa biến giả

Trong phân tích hồi quy , biến giả là biến chỉ nhận giá trị 0 hoặc 1 để biểu thị sự vắng mặt hoặc hiện diện của một số tác động phân loại có thể thay đổi kết quả. Chúng có thể được coi là ký tự số cho các dữ kiện định tính trong mô hình hồi quy , sắp xếp dữ liệu thành các danh mục loại trừ lẫn nhau như giới tính : nam- nữ, miền: bắc- trung-nam

Một biến độc lập giả (còn gọi là biến giải thích giả) mà đối với một số quan sát có giá trị bằng 0 sẽ làm cho hệ số của biến đó không có vai trò ảnh hưởng đến biến phụ thuộc , trong khi khi biến giả nhận giá trị 1 thì hệ số của nó sẽ thay đổi sự đánh chặn . Ví dụ, giả sử thành viên trong nhóm là một trong những biến định tính liên quan đến một hồi quy. Nếu thành viên nhóm được gán giá trị 1 một cách tùy ý, thì tất cả những người khác sẽ nhận giá trị 0. Khi đó, phần chặn sẽ là số hạng không đổi đối với những người không phải là thành viên nhưng sẽ là số hạng không đổi cộng với hệ số của thành viên giả trong trường hợp nhóm các thành viên.

Căn cứ quyết định số biến giả

Với mỗi biến phân loại gồm n thuộc tính loại trừ nhau (1 quan sát chỉ có thể mang 1 thuộc tính) ta cần sử dụng n-1 biến giả để thể hiện tất cả các thuộc tính đó. Giả sử các biến giả là D1, D2,….Dn-1

Khi đó

+ Các quan sát có thuộc tính số 1 có D1=1, các D còn lại =0

+ Các quan sát có thuộc tính số 2 có D2=1, các D còn lại =0

+….

+ Các quan sát có thuộc tính số k có Dk=1, các D còn lại =0

+ Đặc biệt: Các quan sát có thuộc tính cuối cùng thì sẽ không thể có (n-1) các thuộc tính đầu tiên. Vì vậy tất cả các D bằng 0

Đọc kết quả hồi quy có biến giả

Ví dụ 1

Trở lại với bộ dữ liệu player2019. Xét mô hình hồi quy sau

Biến phụ thuộc: Lương (ngàn đô/ tuần)

Biến độc lập gồm

+ khả năng qua người/ crossing (điểm)

+ khả năng dứt điểm /finishing (điểm)

+ chân thuận : =0 nếu cầu thủ thuận chân trái và =1 nếu cầu thủ thuận chân phải

Cách thực hiện hồi quy với biến giả như với các biến liên tục

Giả sử ta thu được kết quả như sau

Với các biến liên tục , ta đã biết cách đọc kết quả, sẽ không nhắc lại. Các bạn có thể xem ở đây: https://vaxidi.com/cac-phan-tich-mo-hinh-hoi-quy-co-ban/4#He_so_hoi_quy_va_kiem_dinh_y_nghia_cua_he_so_hoi_quy-_Bang_Coefficients

Bây giờ ta sẽ phân tích ý nghĩa của biến chanthuan. Hệ số của biến này là 1.255, có nghĩa là

Nếu 2 cầu thù có cùng các kỹ thuật khác như nhau (2 kỹ thuật xét cùng), 1 cầu thủ thuận chân phải sẽ có lương cao hơn 1 cầu thủ thuận chân trái trung bình là 1.255 đô la/ 01 tuần.

Như vậy việc nhận xét hệ số hồi quy của biến giả không phải là nhận xét việc nó tăng giảm mà là so sánh nó với “thuộc tính gốc”. Thuộc tính gốc là thuộc tính không có biến giả đại diện.

Ví dụ 2

Tiếp tục với ví dụ ở bài viết này https://vaxidi.com/kiem-dinh-chow

Bây giờ ta đưa thêm biến giới tính vào trong mô hình này và thu được kết quả như sau

Như vậy ta cho 1 mô hình hồi quy tốt tương đương với việc hồi quy cho từng nhóm, và tất nhiên là tốt hơn hẳn mô hình chỉ có 2 biến là x2 và x3.

Ta có thể phân tích như sau: Trong cùng điều kiện của các biến số khác thì nam giới sẽ có y cao hơn trung bình 10.104 đơn vị

 

còn nữa ...

Để xem tiếp các nội dung bên dưới bạn cần phải đăng nhập vào tài khoản đã được phân quyền đọc tương ứng.

Nếu chưa có tài khoản hãy nhấn  ĐĂNG KÝ hoặc ĐĂNG NHẬP nếu bạn đã có tài khoản.

Đăng ký | Quên mật khẩu?

Trang: 1 2