Biến điều tiết- Phần 3: Trường hợp biến điều tiết là biến liên tục-kỹ thuật 1+2

This entry is part 5 of 20 in the series Hồi quy- Một số vấn đề mở rộng

Cập nhật: 08/03/2023 bởi admin0

Trường hợp biến điều tiết là biến liên tục

Đây là vấn đề sẽ được nói đến nhiều hơn trong bài viết này. Trước tiên nếu Google hay tìm trong các tài liệu bạn sẽ bắt gặp được 1 số phương pháp khác nhau. Và tất nhiên khi dùng các phương pháp khác nhau thì cũng có thể dẫn đến kết quả khác nhau và cách giải thích khác nhau.

Ở đây không có phương pháp nào đúng hay sai. Mà bằng kinh nghiệm cá nhân cũng như nhân thức mình xin đề cập 4 phương pháp có thể dùng, ưu điểm- nhược điểm và lời khuyên cho các bạn rằng khi nào nên dùng phương pháp nào

Phương pháp 1: Đưa biến liên tục về biến phân loại

Như vậy ta đã đưa bài toán về 1 bài toán đã biết cách giải quyết rồi

+ Để chia làm 2 nhóm các bạn có thể căn cứ và mean (trung bình) hoặc medium (trung vị) để chia về 2 nhóm thấp- cao

+ Các bạn có thể chia làm nhiều nhóm. Cố gắng sao cho số quan sat trong mỗi nhóm là tương đương nhau càng tốt. Đặc biệt sao cho dễ dàng giải thích kết quả nhất. Khi chia theo nguyên tắc nào các bạn giải thích trong bài như vậy

+ Ưu điểm: Chắc chắn rồi, đây là cách đơn giản nhất, dễ giải thích kết quả nhất

+ Nhược điểm: Đó là sự suy biến thông tin. Giống như việc quy đổi thang điêm 10 về thang điểm 4 trong việc học tín chỉ đó chẳng hạn. Dưới đay mình chụp lại 1 ảnh trên website của đại học Vinh. Rõ ràng điểm 8.4 và 9.9 chênh nhau 1.4 trên thang điểm 10 thì khi quy về thang 4 này đã mất đi sự chệnh lệch. Mặt khác điểm 8.4 và 8.5 dù chỉ chênh 0.1 ở thang 10 nhưng về điểm 4 thì chênh nhau hẳn 1 mức, và quy ra điểm 4 để tính tổng kết sau này sẽ chênh nhau hẳn 1 điểm.

Phương pháp 2: Tính biến tích bằng cách nhân luôn biến độc lập với biến điều tiết

Cách này về thủ tục là đơn giản nhất nhưng có thể sẽ gây khó giải thích sau này.

Tiếp tục với bộ data trong bài. Bây giờ ta giả đinh biến m điều tiết quan hệ x2 ->Y. Ta xem xét kết quả hồi quy sau

Rõ ràng ta thu được 1 hàm hồi quy tốt hơn rất nhiều. Hệ số hôi quy của biến x2 bây giờ là (0.07 +0.007*m), tức là m gây lên 1 quan hệ điều tiết tích cực, nghĩa là khi m càng tăng thì tác động của x2 lên Y càng mạnh mẽ. Hệ số hồi quy bây giờ là một hàm bậc nhât tăng theo m

Ưu điểm là dễ làm nhưng nhược điểm các bạn có thể dễ thấy là x2*m là 1 biến có quan hệ chặt chẽ với x2, nghĩa là một lúc nào đó sẽ có hiện tượng đa cộng tuyến, gây khó khắn trong việc giải thích hiệu ứng.

Ta sẽ giải quyết vấn đề này trong phần tiếp theo trong bài viêt: https://vaxidi.com/bien-dieu-tiet-lien-tuc-2

 

Series Navigation<< Biến điều tiết- Phần 2: Trường hợp biến điều tiết là biến phân loạiBiến điều tiết- Phần 4: (Kỹ thuật 3) Áp dụng kỹ thuật mean center biến trước khi nhân >>