Cập nhật: 20/02/2023 bởi admin0
Bài viết này để chi ra cho những bạn làm nghiên cứu với cỡ mẫu lớn, vừa thích R bình phương cao nhưng lại thích sig của các hệ số hồi quy không quá nhỏ (không được làm tròn thành 0.000 tức là > 0.001). QUÁ VÔ L Ý
Xem lại bảng thống kê sig và t tương ứng ở 1 số cỡ mẫu bên dưới có thể có 1 nhận xét rằnh với cùng giá trị t, cỡ mẫu càng lớn thì sig sẽ càng nhỏ, đồng thời T CÀNG LỚN THÌ SIG CÀNG NHỎ
Thật vậy, lấy ví dụ với hàm hôi quy đơn biến, hệ so hoi quy chính là hệ số tương quan. Xem lại bài viết này https://vaxidi.com/gia-tri-sig-trong-bang-he-so-tuong-quan-pearson và ta nhận thấy nếu r được giữ nguyên, khi n thay đổi, ví dụ tăng lên 4-9-16-…… lần thì t sẽ tăng lên xấp xỉ 2-3-4 lần (xâp xỉ căm bậc hai số lẫn cỡ mẫu tăng)
Ví dụ 1 hàm hồi quy vớ cỡ mẫu =5 cho kết quả như sau
Giờ ta nhận bản nó lên gấp 9 lần (copy-paste thêm 8 lần nữa) kết quả như sau
R bình phương và các hệ sô hôi quy vẫn thế, nhưng khi này thống kê t đã phì to ra và sig nhỏ lại ở mức < 0.001 (hiển thị là 0.000)
Các kết quả trên cho các bạn những gợi ý thú vị như sau
- Nếu muốn R2 cao mà sig cũng cao thì sửa dữ liệu không có tác dụng đâu. Cách khả thì là cắt giảm mẫu đi còn ít quan sát hơn
- Nếu thấy các biến trong hồi quy không (chưa) có ý nghĩa thống kê mà không biết sửa data thế nào bạn có thể mạnh dạn nhân bản mẫu (bằng cách copy paste) tới khi mẫu đủ lớn thì sig sẽ đủ nhỏ thôi.