Kiểm tra tính phân phối chuẩn của phần dư

This entry is part 2 of 21 in the series Khuyết tật mô hình

Đây là giả định đơn giản nhất, và trong thực tế ta cũng chỉ cần nó đúng một cách tương đối mà thôi. Tuy vậy thực tế giáo viên mình thấy cũng có người dễ những cũng có người yêu cầu chặt chẽ. Vì vậy bài viết sẽ cung cấp khoảng 4 cách từ trực quan đến chính tắc- chặt chẽ để kiểm tra giả định này.

Một trong số các giả định của hồi quy cổ điển là các sai số có phân phối chuẩn. Trên thực tế các sai số ta không quan sát được nhưng ta lại quan sát được các phần dư khi ước lượng mô hình nên thực chất chúng ta sẽ đi xem xét tính phân phối chuẩn của phần dư thu được khi ước lượng.

Chúng ta sẽ bắt đầu từ đơn giản đến phức tạp nhé

Sử dụng đồ thị

Ta biết phân phối chuẩn là phân phối mà

+ Trung bình = mod = trung vị

+ Các giá trị phân phối xung quang giá trị trung bình tạo thành hình chuông

Vậy trực quan nhất ta sử dụng đồ thị của phần dư là được. Khi có đồ thị ta thử xem đó thị đó có 2 tính chất ta vừa nêu hay không để kết luận xem liệu phần dư có phân phối chuẩn hay không

Cách thực hiện với SPSS

Sử dụng bộ dữ liệu gồm 180 quan sát, bạn có thể tìm thấy tại đây: https://vaxidi.com/du-lieu-minh-hoa-cac-bai-viet-phan-khuyet-tat-mo-hinh

Tại phần hồi quy ngoài các thao tác cơ bản ta làm như sau

Tai menu Plots... , Mục Linear Standardized Residual Plot chọn Histogram.

Ta cũng có thể chọn vẽ thêm biểu đồ P-P plot bằng cách tích vào lựa chọn ngay dưới đó.

D:\a\18.PNG

Đọc kết quả

Nếu đồ thị Histogram có dạng hình chuông (xấp xỉ) thì ta coi như phần dư phân phối chuẩn (So với cái hình chuông vẽ sẵn trên biểu đồ.

Tất nhiên cái hình chuông méo mó kiểu kia thì bạn coi nó là phân phối chuẩn cũng được mà không thì cũng chả thể bắt bẻ được. Hình ảnh trực quan nhưng lại gây mập mờ chứ không thể dứt khoát và tường minh như các kiểm định tham số được.

Nhiều người thích dùng biểu đồ và nhân xét các phần dư chuẩn hoá kia xoay quang đường chéo, vậy phần dư có phân phối chuẩn. Đây là cách ngoạn mục nhất để vượt qua việc kiểm tra giả định này

Một số nhận xét sai hay gặp về giả định phần dư có phân phối chuẩn khi sử dụng biểu đồ Histogram

Ví dụ với đồ thị Histogram thu được từ ví dụ trước, rất nhiều bài viết nhận xét như sau:

Ta thấy phần dư có trung bình bằng ..... xấp xỉ bằng 0 và độ lệch chuẩn băng 0,989 xấp xỉ 1. Vậy phần dư có phân phối chuẩn

Có 3 điểm sai như sau:

+ Một là: Phần dư luôn có trung bình bằng 0. Cái số kia chỉ "gần bằng 0" là do sai số mà thôi

+ Hai là: Kia là phần dư được chuẩn hoá. Cái nào chuẩn hoá thì cũng có Mean=0 và Std.Dev=1 mà thôi

+ Ba là: Không có tính chất nào nói rằng phân phối chuẩn là phân phối có trung bình bằng 0 và độ lệch chuẩn bằng 1 cả. Chỉ có khái niệm sau: Phân phối chuẩn hoá là phân phối chuẩn có trung bình bằng 0 và độ lệch chuẩn bằng 1.

Đây là 1 biến có trung bình = 0 và đọc lệch chuẩn bằng 1 nhưng các bạn xem đó có phải là phân phối chuẩn không nhé!

Để chính xác ta chỉ cần mô tả đồ thị thu được đúng với đồ thị của phân phối chuẩn đó là

+ Các giá trị trung bình trung bị, mod xấp xỉ nhau ( coi như bằng nhau, và trong trường hợp này thì chúng bằng 0)

+ Mật độ các giá trị phân tán quanh giá trị trung bình tạo thành một biểu đồ có hình chuông.

Phần tiếp theo chúng ta sẽ tiến đến các kiểm định chính tắc khá nổi tiếng và chặt chẽ nhé.

 

còn nữa ...

Để xem tiếp các nội dung bên dưới bạn cần phải đăng nhập vào tài khoản đã được phân quyền đọc tương ứng.

Nếu chưa có tài khoản hãy nhấn  ĐĂNG KÝ hoặc ĐĂNG NHẬP nếu bạn đã có tài khoản.

Đăng ký | Quên mật khẩu?

Trang: 1 2 3 4 5