Kiểm định tính độc lập của 2 biến định danh (Kiểm định Chi-square)

This entry is part 9 of 10 in the series Kiểm định phi tham số

Mở đầu

Bài viết này đề cập đến kiểm định Chi-square để kiểm tra xem 2 biến định danh (phân loại) có độc lập với nhau hay không. Bạn có thể thực hiện phếp thử này với 2 biến bất kỳ như thứ tự hay liên tục (trên spss chẳng hạn nhưng thuật toán cũng sẽ hiểu dây chỉ là các biến định danh mà thôi. Thông thường nhất, phép thử này được gọi là phép thử độc lập chi bình phương , nhưng nó còn được gọi là phép thử chi bình phương cho sự liên kết

Ý tưởng

Kiểm định chi bình phương về tính độc lập bằng cách so sánh tần số quan sát được trong các ô với tần số bạn mong đợi nếu không có mối liên hệ giữa hai biến danh nghĩa. Vì các tần số mong đợi được dự đoán trên không có mối liên hệ nào, mối liên hệ giữa hai biến danh nghĩa càng lớn, bạn càng mong đợi các tần số quan sát khác với tần số dự kiến. Hai biến danh nghĩa càng ít liên kết với nhau, thì tần số quan sát được sẽ càng gần với tần số mong đợi.

Kiểm định cặp giả thuyết sau

Tính thống kê chi-square

Trong đó O là giá trị quan sát và E là giá trị kỳ vọng trong mỗi ô

Với r là số danh mục của biến ở hàng, c là số danh mục của biến ở cột, tích (r-1)*(c-1) gọi là số bậc tự do của kiểm định khi bình phương.

Khi thực hiện trên SPSS ta có thể nhìn vào giá trị sig. Nếu sig <α ta bác bỏ H0

Các giả định

Giả định 1

Có 2 biến danh nghĩa, mỗi biến có phải có ít nhất 2 danh mục

Giả định 2

Các quan sát là độc lập với nhau

Giả định 3

Mẫu được phân tích phải được lấy ngẫu nghiên

Giả định 4

Kỳ vọng của tất cả các ô không được dưới 5. Một tiêu chuẩn lỏng hơn đó là không được có quá 20% số giá trị kỳ vọng dưới 5.

Các giả định 1-2-3 liên quan đến việc thiết kễ nghiên cứu và hu thập dữ liệu. Giá định 4 sẽ được bàn đến trong bài

Thực hành với SPSS

Sử dụng bộ dữ liệu khảo sat 200 học sinh về khối thì chính dự kiến sẽ thi (A-B-C-D) và giới tính.

Ta đi kiểm tra xem có mối liên hệ nào giữa giới tính và khối thi hay không

Thao tác kiểm định Chi-square

Đưa các biến cần kiểm tra cào hàng và cột

Tại mục Statistics click vào Chi-square

Trên đây là thao tác cơ bản nhất. Tất nhiên nếu bạn muốn có các phân tích sâu hơn có thể click luôn các lựa chọn khác sẽ được đề cập ở phần tiếp theo.

Nhấn Continuce >OK để ra kết quả

Đọc kết quả

+ (1) phần mềm báo cáo không có ô nào có giá trị dự đoán dưới 5. Vậy giả định số 4 thoả mãn, kết quả kiểm định khi bình phương là phù hợp

+ (2) Giá trị chi-square quan sat =78.128, 3 bậc tự do. Sig <0.05 nên ta bác bỏ H0, vậy ta kết luận giữa giới tính và khối thi không độc lập (có liên quan đến nhau). Ở đây 3 bậc tự do thì 3= (2-1)*(4-1)

Như vậy kết luận chính trong bài kiểm tra tính độc lập đã xong. Tuy nhiên để có thể tưởng tượng thêm về cái “mối quan hệ” ấy ta có thể phân tích sâu hơn chút,với những bảng đơn giản (không phải lúc nào cũng có thể làm được và mô ta được rõ ràng nhé.

Tất nhiên nếu kiểm định kết luận rằng không có mối quan hệ thì ta không cần thiết phân tích sâu hơn nữa nhé.

Đánh giá độ mạnh yếu của mối quan hệ (liên kết)

Quay trở lại phần thao tác, ta sẽ tính toán trí số Cramer's V.

Cramer's V là thước đo sức mạnh liên kết của một danh nghĩa theo mối quan hệ danh nghĩa (và là thước đo kích thước hiệu ứng ). Cramer's V có giá trị từ 0 đến 1 với giá trị 0 cho biết không có liên kết nào với giá trị 1 cho biết liên kết hoàn chỉnh. Cohen (1988) đề xuất rằng Cramer's V<0.1 thì liên kết lỏng lẻo; 0.1< Cramer's V<0.3 thì liên kêt vừa phải và Cramer's V>0.3 thì liên kết là chặt chẽ

Kêt quả như sau

Giá trị Cramer's V=0.625 >0.3 cho thấy 2 biến có mức độ liên kết chặt chẽ.

 

còn nữa ...

Để xem tiếp các nội dung bên dưới bạn cần phải đăng nhập vào tài khoản đã được phân quyền đọc tương ứng.

Nếu chưa có tài khoản hãy nhấn  ĐĂNG KÝ hoặc ĐĂNG NHẬP nếu bạn đã có tài khoản.

Đăng ký | Quên mật khẩu?

Trang: 1 2 3 4 5 6