- Kiểm định Mann-Whitney U (Wilcoxon-Mann-Whitney)
- Kiểm định dấu-hạng Wilcoxon (signed-rank test)
- Kiểm định dấu Sign test
- Kiểm định Kruskal-Wallis
- Kiểm định Friedman và Kendall’s W
- Kiểm định nhị thức Binomial Test
- Kiểm định Khi-bình phương (Chi-square)
- Kiểm định tỷ lệ một mẫu (Chi-square)
- Kiểm định tính độc lập của 2 biến định danh (Kiểm định Chi-square)
- Bài kiểm tra chính xác của Fisher về tính độc lập của 2 biến định danh (Exact Test)
Nội dung chính (Nếu bạn chưa đăng nhập, nhiều nội dung có thể đã bị ẩn đi)
Mở đầu
Bài viết này đề cập đến kiểm định Chi-square để kiểm tra xem 2 biến định danh (phân loại) có độc lập với nhau hay không. Bạn có thể thực hiện phếp thử này với 2 biến bất kỳ như thứ tự hay liên tục (trên spss chẳng hạn nhưng thuật toán cũng sẽ hiểu dây chỉ là các biến định danh mà thôi. Thông thường nhất, phép thử này được gọi là phép thử độc lập chi bình phương , nhưng nó còn được gọi là phép thử chi bình phương cho sự liên kết
Ý tưởng
Kiểm định chi bình phương về tính độc lập bằng cách so sánh tần số quan sát được trong các ô với tần số bạn mong đợi nếu không có mối liên hệ giữa hai biến danh nghĩa. Vì các tần số mong đợi được dự đoán trên không có mối liên hệ nào, mối liên hệ giữa hai biến danh nghĩa càng lớn, bạn càng mong đợi các tần số quan sát khác với tần số dự kiến. Hai biến danh nghĩa càng ít liên kết với nhau, thì tần số quan sát được sẽ càng gần với tần số mong đợi.
Kiểm định cặp giả thuyết sau
Tính thống kê chi-square
Trong đó O là giá trị quan sát và E là giá trị kỳ vọng trong mỗi ô
Với r là số danh mục của biến ở hàng, c là số danh mục của biến ở cột, tích (r-1)*(c-1) gọi là số bậc tự do của kiểm định khi bình phương.
Khi thực hiện trên SPSS ta có thể nhìn vào giá trị sig. Nếu sig <α ta bác bỏ H0
Các giả định
Giả định 1
Có 2 biến danh nghĩa, mỗi biến có phải có ít nhất 2 danh mục
Giả định 2
Các quan sát là độc lập với nhau
Giả định 3
Mẫu được phân tích phải được lấy ngẫu nghiên
Giả định 4
Kỳ vọng của tất cả các ô không được dưới 5. Một tiêu chuẩn lỏng hơn đó là không được có quá 20% số giá trị kỳ vọng dưới 5.
Các giả định 1-2-3 liên quan đến việc thiết kễ nghiên cứu và hu thập dữ liệu. Giá định 4 sẽ được bàn đến trong bài
Thực hành với SPSS
Sử dụng bộ dữ liệu khảo sat 200 học sinh về khối thì chính dự kiến sẽ thi (A-B-C-D) và giới tính.
Ta đi kiểm tra xem có mối liên hệ nào giữa giới tính và khối thi hay không
Thao tác kiểm định Chi-square
Đưa các biến cần kiểm tra cào hàng và cột
Tại mục Statistics click vào Chi-square
Trên đây là thao tác cơ bản nhất. Tất nhiên nếu bạn muốn có các phân tích sâu hơn có thể click luôn các lựa chọn khác sẽ được đề cập ở phần tiếp theo.
Nhấn Continuce >OK để ra kết quả
Đọc kết quả
+ (1) phần mềm báo cáo không có ô nào có giá trị dự đoán dưới 5. Vậy giả định số 4 thoả mãn, kết quả kiểm định khi bình phương là phù hợp
+ (2) Giá trị chi-square quan sat =78.128, 3 bậc tự do. Sig <0.05 nên ta bác bỏ H0, vậy ta kết luận giữa giới tính và khối thi không độc lập (có liên quan đến nhau). Ở đây 3 bậc tự do thì 3= (2-1)*(4-1)
Như vậy kết luận chính trong bài kiểm tra tính độc lập đã xong. Tuy nhiên để có thể tưởng tượng thêm về cái “mối quan hệ” ấy ta có thể phân tích sâu hơn chút,với những bảng đơn giản (không phải lúc nào cũng có thể làm được và mô ta được rõ ràng nhé.
Tất nhiên nếu kiểm định kết luận rằng không có mối quan hệ thì ta không cần thiết phân tích sâu hơn nữa nhé.
Đánh giá độ mạnh yếu của mối quan hệ (liên kết)
Quay trở lại phần thao tác, ta sẽ tính toán trí số Cramer's V.
Cramer's V là thước đo sức mạnh liên kết của một danh nghĩa theo mối quan hệ danh nghĩa (và là thước đo kích thước hiệu ứng ). Cramer's V có giá trị từ 0 đến 1 với giá trị 0 cho biết không có liên kết nào với giá trị 1 cho biết liên kết hoàn chỉnh. Cohen (1988) đề xuất rằng Cramer's V<0.1 thì liên kết lỏng lẻo; 0.1< Cramer's V<0.3 thì liên kêt vừa phải và Cramer's V>0.3 thì liên kết là chặt chẽ
Kêt quả như sau
Giá trị Cramer's V=0.625 >0.3 cho thấy 2 biến có mức độ liên kết chặt chẽ.
còn nữa ...