Phân tích biệt số: Trường hợp biến phụ thuộc chỉ có 2 giá trị

This entry is part 4 of 7 in the series Phân tích biệt số- Discriminant

Các thao tác đã đươc đề cập trong bài viết Thủ tục phân tích biệt số trên SPSS  sẽ không nhắc lại tại đây, các bạn có thể xem lại. Bài viết này tập trung hướng dẫn các bạn đọc kết quả từ phần mềm

Bảng thống kê mô tả

Bảng này cho ta cái nhìn tổng quát về các biến độc lập của từng nhóm

Kiểm tra một số giả định

Bảng Tests of Equality of Group Means

Bảng này giống như phân tích ANOVA (t/ test trong trường hợp biến phụ thuộc chỉ có 2 nhóm) cho từng biến độc lập.

Ở đây 4 biến đâu tiên có sự khác nhau rõ ràng giữa các nhóm (sig <0.05) nên có thể dự đoán đây sẽ là các biến có ý nghĩa nhiều nhất đến thủ tục phân cụm này. Ngược lại 2 biến cuối không tạo ra sự khác biệt rõ ràng (sig >0.05) nên sẽ là các biến ít đóng góp.

Wilks 'lambda là một thước đo khác về tiềm năng của một biến. Các giá trị nhỏ hơn cho thấy biến có khả năng phân biệt tốt hơn giữa các nhóm. Thước đo này khá tương đồng với thống kê F. Lát nữa chúng ta sẽ đề cập đến kiểm định liên quan đến trị số này.

Box's M kiểm tra giả thiết về sự bằng nhau của các hiệp phương sai giữa các nhóm

Kết quả này cho thấy ta cần bác bỏ H0, tức là hiệp phương sai giữa các nhóm không bằng nhau. Thường thì nó khó mà thoả mãn nên mình sẽ không kiểm tra nó; hoặc thử nghiệm 1 phép phân tích biệt số khác sẽ được đề cập sau

Đánh giá sự phù hợp của mô hình- Summary of Canonical Discriminant Functions

Bảng Eigenvalues

Bảng eigenvalues ​​cung cấp thông tin về hiệu quả tương đối của từng hàm phân biệt. Trong trường hợp biến phụ thuộc chỉ có 2 nhóm nói riêng (và chỉ có 1 hàm phân biệt nói chung) thì tất nhiên 1 hàm sẽ giải thích 100% sự phân biệt luôn, nên trường hợp này sẽ không giải thích nhiều ở đây.

Khi có hai nhóm, mối tương quan chính tắc (canonical correlation) là thước đo hữu ích nhất trong bảng, và nó tương đương với mối tương quan của Pearson giữa điểm số phân biệt và các nhóm. Nếu bạn mang hồi quy tuyến tính biến phụ thuộc với các biên độc lập bạn sẽ thu được R=0.797 và bình phương = 0.797^2=0.635

Hệ số Lambda và kiểm định của Wilks

Wilks 'lambda là thước đo mức độ hiệu quả của mỗi hàm phân tách các trường hợp thành các nhóm. Nó bằng tỷ lệ của tổng phương sai trong điểm số phân biệt không được giải thích bởi sự khác biệt giữa các nhóm. Các giá trị nhỏ hơn của Wilks 'lambda cho thấy khả năng phân biệt lớn hơn của hàm.

Thống kê chi bình phương sẽ dễ giải thích hơn, nó liên quan kiểm tra giả thuyết rằng giá trị trung bình của các hàm được liệt kê là bằng nhau giữa các nhóm.

Cặp giả thuyết

Nếu chấp nhận H0 thì nghĩa là hàm phân biệt chẳng co tác dụng gì cả. Trong trường hợp này thì sig <0.05 nên việc phân tích phân biệt ở đây là có ý nghĩa. Như vậy ta sẽ đi đến các phân tích tiếp theo.

Đánh giá sự đóng góp của các biến vào mô hình

Ma trận cấu trúc- Structure Matrix và đánh giá tầm quan trọng của các biến số

Nhìn vào ma trận này ta có thể thấy được biến số nào có tác động mạnh mẽ trong hàm phân biệt. Trong ma trận này thứ tự của các biến đã được săp xếp giảm dần.

Như vậy ta thấy Tuổi thọ, GDP và hỗ trọ xã hội là các biến quan trọng nhất

Hàm phân biệt và các hệ số ước lượng

Cũng giống như phân tích hồi quy, phân tích biệt số cũng cung câp cho ta các hệ số chuẩn hoá và chưa chuẩn hoá trong 2 bảng sau

Với kết quả trên ta có hàm phân biệt có thể được viết như sau

D=1.333*GDP +1.827*HOTROXAHOI +2.77*TUOITHO +1.622*TUDO +0.418*HAOPHONG -3.202*NHANTHUCTHAMNHUNG -5.783

Tại bảng hệ số hàm phân biệt chuẩn hoá bạn có thể thấy thứ tự độ lớn của các hệ số mâu thuận với ma trận câu trúc ở trên. Đây có thể là nguên nhân của hiện tượng đa cộng tuyến (tương quan giữa các biến độc lập gây nên). Để đánh giá mức độ quan trong của các biến hãy cứ dùng ma trân bên trên nhé.

Tâm nhóm và dự đoán

Bảng này cho biết trung bình của 2 nhóm theo hàm phân biệt không chuẩn hoá.Từ kết quả trên ta tính được giá trị điểm phân biệt (điểm cắt)

Như vậy nếu có thêm thông tin về 1 quan sát mới (quốc gia nào đó chưa được thống kê) ta chỉ cần thay nó vào hàm D=1.333*GDP +1.827*HOTROXAHOI +2.77*TUOITHO +1.622*TUDO +0.418*HAOPHONG -3.202*NHANTHUCTHAMNHUNG -5.783 và so sánh giá trị D với 0 xem ta sẽ xếp quan sát đó vào nhóm nào

Đánh giá chất lượng của hàm phân tích phân biệt

Đến với bảng Classification Results

Nhìn chung hàm này có khả năng phân biệt tốt

+ Nó dự đoán đúng nhóm cho 90.4% số quan sát (50+91)/156=90.4%

+ Trường hợp mỗi quan sát được dự đoán bằng các quan sát không phải nó thì tỷ lệ đúng là 87.8% (46+91)/156=87.8%

Các bạn có thể theo doi các phân tích mở rộng cho phần này tại bài viết sau: https://vaxidi.com/danh-gia-chat-luong-cua-ham-phan-tich-phan-biet

 

còn nữa ...

Để xem tiếp các nội dung bên dưới bạn cần phải đăng nhập vào tài khoản đã được phân quyền đọc tương ứng.

Nếu chưa có tài khoản hãy nhấn  ĐĂNG KÝ hoặc ĐĂNG NHẬP nếu bạn đã có tài khoản.

Đăng ký | Quên mật khẩu?

Trang: 1 2 3 4 5