Đọc kết quả phân tích PCA từ output của phần mềm SPSS

This entry is part 12 of 35 in the series Phân tích nhân tố (Factor Analysis)

Cập nhật: 04/10/2022 bởi admin0

Đọc các output cơ bản

Đây là bảng đầu tiên mà bạn sẽ nhìn thấy ở output sau khi phân tích EFA, tất nhiên nếu trước đó bạn có tích vào lựa chọn tính nó ra.

Hệ số KMO

Phép đo Kaiser-Meyer-Olkin về mức độ thích hợp của việc lấy mẫu là một thống kê cho biết tỷ lệ phương sai trong các biến của bạn có thể do các yếu tố cơ bản gây ra. 0<KMO<1. Các giá trị cao (gần bằng 1) thường chỉ ra rằng phân tích nhân tố có thể hữu ích với dữ liệu của bạn. Nếu giá trị nhỏ hơn 0,5 kết quả phân tích nhân tố có thể không hữu ích lắm.

Như vậy bạn biết tại sao gần như KMO luôn luôn ok rồi đúng không?

Nếu KMO >0,05 thì phân tích EFA “có thể” hữu ích, khi ấy ta tiếp tục xem các kết quả khác, còn không thì bỏ đi, điều chỉnh và làm lại

Kiểm định Bartlett’s Test

Kiểm tra tính cầu của Bartlett kiểm tra giả thuyết rằng ma trận tương quan của bạn là ma trận đơn vị, điều này sẽ chỉ ra rằng các biến của bạn không liên quan và do đó không phù hợp để phát hiện cấu trúc. Các giá trị nhỏ (nhỏ hơn 0,05) của mức ý nghĩa cho thấy rằng phân tích nhân tố có thể hữu ích với dữ liệu của bạn

Vậy đây là kiểm định kiểm tra cặp giả thuyết sau

H0: Ma trận hệ số tương quan là ma trận đơn vị (hệ số tương quan của 2 biến quan sát bất kỳ đôi một bằng 0)

H1 : Ngược lại (Ít nhất có một hệ số tương quan giữa các biến quan sát khác 0)

Kết quả mong muốn : sig <0,05 để bác bỏ H0

Nhắc lại ý tưởng của phân tích PCA là tìm ra các nhân tố chính (gom các biến quan sát tương đồng, cùng xu hướng lại thành 1 nhóm xoay quanh 1 trục chính) để giảm bớt số biến (chiều không gian) cần nghiên cứu. Vậy nếu chấp nhận H0, nghĩa là không có biến quan sát nào tương quan (tương đồng) với nhau thì ta dừng phân tích nhân tố ở đây thôi nhỉ !!!

Phần trăm phương sai được giài thích

+ Phương sai  được giải thích, tên nguyên gốc là “Variance Explained” có lẽ nên được dịch ra Tiếng Việt là “Phương sai được phản ánh” hoặc “Phương sai thể hiện được” thì có lẽ hay hơn và dễ hiểu hơn. Tuy nhiên thuật ngữ “phương sai trích”  đã được dịch từ lâu và bây giờ cũng đã trở thành kinh điển rồi

+ Đi kèm với nói là Tổng phương sai trích = Total Variance Explained

Bảng Total Variance Explained 

+ Eigenvalue là giá trị riêng của phương sai của dữ liệu chiếu lên mỗi trục (chưa được xoay). Tổng các giá trị này đúng bằng số quan sát, như ví dụ thì tổng này là 14. Hệ số này đại diện cho khả năng phản ảnh dữ liệu của từng trục. Với hệ trục gốc ( mỗi trục là 1 biến quan sát) thì hệ số này tương ứng với mỗi trục là 1- đương nhiên phải không. Với hệ trụ mới dựng, trục nào có eigenvalue >1 tức là có khả năng phản ánh dữ liệu tốt hơn trục trong hệ gốc, và ngược lại. Đây cũng là 1 tiêu chuẩn thường được lấy ra để quyết định xem chọn bao nhiêu trục chính trong PCA

+ Lấy tổng bình phương các hệ sô tải theo từng trục ta sẽ có eigenvalue theo từng trục

+ %variance tính thế nào thì các bạn tự suy nhé

+ Tổng phương sai trích chính là tổng cộng dồn của phương sai được trích theo từng trục. Bạn đã hiểu tại sao thông thường ta chọn tổng phương sai trích >50% chưa?

  • Sau khi xoay hệ trục này đi ngoài việc hệ số tải phân hóa rõ ràng thì ta cũng thấy dù tổng phương sai trích không đổi nhưng mức độ thể hiện dữ liệu trên mỗi trục đã được dàn đều ra (phương sai xấp xỉ nhau- dàn đều ra)

C:\Users\lp\Pictures\1.PNG

Hệ số tải trong ma trận đã được xoay

+ Hệ số tải: Factor loadings, hay đôi khi gọi là “loadings” chính là hệ số tương quan của các biến quan sát với các trục chính

+ Thêm 1 điệu quan trọng để các bạn hiểu đoạn tiếp theo trong bài viết này (tại sao các bạn tự tìm hiểu thêm nhé): Phương sai trích trên 1 trục bằng tổng bình phương các hệ số tải lên trục đó. Variance = Sums of Squared Loadings

+ Component Matrix là ma trận hệ số tải đã được trích theo hệ các trục chưa được xoay. Bảng này thì ta không cần quan tâm

+ Rotated Component Matrix là ma trận hệ số tải đã được trích theo hệ các trục đã được xoay

Bảng này bạn có thấy hệ sô tải của từng nhóm lên các trục đã có sự thay đổi lớn. Mỗi biến quan sát có 1 hệ số tải lớn áp đảo cho 1 trục, và tải không đáng kể lên các trục khác.

Series Navigation<< Phân tích thành phần chính trên SPSS: Thao tác thực hànhCác tiêu chí lựa chọn số nhân tố được trích xuất -phần 1 >>

Trang: 1 2