- Berapa banyak varians yang harus dijelaskan oleh PCA?
- Apakah beban tinggi di PCA?
- Sekiranya saya mengeluarkan ciri -ciri yang sangat berkorelasi sebelum PCA?
- Apa beban PCA memberitahu kami?
Berapa banyak varians yang harus dijelaskan oleh PCA?
Beberapa kriteria mengatakan bahawa jumlah varians yang dijelaskan oleh semua komponen harus antara 70% hingga 80% varians, yang dalam hal ini bermaksud sekitar empat hingga lima komponen.
Apakah beban tinggi di PCA?
Bebannya adalah dari sudut pandangan berangka, sama dengan pekali pembolehubah, dan memberikan maklumat mengenai pembolehubah yang memberikan sumbangan terbesar kepada komponen. Beban berkisar antara -1 hingga 1. Nilai mutlak yang tinggi (ke arah 1 atau -1) menerangkan bahawa pemboleh ubah sangat mempengaruhi komponen.
Sekiranya saya mengeluarkan ciri -ciri yang sangat berkorelasi sebelum PCA?
Hai Yong, PCA adalah cara untuk menangani pembolehubah yang sangat berkorelasi, jadi tidak perlu membuangnya. Sekiranya pembolehubah N sangat berkorelasi daripada mereka semua akan dimuatkan pada komponen utama yang sama (eigenvector), bukan yang berbeza. Inilah cara anda mengenal pasti mereka sebagai sangat berkorelasi.
Apa beban PCA memberitahu kami?
Beban positif menunjukkan pemboleh ubah dan komponen utama berkorelasi positif: peningkatan dalam satu hasil peningkatan yang lain. Beban negatif menunjukkan korelasi negatif. Beban besar (sama ada positif atau negatif) menunjukkan bahawa pemboleh ubah mempunyai kesan yang kuat pada komponen utama.