Analisis Komponen Utama dan Analisis Faktor


Analisis Komponen Utama

Dalam statistika, analisis komponen utama (principal component analysis / PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier sehingga terbentuk sistem koordinat baru dengan varians maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan.

Analisis komponen utama merupakan suatu tehnik statistik untuk mengubah dari sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untuk mereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data tersebut (Johnson & Wichern, 1982). Analisis komponen utama merupakan analisis antara dari suatu proses penelitian yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu analisis yang langsung berakhir. Misalnya komponen utama bisa merupakan masukan untuk regresi berganda atau analisis faktor.

Dilihat secara aljabar linier, komponen utama adalah kombinasi linier-kombinasi linier tertentu dari p peubah acak x1,x2,x3,….,xp. Secara geometris kombinasi linier ini merupakan sistem koordinat baru yang didapat dari rotasi sistem semula dengan x1,x2,….,xp sebagai sumbu koordinat. Sumbu baru tersebut merupakan arah dengan variabilitas maksimum dan memberikan kovariansi yang lebih sederhana.

Menurut Johnson dan Dean, Analisis Komponen Utama terkonsentrasi pada penjelasan struktur variansi dan kovariansi melalui suatu kombinasi linear variabel-variabel asal, dengan tujuan utama melakukan reduksi data dan membuat interpretasi. Analisis komponen utama lebih baik digunakan jika variabel-variabel asal saling berkorelasi (1988: 340).

Contoh:

Examination scores for graduate students in Mathematics

No

Diffgeom

complex

algebra

reals

statistics

open book

close book

1

36

58

43

36

37

2

62

54

50

46

52

3

31

42

41

40

29

4

76

78

69

66

81

5

46

56

52

56

40

6

12

42

38

38

28

7

39

46

51

54

41

8

30

51

54

52

32

9

22

32

43

28

22

10

9

40

47

30

24

11

32

49

54

37

52

12

40

62

51

40

49

13

64

75

70

66

63

14

36

38

58

62

62

15

24

46

44

55

49

16

50

50

54

52

51

17

42

42

52

38

50

18

2

35

32

22

16

19

56

53

42

40

32

20

59

72

70

66

62

21

28

50

50

42

63

22

19

46

49

40

30

23

36

56

56

54

52

24

54

57

59

62

58

25

14

35

38

29

20

Dengan menggunakan program Minitab, dilakukan analisis data diatas sebagai berikut:

Dari menu pilih menu Stat, kemudian pilih Multivariate, dan pilih Principal Components. Sebagai input variabel, masukkan variabel diffgeom, complex, algebra, reals dan statistics. Jumlah komponen yang akan dihitung 5, dengan menggunakan type matriks hubungan Covariance (karena memiliki skala ukuran yang sama).

Output yang dihasilkan sebagai berikut:

Statistik Deskriptif

Descriptive Statistics: diffgeom, complex, algebra, reals, statistics

Variable   N  N* Mean SE Mean StDev Minimum Q1   Median Q3

diffgeom   25 0 36.76  3.74   18.68  2.00  23.00 36.00 52.00

complex    25 0 50.60  2.41   12.07 32.00  42.00 50.00 56.50

algebra    25 0 50.68  1.95    9.77 32.00  43.00 51.00 55.00

reals      25 0 46.04  2.58   12.92 22.00  37.50 42.00 55.50

statistics 25 0 43.80 3.30 16.51 16.00 29.50 49.00 55.00

Variable Maximum

diffgeom 76.00

complex  78.00

algebra  70.00

reals    66.00

statistics 81.00

Analisis Komponen Utama

Principal Component Analysis: diffgeom, complex, algebra, reals, statistics

Eigenanalysis of the Correlation Matrix

Eigenvalue 4.0812 0.3739 0.2166 0.2048 0.1236

Proportion 0.816  0.075  0.043  0.041 0.025

Cumulative 0.816  0.891  0.934  0.975 1.000

Variable    PC1   PC2    PC3    PC4   PC5

diffgeom   0.443 0.473 -0.352 -0.615 -0.279

complex    0.437 0.616  0.368  0.424  0.339

algebra    0.462 -0.276 0.210  0.338 -0.743

reals      0.445 -0.470 0.470 -0.476  0.367

statistics 0.449 -0.317 -0.690 0.318  0.347

Dengan scree plot sebagai berikut:

Terlihat bahwa hanya komponen PC1 yang memiliki varians (atau eigenvalue) lebih besar dari 1, yaitu 4,0812. Komponen pertama ini (PC1) ini dapat menjelaskan 81,6 persen keragaman data. Skor untuk komponen yang dibentuk bisa dihitung dengan melihat nilai koefisien untuk masing-masing variabel. Untuk komponen PC1, skornya bisa dihitung sebagai berikut:

PC1 = 0,443 diffgeom + 0.437 complex + 0.462 algebra + 0.445 reals + 0.449 statistics

Komponen kedua (PC2) memiliki eigenvalue 0.3739 dan dapat menjelaskan 7,5 persen keragaman. Bersama dengan komponen pertama (PC1), keduanya merepresentasikan 89,1 persen dari keragaman total. Skor untuk PC2 dihitung sebagai berikut:

PC2 = 0,473 diffgeom + 0.616 complex – 0.276 algebra – 0.470 reals – 0.317 statistics

Penentuan jumlah komponen yang akan digunakan sangat subjektif. Dalam kasus ini, kedua komponen PC1 dan PC2 yang merepresentasikan 89,1 persen keragaman total bisa dinilai telah cukup menangkap struktur data. Atau bahkan hanya dengan menggunakan komponen pertama pun telah cukup menangkap struktur data, jika dilihat dengan kriteria nilai eigenvalue lebih besar dari 1. Komponen-komponen lainnya memiliki proporsi keragaman yang kecil bisa dianggap tidak penting.

Analisis Faktor

Analisis faktor adalah alat analisis statistik yang dipergunakan untuk mereduksi faktor-faktor yang mempengaruhi suatu variabel menjadi beberapa set indikator saja, tanpa kehilangan informasi yang berarti. Sebagai ilustrasi, terdapat 50 indikator yang diidentifikasi mempunyai pengaruh terhadap keputusan pembelian konsumen. Dengan analisis faktor, ke-50 indikator tersebut akan dikelompokkan menjadi beberapa sub set indikator yang sejenis. Masing-masing kelompok sub set tersebut kemudian diberi nama sesuai dengan indikator yang mengelompok. Pengelompokan berdasarkan kedekatan korelasi antar masing-masing indikator dan penentuan banyaknya sub set berdasarkan nilai eigen values, yang biasanya diambil di atas 1.

Analisis faktor digunakan untuk penelitian awal di mana faktor-faktor yang mempengaruhi suatu variabel belum diidentifikasikan secara baik (explanatory research). Konsep dasar analisis faktor:

1. Bukan mengkaitkan antara dependen variabel dengan independen variabel, TAPI membuat REDUKSI atau ABSTRAKSI atau MERINGKAS dari BANYAK variabel menjadi SEDIKIT variabel.

2. Teknik yang digunakan adalah TEKNIK INTERDEPENSI, yakni SELURUH set HUBUNGAN yang interdependen diteliti. Prinsipnya menggunakan KORELASI r = 1 dan r = 0. Dipergunakan dalam hal mengidentifikasi variabel yang berKORELASI dan yang tidak/kecil KORELASI-nya.

3. Analisis Faktor menekankan adanya COMMUNALITY= jumlah varian yang disumbangkan oleh suatu variabel pada variabel lainnya.

4. Kovariasi antar-variabel yang diuraikan akan memunculkan COMMON FACTORS (jumlahnya sedikit) dan UNIQUE FACTORS setiap variabel. (FAKTOR-FAKTOR tidak secara jelas terlihat).

5. Adanya koefisien nilai faktor (factor score coefficient), sehingga faktor 1 menyerab sebagian besar seluruh variabel, faktor 2 menyerab sebagian besar sisa varian setelah diambil untuk faktor 1. Faktor 2 TIDAK berkorelasi dengan faktor 1.

Contoh:

Dengan menggunakan data pada contoh diatas, kita akan melakukan Analisis Faktor berikut dengan menggunakan program SPSS 16:

Dari menu pilih Analyze→ Data Reduction →Factor..

Pilih kelima variabel sebagai variabel analisis. Klik Descriptive, pada bagian Correlation Matrix beri tanda cek pada Coefficient dan KMO and Bartlett’s test of sphericity. Klik Continue.

Kemudian klik pada Extraction dan pastikan pilihan Analyze pada correlation matrix dan pada bagian Display beri tanda cek pada kedua pilihan. Sebagai kriteria ekstaksi (Extraction) kita akan menggunakan eigenvalue, yaitu Eigenvalues over: 1. Klik Continue.

Klik Rotation lalu pilih Varimax dan pada Display pilih Rotated Solution. Klik Continue.

Klik Scores, lalu beri tanda cek Save as Variables dengan Method: Regression dan Display factor score coefficient matrix, agar kita bisa melihat nilai variabel/faktor baru yang terbentuk. Klik Continue.

Berikut output dari SPSS:

Correlation Matrix

diffgeom

complex

algebra

reals

statistics

Correlation Diffgeom

1.000

.806

.754

.733

.758

Complex

.806

1.000

.774

.695

.715

Algebra

.754

.774

1.000

.841

.838

Reals

.733

.695

.841

1.000

.785

Statistics

.758

.715

.838

.785

1.000

KMO and Bartlett’s Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy.

.871

Bartlett’s Test of Sphericity Approx. Chi-Square

102.847

Df

10

Sig.

.000

Terlihat bahwa antar kelima variabel tersebut memiliki korelasi yang kuat satu sama lain. Uji Bartlett’s Test of Sphericity juga menunjukkan kelima variabel tersebut saling berkorelasi.

Communalities

Initial

Extraction

Diffgeom

1.000

.803

Complex

1.000

.778

Algebra

1.000

.870

Reals

1.000

.807

Statistics

1.000

.824

Extraction Method: Principal Component Analysis.

Extraction Communalities mengestimasi variansi setiap variabel yang dijelaskan oleh komponen terbentuk. Dari output terlihat semua variabel memiliki Extraction Communalities yang besar sehingga komponen yang terbentuk (terekstraksi) sudah cukup mewakili variabel-variabel dengan baik.

Total Variance Explained
Component

Initial Eigenvalues

Extraction Sums of Squared Loadings

Total

% of Variance

Cumulative %

Total

% of Variance

Cumulative %

1

4.081

81.623

81.623

4.081

81.623

81.623

2

.374

7.477

89.100

3

.217

4.331

93.431

4

.205

4.096

97.527

5

.124

2.473

100.000

Extraction Method: Principal Component Analysis.

Terlihat bahwa hanya komponen/faktor pertama yang memenuhi kriteria eigenvalue lebih besar dari 1. Komponen pertama memiliki nilai eigenvalue (varians) sebesar 4.081 dan memiliki proporsi keragaman sebesar 81,623 persen dari keragaman total. Jadi untuk mereduksi variabel cukup dengan menggunakan satu komponen/faktor.


Dari screeplot juga jelas terlihat hanya komponen pertama yang memiliki nilai eigenvalue lebih dari 1.

Component Matrixa

Component

1

Diffgeom

.896

Complex

.882

Algebra

.933

Reals

.898

Statistics

.908

Extraction Method: Principal Component Analysis.
a. 1 components extracted.

Rotated Component Matrixa

a. Only one component was extracted. The solution cannot be rotated.

Hanya satu komponen yang terekstrak, sehingga tidak bisa dirotasi.

Dari Component Matrix terlihat bahwa semua variabel berkorelasi kuat dengan komponen pertama.

Component Score Coefficient Matrix

Component

1

Diffgeom

.220

Complex

.216

Algebra

.229

Reals

.220

Statistics

.222

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.

Component Scores.

Dari Component Score Coefficient Matrix, bisa dihitung skor untuk setiap case, yaitu dengan mengalikan nilai variabel case yang telah distandardisasi dengan koefisien skor faktornya.

Faktor_1 = 0.220 diffgeomstd + 0.216 complexstd + 0.229 algebrastd + 0.220 realsstd + 0.222 statisticsstd

Seperti halnya dalam Analisis Komponen Utama, penentuan jumlah faktor juga sangat subjektif. Jika kita tidak puas dengan hasil diatas yang hanya mengekstrak satu komponen, maka kita bisa saja membuat kriteria agar terekstrak dua komponen, yaitu dengan menandai pilihan Extract sesuai keinginan pada kotak dialog seperti terlihat pada gambar di bawah ini.

* * *

About these ads

14 Responses

  1. Perbedaan Analisis Komponen utama dengan analisis faktor apa pak?

  2. BAPAK APAKAH ADA DAFTAR PUSTAKA NYA. TERIMA KASIH

  3. asslm…
    saya flo,
    untuk pca menggunakan minitab ga perlu menggunakan penghitungan manual kah?
    mohon penjelasannya.. :)
    terimakasih

  4. bisa dielaskan gak, kira-kira nilai Component Score Coefficient Matrix yang muncul di dapat dari mana? rumus manualnya sperti apa??? misalnya untuk diffgeom sebsar 0.220, algebra 0.216 dan sterusnya, nilai tersebut diperoleh dari mana?

    terima kasih sebelumnya.

  5. Pak, klo PCA pake SPSS stepnya gimana ya??
    terima kasih sebelumnya :)

  6. Assalamu’alaikum Pak..
    Kalo secara manual perumusan PCA bisa dijelasin g?
    krn kdg di TA hars djelasin Pak…

          

  7. pak, tolong donk dibahas yang mengenai RIDGE REGRESSION dan aplikasinya ke SPSS.

    soalnya urgent banget lagi butuh info untuk caranya aplikasi ridge ke SPSS untuk skripsi saya.

    vnomniknight@gmail.com

    best regards, Pendi

  8. mudah bget…..
    g da yg lebih sulit…..

  9. Terima kasih penjelasannya, Pak. Mantap..

  10. wowow kuerennn
    boleh donk discuss di kampus
    kbtulan tgs akhirku ada pca nya

  11. mb kalo satuannya / skalanya gag sama untuk setiap variable pake matriks korelasi ya…??

  12. priiiiiiiiiiiiiiiiiiiiiiiikitiiiiiiiieeeeeeeeeew…………….

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Follow

Get every new post delivered to your Inbox.

Join 26 other followers

%d bloggers like this: