Analisis Komponen Utama dan Analisis Faktor

Analisis Komponen Utama

Dalam statistika, analisis komponen utama (principal component analysis / PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier sehingga terbentuk sistem koordinat baru dengan varians maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan.

Analisis komponen utama merupakan suatu tehnik statistik untuk mengubah dari sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untuk mereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data tersebut (Johnson & Wichern, 1982). Analisis komponen utama merupakan analisis antara dari suatu proses penelitian yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu analisis yang langsung berakhir. Misalnya komponen utama bisa merupakan masukan untuk regresi berganda atau analisis faktor.

Dilihat secara aljabar linier, komponen utama adalah kombinasi linier-kombinasi linier tertentu dari p peubah acak x₁,x₂,x₃,….,x_p. Secara geometris kombinasi linier ini merupakan sistem koordinat baru yang didapat dari rotasi sistem semula dengan x₁,x₂,….,x_p sebagai sumbu koordinat. Sumbu baru tersebut merupakan arah dengan variabilitas maksimum dan memberikan kovariansi yang lebih sederhana.

Menurut Johnson dan Dean, Analisis Komponen Utama terkonsentrasi pada penjelasan struktur variansi dan kovariansi melalui suatu kombinasi linear variabel-variabel asal, dengan tujuan utama melakukan reduksi data dan membuat interpretasi. Analisis komponen utama lebih baik digunakan jika variabel-variabel asal saling berkorelasi (1988: 340).

Contoh:

Examination scores for graduate students in Mathematics

No	Diffgeom	complex	algebra	reals	statistics
	open book		close book
1	36	58	43	36	37
2	62	54	50	46	52
3	31	42	41	40	29
4	76	78	69	66	81
5	46	56	52	56	40
6	12	42	38	38	28
7	39	46	51	54	41
8	30	51	54	52	32
9	22	32	43	28	22
10	9	40	47	30	24
11	32	49	54	37	52
12	40	62	51	40	49
13	64	75	70	66	63
14	36	38	58	62	62
15	24	46	44	55	49
16	50	50	54	52	51
17	42	42	52	38	50
18	2	35	32	22	16
19	56	53	42	40	32
20	59	72	70	66	62
21	28	50	50	42	63
22	19	46	49	40	30
23	36	56	56	54	52
24	54	57	59	62	58
25	14	35	38	29	20

Dengan menggunakan program Minitab, dilakukan analisis data diatas sebagai berikut:

Dari menu pilih menu Stat, kemudian pilih Multivariate, dan pilih Principal Components. Sebagai input variabel, masukkan variabel diffgeom, complex, algebra, reals dan statistics. Jumlah komponen yang akan dihitung 5, dengan menggunakan type matriks hubungan Covariance (karena memiliki skala ukuran yang sama).

Output yang dihasilkan sebagai berikut:

Statistik Deskriptif

Descriptive Statistics: diffgeom, complex, algebra, reals, statistics

Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3

diffgeom 25 0 36.76 3.74 18.68 2.00 23.00 36.00 52.00

complex 25 0 50.60 2.41 12.07 32.00 42.00 50.00 56.50

algebra 25 0 50.68 1.95 9.77 32.00 43.00 51.00 55.00

reals 25 0 46.04 2.58 12.92 22.00 37.50 42.00 55.50

statistics 25 0 43.80 3.30 16.51 16.00 29.50 49.00 55.00

Variable Maximum

diffgeom 76.00

complex 78.00

algebra 70.00

reals 66.00

statistics 81.00

Analisis Komponen Utama

Principal Component Analysis: diffgeom, complex, algebra, reals, statistics

Eigenanalysis of the Correlation Matrix

Eigenvalue 4.0812 0.3739 0.2166 0.2048 0.1236

Proportion 0.816 0.075 0.043 0.041 0.025

Cumulative 0.816 0.891 0.934 0.975 1.000

Variable PC1 PC2 PC3 PC4 PC5

diffgeom 0.443 0.473 -0.352 -0.615 -0.279

complex 0.437 0.616 0.368 0.424 0.339

algebra 0.462 -0.276 0.210 0.338 -0.743

reals 0.445 -0.470 0.470 -0.476 0.367

statistics 0.449 -0.317 -0.690 0.318 0.347

Dengan scree plot sebagai berikut:

Terlihat bahwa hanya komponen PC1 yang memiliki varians (atau eigenvalue) lebih besar dari 1, yaitu 4,0812. Komponen pertama ini (PC1) ini dapat menjelaskan 81,6 persen keragaman data. Skor untuk komponen yang dibentuk bisa dihitung dengan melihat nilai koefisien untuk masing-masing variabel. Untuk komponen PC1, skornya bisa dihitung sebagai berikut:

PC1 = 0,443 diffgeom + 0.437 complex + 0.462 algebra + 0.445 reals + 0.449 statistics

Komponen kedua (PC2) memiliki eigenvalue 0.3739 dan dapat menjelaskan 7,5 persen keragaman. Bersama dengan komponen pertama (PC1), keduanya merepresentasikan 89,1 persen dari keragaman total. Skor untuk PC2 dihitung sebagai berikut:

PC2 = 0,473 diffgeom + 0.616 complex – 0.276 algebra – 0.470 reals – 0.317 statistics

Penentuan jumlah komponen yang akan digunakan sangat subjektif. Dalam kasus ini, kedua komponen PC1 dan PC2 yang merepresentasikan 89,1 persen keragaman total bisa dinilai telah cukup menangkap struktur data. Atau bahkan hanya dengan menggunakan komponen pertama pun telah cukup menangkap struktur data, jika dilihat dengan kriteria nilai eigenvalue lebih besar dari 1. Komponen-komponen lainnya memiliki proporsi keragaman yang kecil bisa dianggap tidak penting.

Analisis Faktor

Analisis faktor adalah alat analisis statistik yang dipergunakan untuk mereduksi faktor-faktor yang mempengaruhi suatu variabel menjadi beberapa set indikator saja, tanpa kehilangan informasi yang berarti. Sebagai ilustrasi, terdapat 50 indikator yang diidentifikasi mempunyai pengaruh terhadap keputusan pembelian konsumen. Dengan analisis faktor, ke-50 indikator tersebut akan dikelompokkan menjadi beberapa sub set indikator yang sejenis. Masing-masing kelompok sub set tersebut kemudian diberi nama sesuai dengan indikator yang mengelompok. Pengelompokan berdasarkan kedekatan korelasi antar masing-masing indikator dan penentuan banyaknya sub set berdasarkan nilai eigen values, yang biasanya diambil di atas 1.

Analisis faktor digunakan untuk penelitian awal di mana faktor-faktor yang mempengaruhi suatu variabel belum diidentifikasikan secara baik (explanatory research). Konsep dasar analisis faktor:

1. Bukan mengkaitkan antara dependen variabel dengan independen variabel, TAPI membuat REDUKSI atau ABSTRAKSI atau MERINGKAS dari BANYAK variabel menjadi SEDIKIT variabel.

2. Teknik yang digunakan adalah TEKNIK INTERDEPENSI, yakni SELURUH set HUBUNGAN yang interdependen diteliti. Prinsipnya menggunakan KORELASI r = 1 dan r = 0. Dipergunakan dalam hal mengidentifikasi variabel yang berKORELASI dan yang tidak/kecil KORELASI-nya.

3. Analisis Faktor menekankan adanya COMMUNALITY= jumlah varian yang disumbangkan oleh suatu variabel pada variabel lainnya.

4. Kovariasi antar-variabel yang diuraikan akan memunculkan COMMON FACTORS (jumlahnya sedikit) dan UNIQUE FACTORS setiap variabel. (FAKTOR-FAKTOR tidak secara jelas terlihat).

5. Adanya koefisien nilai faktor (factor score coefficient), sehingga faktor 1 menyerab sebagian besar seluruh variabel, faktor 2 menyerab sebagian besar sisa varian setelah diambil untuk faktor 1. Faktor 2 TIDAK berkorelasi dengan faktor 1.

Contoh:

Dengan menggunakan data pada contoh diatas, kita akan melakukan Analisis Faktor berikut dengan menggunakan program SPSS 16:

Dari menu pilih Analyze→ Data Reduction →Factor..

Pilih kelima variabel sebagai variabel analisis. Klik Descriptive, pada bagian Correlation Matrix beri tanda cek pada Coefficient dan KMO and Bartlett’s test of sphericity. Klik Continue.

Kemudian klik pada Extraction dan pastikan pilihan Analyze pada correlation matrix dan pada bagian Display beri tanda cek pada kedua pilihan. Sebagai kriteria ekstaksi (Extraction) kita akan menggunakan eigenvalue, yaitu Eigenvalues over: 1. Klik Continue.

Klik Rotation lalu pilih Varimax dan pada Display pilih Rotated Solution. Klik Continue.

Klik Scores, lalu beri tanda cek Save as Variables dengan Method: Regression dan Display factor score coefficient matrix, agar kita bisa melihat nilai variabel/faktor baru yang terbentuk. Klik Continue.

Berikut output dari SPSS:

Correlation Matrix
		diffgeom	complex	algebra	reals	statistics
Correlation	Diffgeom	1.000	.806	.754	.733	.758
	Complex	.806	1.000	.774	.695	.715
	Algebra	.754	.774	1.000	.841	.838
	Reals	.733	.695	.841	1.000	.785
	Statistics	.758	.715	.838	.785	1.000

KMO and Bartlett’s Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.		.871
Bartlett’s Test of Sphericity	Approx. Chi-Square	102.847
	Df	10
	Sig.	.000

Terlihat bahwa antar kelima variabel tersebut memiliki korelasi yang kuat satu sama lain. Uji Bartlett’s Test of Sphericity juga menunjukkan kelima variabel tersebut saling berkorelasi.

Communalities
	Initial	Extraction
Diffgeom	1.000	.803
Complex	1.000	.778
Algebra	1.000	.870
Reals	1.000	.807
Statistics	1.000	.824
Extraction Method: Principal Component Analysis.

Extraction Communalities mengestimasi variansi setiap variabel yang dijelaskan oleh komponen terbentuk. Dari output terlihat semua variabel memiliki Extraction Communalities yang besar sehingga komponen yang terbentuk (terekstraksi) sudah cukup mewakili variabel-variabel dengan baik.

Total Variance Explained
Component	Initial Eigenvalues			Extraction Sums of Squared Loadings
Component	Total	% of Variance	Cumulative %	Total	% of Variance	Cumulative %
1	4.081	81.623	81.623	4.081	81.623	81.623
2	.374	7.477	89.100
3	.217	4.331	93.431
4	.205	4.096	97.527
5	.124	2.473	100.000
Extraction Method: Principal Component Analysis.

Terlihat bahwa hanya komponen/faktor pertama yang memenuhi kriteria eigenvalue lebih besar dari 1. Komponen pertama memiliki nilai eigenvalue (varians) sebesar 4.081 dan memiliki proporsi keragaman sebesar 81,623 persen dari keragaman total. Jadi untuk mereduksi variabel cukup dengan menggunakan satu komponen/faktor.

Dari screeplot juga jelas terlihat hanya komponen pertama yang memiliki nilai eigenvalue lebih dari 1.

Component Matrix^a
	Component
	1
Diffgeom	.896
Complex	.882
Algebra	.933
Reals	.898
Statistics	.908
Extraction Method: Principal Component Analysis.
a. 1 components extracted.

Rotated Component Matrix^a

a. Only one component was extracted. The solution cannot be rotated.

Hanya satu komponen yang terekstrak, sehingga tidak bisa dirotasi.

Dari Component Matrix terlihat bahwa semua variabel berkorelasi kuat dengan komponen pertama.

Component Score Coefficient Matrix
	Component
	1
Diffgeom	.220
Complex	.216
Algebra	.229
Reals	.220
Statistics	.222
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores.

Dari Component Score Coefficient Matrix, bisa dihitung skor untuk setiap case, yaitu dengan mengalikan nilai variabel case yang telah distandardisasi dengan koefisien skor faktornya.

Faktor_1 = 0.220 diffgeom_std + 0.216 complex_std + 0.229 algebra_std + 0.220 reals_std + 0.222 statistics_std

Seperti halnya dalam Analisis Komponen Utama, penentuan jumlah faktor juga sangat subjektif. Jika kita tidak puas dengan hasil diatas yang hanya mengekstrak satu komponen, maka kita bisa saja membuat kriteria agar terekstrak dua komponen, yaitu dengan menandai pilihan Extract sesuai keinginan pada kotak dialog seperti terlihat pada gambar di bawah ini.

* * *

Author: budi

hanya seorang biasa.. bukan siapa-siapa View all posts by budi

15 thoughts on “Analisis Komponen Utama dan Analisis Faktor”

rimona says:

July 14, 2017 at 9:57 pm

Perbedaan analisis faktor dengan chi square apa pak?

tantowirico says:

February 5, 2013 at 12:01 pm

Perbedaan Analisis Komponen utama dengan analisis faktor apa pak?

MBAN says:

October 18, 2012 at 8:03 pm

BAPAK APAKAH ADA DAFTAR PUSTAKA NYA. TERIMA KASIH

flo says:

April 8, 2012 at 1:55 pm

asslm…
saya flo,
untuk pca menggunakan minitab ga perlu menggunakan penghitungan manual kah?
mohon penjelasannya.. 🙂
terimakasih

Lilik Suliandari says:

January 14, 2012 at 8:08 pm

bisa dielaskan gak, kira-kira nilai Component Score Coefficient Matrix yang muncul di dapat dari mana? rumus manualnya sperti apa??? misalnya untuk diffgeom sebsar 0.220, algebra 0.216 dan sterusnya, nilai tersebut diperoleh dari mana?

terima kasih sebelumnya.

Usy says:

March 17, 2011 at 10:38 pm

Pak, klo PCA pake SPSS stepnya gimana ya??
terima kasih sebelumnya 🙂

trie says:

February 24, 2011 at 11:13 am
Assalamu’alaikum Pak..
Kalo secara manual perumusan PCA bisa dijelasin g?
krn kdg di TA hars djelasin Pak…
pendi says:

February 10, 2011 at 10:31 pm

pak, tolong donk dibahas yang mengenai RIDGE REGRESSION dan aplikasinya ke SPSS.

soalnya urgent banget lagi butuh info untuk caranya aplikasi ridge ke SPSS untuk skripsi saya.

vnomniknight@gmail.com

best regards, Pendi

coliMania says:

January 17, 2011 at 1:41 pm

mudah bget…..
g da yg lebih sulit…..

Irma says:

January 4, 2011 at 11:39 pm

Terima kasih penjelasannya, Pak. Mantap..

1. budi says:
  
  January 21, 2011 at 7:31 am
  
  Sama-sama.. 🙂
  
fifi says:

December 25, 2010 at 1:31 pm

wowow kuerennn
boleh donk discuss di kampus
kbtulan tgs akhirku ada pca nya

mars says:

October 5, 2010 at 3:29 pm

mb kalo satuannya / skalanya gag sama untuk setiap variable pake matriks korelasi ya…??

1. budi says:
  
  October 6, 2010 at 7:03 am
  
  yup betul
  
philip says:

May 19, 2010 at 7:51 am

priiiiiiiiiiiiiiiiiiiiiiiikitiiiiiiiieeeeeeeeeew…………….

	Apa Itu Analisis Bay… on SERI BAYESIAN UNTUK PEMULA: TE…
	SALES: Market Basket… on Data Mining: Market Basket Ana…
	AB on SERI BAYESIAN UNTUK PEMULA: TE…
	khubeb tmm on SERI BAYESIAN UNTUK PEMULA: TE…
	Hairstyles on MODEL REGRESI WEIBULL UNTUK SU…

Share this:

Related

Author: budi

15 thoughts on “Analisis Komponen Utama dan Analisis Faktor”

Leave a comment Cancel reply