Dewasa ini metode statistika sudah berkembang sangat luas, untuk mengakomodasi berbagai kondisi data. Karena dalam aplikasinya hampir tidak bisa lepas dari peranankomputer, sebagian besar metode tersebut telah diimplementasikan dalam berbagai paket statistika.
Untuk memberikan gambaran umum tentang metode statistika, terutama yang telah banyak diimplementasikan pada paket-paket komputer, pada akhir bab ini diberikan ringkasan metode statistika elementer yang banyak dipergunakan di kalangan peneliti dan semuanya tersedia pada R hanya beberapa metode tidak tersedia dalam menu RCommander (lihat Bab 1).
Berdasarkan asumsi sebaran yang dipergunakan, metode statistika dapat dibedakan menjadi dua bagian utama yaitu:
1. Statistika Parametrik: yaitu analisis yang didasarkan atas asumsi bahwa data memiliki sebaran tertentu (diskrit atau kontinu, normal atau tidak normal) dengan parameter yang belum diketahui. Fungsi metode statistika adalah untuk meramal parameter, melakukan uji parameter, atau semata-mata melakukan eksplorasi berdasarkan informasi yang ada pada data.
2. Statistika Nonparametrik: yaitu analisis yang tidak didasarkan atas asumsi distribusi pada data. Umumnya teknikini dipakai untuk data dengan uuran kecil sehingga tidak cukupkuat untuk mengasumsikan distribusi tertentu pada data.
Selain dua kelompok metode di atas, belakangan ini, dengan kemajuan pesat di bidang komputasi, telah berkembang metode statistika berbasis simulasi. Karena lebih banyak bergantung pada komputer, metodei ini sering disebut sebagai CIS (Computer Intensive Statistics)
1.1.1 STATISTIKA PARAMETRIK
Sebagian besar metode statistika diturunkan secara analitik dan deduktif berdasarkan asumsi fungsi kepadatan. Oleh karena itu, untuk bisa memanfaatkan metode tersebut dengan benar, data harus mengikuti sebaran tertentu (misalnya Binomial, Poisson, Normal, Eksponensial, Gamma dan sejenisnya). Persoalan yang dihadapi pada umumnya adalah menduga atau menguji partemeter yang belum diketahui dari distribusi tertentu yang dianggap sesuai dengan kondisi data. Metode statistika yang diturunkan seperti ini disebut metode parametrik. Namun tidak semua metode parametrik melakukan uji parameter (uji hipotesis), beberapa diantaranya hanya melakukan eksplorasi informasi yang melaporkan kesimpulan yang diperoleh dari eksplorasi tersebut.
STATISTIKA DENGAN UJI HIPOTESIS
Dalam beberapa kondisi, peneliti telah memiliki gambaran (dugaan) tentang populasi (bisa berdasarkan kajian teori, atau hasil penelitian terkait sebelumnya). Dalam hal ini, tujuan utama peneliti adalah membuktikan, dengan alat statistika, apakah dugaan yang yang dimilikidapat dibuktikanbenar atau sebaliknya. Ada dua kelopok besar yang dapat dilakukan dengan uji hipotesis yaitu:
1. Uji hipotesis terkait uji rerata yaitu untuk menguji atau mengestimasi besarnya rerata 1 kelompok, menguji beda dua kelompok atau lebih, dengan berbagai kondisi kelompok (saling bebas atau berpasangan/ tidak saling bebas).
2. Uji hubungan baik terbatas pada besarnya derajat asosiasi (uji korelasi) atau mencari bentuk hubungan fungsional beberapa variabel (uji regresi). Uji regresi saat ini juga telah berkembang sangat luas tergantung distribusi variabel respon yang dihadapi.
UJI RERATA
Dalam statistika parametrik, salah satu parameter yang banyak menarik perhatian untuk diuji atau diramal adalah parameter rerata (mean). Untuk data dengan 1 subpopulasi atau 2 subpopulasi (sering juga disebut kelompok dengan satu atau dua kategori,) uji yang dipakai adalah uji Z atau T. Sedangkan untuk subpopulasi lebih dari dua dipergunakan uji F atau lebih dikenal dengan analisi variansi (ANAVA)
1) UJI T DAN Z (KELOMPOK DENGAN SATU-DUA KATEGORI)
Misalkan kita memiliki data dengan kelompok terdiriatas 1-2 kategori atau subpopulasi (misalnya kelompok kaya-miskin, laki-perempuan, eksperimen-kontrol). Dalam hal ini ada beberapa tujuan dan kondisi data yang berpengaruh pada pemilihan uji statistika yang dapat dilakukan. Beberapa kondisi yang bisa ini diantaranya:
1. Kita ingin menguji apakah rerata keseluruhan populasi sama dengan angka tertentu. Dalam hal ini ada dua uji statistika yang dapat dilakukan yaitu:
a. Uji T satu kelompok jika ukuran sampel kecil dan variansi populasi tidak diketahui.
b. Uji Z satu kelompok jika ukuran sampel cukup besar atau variansi populasi diketahui.
2. Kita ingin menguji apakah rerata dua kelompok (yang ada secara alamiah, misalnya laki-perempuan, dalam kota-luar kota) sama atau berbeda. Dengan kata lain apakah suatu atribut (jenis kelamin, status sosial, tempat tinggal) berpengaruh terhadap suatu kondisi yang menjadi perhatian.
a. Uji T dua kelompok saling bebas jika ukuran sampel kecil dan variansi populasi tidak diketahui.
b. Uji Z dua kelompok saling bebas jika ukuran sampel cukup besar atau variansi populasi diketahui.
3. Kita ingin menguji apakah rerata dua kelompok (yang muncul dari rekayasa, misalnya kelompok eksperimen-kontrol) sama atau berbeda. Dengan kata lain apakah suatu eksperimen memberi dampak seperti yang diperkirakan. Dalam hal ini dua subpopulasi yang terbentuk merupakan subpopulasi yang tidak saling bebas atau bahkan (satu kelompok dengan dua atribut, pre & post treatment/test atau dua subpopulasi yang saling berpasangan, eksperimen-kontrol)
a. Uji T dua kelompok berpasangan jika ukuran sampel kecil dan variansi populasi tidak diketahui.
b. Uji Z dua kelompok berpasangan jika ukuran sampel cukup besar atau variansi populasi diketahui.
UJI F/ANAVA (KELOMPOK DENGAN KATEGORI ATAU LEBIH)
Jika banyaknya subpopulasi lebih dari dua (tiga atau lebih), maka uji yang dapat dilakukan adalah uji ANAVA/ANOVA (Analisis variansi/analysis of variance). Pada umumnya uji anava dibatasi pada subpopulasi yang saling bebas yaitu subpopulasi satu dengan lainnya bukan merupakan subpopulasi yang sama, juga bukan merupakan subpopulasi yang berpasangan. Uji ANAVA dibedakan menjadi dua macam yaitu:
1. ANAVA satu arah (jika hanya ada satu pengelompokan yang menjadi perhatian, misalnya status sosial: kaya, menengah,miskin)
2. ANAVA multi arah (jika hanya ada lebih dari satu pengelompokan yang menjadi perhatian, misalnya beda rata-rata tekanan darah penduduk dilihat dari status sosial (kaya, menengah, miskin) dan pendidikan (dasar, menengah, tinggi), atau yang lainnya (suku bangsa: jawa, bali dan lainnya)
3. MANAVA/MANOVA*) (Multivariat Anava) yaitu ANAVA untuk respon yang tidak saling bebas (multivariat). Data multivariat ini terjadi apabila kelompok yang sama diamati untuk lebih dari dua atribut (misalnya untuk mahasiswa dilihat nilai Tugas, Nilai Ujian Mid dan Nilai Ujian Akhir, atau satu atribut di amati lebih dari dua kali (tekanan darah pasien pagi, siang dan malam hari). Uji MANOVA kadang-kadang disebut juga uji profil.
A. UJI PROPORSI
B. UJI HUBUNGAN
Selain melakukan uji beda rerata beberapa kelompok, kadang-kadang kita ingin menguji apakah dua peubah (atribut masyarakat) saling berhubungan atau tidak. Dalam hal ini ada dua hal yang umum dilakukan yaitu (i) hany aingin mengetahui derajat asosiasi (apakah dua variabel berhubungan positif atau negatif), (ii) ingin mengetahui hubungan fungsional antara dua variabel atau lebih.
1) UJI KORELASI
Uji korelasi hanya ingin mengetahui besarnya derajat asosiasi antara beberapa variabel (misalnya, antara berat badan, tinggi badan, tekanan darah dan lainnya). Koefisien korelasi yang biasa dihitung untuk data berdistribusi Normal adalah koefisien korelasi poroduk momen Karl Pearson dari Besarnya derajat asosiasi dinyatakan dengan bilangan r dengan kisaran nilai .
2) UJI REGRESI
Berbeda dengan uji korelasi, dengan uji regresi kita lebih tertarik pada hubungan fungsional antara suatu peubah (misalnya y) dengan beberapa peubah lainnya (misalnya ) yang dinyatakan dalam bentuk
.
Variabel y disebut variabel respon (terikat) dan xi disebut variabel bebas atau variabel penjelas. Dari bentuk umum di atas diperoleh beberapa bentuk analisis regresi khusus yang dilihat dari jenis distribusi datanya.
1. Regresi Normal (normal linear model), yaitu regresi dengan data respon (y) berdistribusi Normal dan saling bebas.
2. Regresi Normal Campuran (normal mixed model)*, yaitu regresi untuk data respon berdistribusi normal tetapi merupakan data tidak saling bebas (bisa berasal dari pengamatan berulang, seperti tekanan darah dalam tiga waktu berbeda)
3. Regresi Tergeneralisir (Generalized Linear Model)*, yaitu regresi dengan data respon yang tidak berdistribusi normal (misalnya Binomial, Poisson, Eksponensial). Termasuk dalam jenis ini adalah analisis probit atau logit atau regresi logistik (untuk data berdistribusi Binomial) dan analisis log-linier untuk data berdistribusi Poisson.
4. Regresi Campuran Tergeneralisir (Generalized Linear Mixed Model)*, yaitu regresi untuk data yang tidak berdistribusi normal juga tidak bebas. Termasuk dalam analisi ini adalah GEE (Generalized Estimating Equation), GLMM, HGLM (Hierarchical Generalized Linear Model).
5. Selain berdasarkan distribusi sebaran, dalam penerapannya analisis regresi juga bervariasi jika dilihat kompleksitas variabel penjelas xi, misalya apakah diantaranya ada variabel kategorik berupa kelompok atau faktor (misalnya jenis kelamin, etnik dan sejenisnya), demikian juga apakah diantara variabel penjelas ada yang saling berkorelasi satu dengan lainnya (ada tidaknya multikolinieritas).
6. Regresi dengan diri sendiri (Analisis Deret Waktu/ Time Series)*. Sering peneliti tertarik melihat tren dari suatu fenomena dari waktu ke waktu dalam jangka waktu yang relatif lama. Misalnya harga rata-rata barang perbulan dalam jangka waktu 2-3 tahun, biaya listrik ataupun tilpun perbulan selama 2-3 tahun. Analisis deret waktu (time series) berkembang cukup luas dan telah menjadi bidang kajian tersendiri yang banyak aplikasinya dalam bidang ekonomi (ekonometrik).
EKSPLORATIF (ANALISIS EKSPLORASI DATA)
Tidak semua analsis statistika bertujuan menguji atau meramal parameter. Ada beberapa analisis, umumnya untuk data multi variabel, lebih bersifat eksploratif dan hanya melaporkan hasil eksplorasi tanpa harus didahului oleh pendugaan parameter. Namun, analisis ini di sisi lain masih didasarkan atas asumsi bahwa respon yang diamati mengikuti sebaran normal. Beberapa analisis multivariat (peubah ganda) yang termasuk dalam kelompok ini diantaranya adalah analisis gerombol, analisi diskriminan, analisis komponen utama.
A. ANALIS KOMPONEN UTAMA
Analisis komponen utama (AKU) disebut juga PCA (Principal Components Analysis). Jika kita berhadapan dengan data yang memiliki sangat banyak variabel, sangat mungkin beberapa variabel yang ada saling berhubungan satu dengan lainnya sehingga jumlah variabel yang sangat banyak tersebut dapat direduksi menjadi beberapa komponen yang penting. Reduksi dimensi variabel ini sangat membantu dalam representasi grafik (yang umumnya berdimenasi 2 atau 3). Selain itu dalam analisis regresi penggunaan analisis komponen utama ini dapat menghindarkan adanya persoalan kondisi buruk akibat adanya matrik singuler atau mendekati singuler. Kondisi buruk akibat adanya matrik singuler atau mendekati singuler, dapat berakibat tidak konvergennya pendugaan parameter dalam analisis regresi, sehingga analisis regresi menjadi tidak menghasilkan estimasi atau menghasilkan estimasi yang sesungguhnya tidak benar.
ANALISIS GEROMBOL (CLUSTER ANALYSIS)*
Jika kita menghadapi populasi dengan sangat banyak atribut (misalnya potensi daerah suatu kabupaten yang terdiri atas banyak variabel potensi wilayah), kitamungkin ingin mengetahui pengelompokan wilayah atas dasar kedekatan potensi sehingga memudahkan pemerintah daerah membuat kebijakanyang sesuai dengan wilayah tersebut. Analisis untuk pengelompokkan seperti ini disebut analisis gerombol. Analisis gerombol ini ada yang bersifat hirarkis (bertingkat) ada juga yang tidak.
C. ANALISIS DISKRIMINAN
Berbeda dengan kondisi sebelumnya dimana pada dasarnya pengelompokkan belum ada dan peneliti ingin mengelompokkan suatu populasi menjadi beberapa kelompok yang relatif homogin. Dalam analisis diskriminan pengelompokan telah ada (misalnya jurusan pada suatu fakultas) dan tugas peneliti adalah merumuskan fungsi yang membedakan (diskriminan) masing-masing kelompok yang ada berdasarkan variabel-variabel yang dimiliki kelompok yang ada (misalnya dalam hal pengelompokan jurusan dapat dilihat nilai NEM, NilaiUjian SPMB atau Nilai IP Semester untuk bidang MIPA, Matematika, Fisika, Biologi, Kimia). Hal ini bermanfaat untuk melakukan pengelompokan ulang yang lebih sesuai atau pengelompokkan anggota baru ke dalam salah satu kelompok yang telah ada.
1.1.2 STATISTIKA NONPARAMETRIK
Statistika nonparametrik tidak didasarkan atas asumsi distribusi pada data. Oleh karena itu analisis ini sering disebut sebagai analisis statistika bebas distribusi (distribution free statistical anaysis). Kondisi ini biasanya diberlakukan pada data dengan ukuran kecil dan dengan skala pengukuran yang jauh dari skala interrval. Karena ukuran data yang kecil, ukuran pemusatan yang menjadi fokus tidak lagi rata-rata atau rerata, tetapi median.
1. UJI KELOMPOK SALING BEBAS
Uji ini bertujuan untuk menguji adanya beda median antara dua kelompok yang saling bebas. Uji ini ekuivalen dengan uji beda mean untuk kelompok saling bebas pada uji parametrik dengan menggunakan uji-Z atau uji-T. Ada dua uji nonparametrik (keduanya sesungguhnya ekuivalen) yang dapat dilakukan yaitu:
1. Uji U Man-Whitney
2. Uji Wilcoxon untuk kelompok saling bebas.
2. UJI KELOMPOK BERPASANGAN
Uji ini ekuivalen dengan uji-Z atau uji-T untuk sampel berpasangan pada uji parametrik. Bedanya terletak pada kondisi sebaran data yang juga terkait dengan sekala pengukuran data. Uji yang dapat dipergunakan adalah Uji Wilcoxon untuk data berpasangan.
3. UJI LEBIH DARI DUA KELOMPOK SALING BEBAS
Uji ini ekuivalen dengan uji ANAVA pada uju parametrik. Bedanya terletak pada kondisi sebaran data yang juga terkait dengan sekala pengukuran data. Uji yang dapat dipergunakan adalah uji H Kruskal-Walis.
4. KORELASI RANK SPEARMAN
Analisis ini ekuivalen dengan analsis korelasi produk momen untuk uji parametrik. Untuk uji nonparametrik, karena datanya pad a umumnya pada skala rank order, korelasi yang dihitung adalah korelasi rank dari Spearman.
1.1.3 METODE STATISTIKA BERBASIS SIMULASI
Pada dasarnya metode statistika berbasis simulasi ini diaplikasikan untuk data dengan ukuran relatif kecil, sehingga tidak cukup informasi untuk mengasumsikan distribusi pada data. Pada metode nonparametrik, perhitungan dilakukan berdasar ukuran pemusatan data yang sedikit yang umumnya merupakan sekala rank, sehingga memungkinkan dilakukan perhitungan secara manual. Metode statistika berbasis simulasi, merekonstruksi data artifisial dalam ukuran relatif besar dan sangat banyak sekali baik dengan cara resampling, yaitu mengambil sampel yang ada secara berulang-ulang (bootstrap) atau dengan merekonstruksi sampel baru dengan karakteristik yang sesuai (MCMC: Markov Chained Monte Carlo). Selanjutnya estimasi dan uji keseluruhan dilakukan berdasarkan informasi yang diperoleh estimasi pada masing-masing data simulasi tadi.
STRUKTUR MENU RCOMMANDER
Panel-----|-- Data set aktif
|-- Edit data set
|-- Lihat data set
|-- Model aktif
|-- Submit (Eksekusi)
Menu
Data ------|--Data set Baru
|--Impor data --------|--Dari Teks
|--Dari SPSS
|--Dari Minitab
|--Data pada R -------|--Daftar data
|--Data dari paket aktif
Statistika-|--Ringkasan ---------|--Data set aktif
|--Numerik
|--Matriks korelasi
|--Tabel kontingensi -|--Satu arah
|--Multi arah
|--Analisis dua arah
|--Proporsi ----------|--Sampel Tunggal
|--Sampel ganda
|--Variansi ----------|--Uji F beda variansi
|--Uji Bartlett
|--Uji Levene
|--Nonparametrik -----|--Uji Wilcoxon sampel tunggal
|--Uji Wilcoxon sampel ganda
|--Uji Kruskal Walis
|--Regresi -----------|--Regresi Sederhana
|--Model Linier
|--Model Linier Tergeneralisir
(GLM)
|--Uji Beda ----------|--Uji t sampel tunggal
|--Uji t sampel ganda
|--Uji t sampel berpasangan
|--Uji anava satu faktor
|--Uji anava multi faktor
|--Analisis ---------|--Reliabilitas skala
dimensional |--Analisis Komponen Utama
(RKU/PCA)
|--Analisis faktor
|--Analisis klaster
Grafik-----|--Grafik indeks
|--Histogram
|--Boxplot
|--QQplot
|--Diagram kuantil-kuantil
|--Diagram pencar
|--Matriks diagram Pencar
|--Grafik garis
|--Diagram rata-rata
|--Grafik batang
|--Grafik lingkaran
|--Grafik 3D
Distribusi-|--Distribusi Kontinu--|--Distribusi Normal
|--Distribusi t
|--Distribusi Chi-kwadrat
|--Distribusi Seragam
|-- ...
|--Distribusi Gumbel
-|--Distribusi Diskrit--|--Distribusi Binomial
|--Distribusi Poisson
|-- ...
|--Distribusi Hipergeometrik
Alat ------|--Aktifkan paket
|--Aktifkan Plug-in
|--Pilihan
Bantuan ---|--Bantuan Commander
|--Pengantar RCommander
|--Bantuan data (jika ada)
|--Tentang Rcmdr
Tidak ada komentar:
Posting Komentar