Panduan lengkap uji validitas (CVR, CITC, AVE, CR) dan reliabilitas (Cronbach Alpha) — disertai tabel interpretasi, step-by-step prosedur, dan template kalimat pelaporan siap pakai.
Sebelum menganalisis data, pastikan instrumen Anda benar-benar mengukur apa yang seharusnya diukur. Ini fondasi dari seluruh penelitian Anda.
Validitas adalah sejauh mana instrumen (kuesioner, skala, tes) benar-benar mengukur konstruk yang ingin diukur. Instrumen yang valid artinya item-item di dalamnya relevan, tepat, dan merepresentasikan konsep yang diteliti.
Butir soal "Saya merasa pekerjaan saya bermakna" → mengukur kepuasan kerja intrinsik dengan tepat.
Butir soal "Gaji saya mencukupi" digunakan untuk mengukur motivasi intrinsik — mengukur hal yang salah.
Reliabilitas adalah konsistensi pengukuran. Instrumen yang reliabel akan menghasilkan skor yang sama (atau hampir sama) jika digunakan pada kondisi yang setara. Reliabilitas tidak menjamin validitas, tapi validitas mensyaratkan reliabilitas.
Apakah item-item mencakup seluruh domain/dimensi konstruk secara representatif? Dinilai oleh panel ahli. Diukur dengan Content Validity Ratio (CVR) dan Content Validity Index (CVI).
Apakah item-item berkorelasi kuat dengan konstruk laten yang ingin diukur? Dinilai dari data empiris responden. Diukur melalui CITC (corrected item-total correlation), AVE, dan CR.
Bukti bahwa indikator dari konstruk yang sama berkorelasi tinggi satu sama lain. Ditunjukkan oleh AVE ≥ 0.50 dan factor loading ≥ 0.50.
Bukti bahwa konstruk yang berbeda tidak terlalu berkorelasi. Ditunjukkan oleh √AVE > korelasi antar konstruk (kriteria Fornell-Larcker).
Dilakukan sebelum kuesioner disebarkan ke responden. Melibatkan panel ahli (subject matter expert) untuk menilai relevansi setiap butir.
CVR (Content Validity Ratio) dikembangkan oleh Lawshe (1975) untuk mengkuantifikasi penilaian panel ahli terhadap relevansi setiap item instrumen. Setiap ahli diminta menjawab apakah item "penting/esensial", "berguna tapi tidak esensial", atau "tidak perlu".
Di mana: n_e = jumlah ahli yang menilai "esensial", N = total jumlah ahli panel.
Nilai CVR harus memenuhi nilai minimum berikut agar item dinyatakan valid secara isi (p < .05, one-tailed):
| Jumlah Ahli (N) | Nilai CVR Minimum | Keputusan |
|---|---|---|
| 5 | 0.99 | Butuhkan hampir semua setuju |
| 6 | 0.99 | Hampir semua setuju |
| 7 | 0.99 | Hampir semua setuju |
| 8 | 0.75 | 6 dari 8 ahli setuju |
| 9 | 0.78 | 7 dari 9 ahli setuju |
| 10 | 0.62 | 8 dari 10 ahli setuju |
| 12 | 0.56 | 10 dari 12 ahli setuju |
| 15 | 0.49 | 11 dari 15 ahli setuju |
| 20 | 0.42 | 15 dari 20 ahli setuju |
| 40 | 0.29 | 25 dari 40 ahli setuju |
Setelah CVR per-item dihitung, CVI (Content Validity Index) dihitung sebagai rata-rata CVR seluruh item. Ini menggambarkan kualitas instrumen secara keseluruhan.
| Nilai CVI | Interpretasi | Rekomendasi |
|---|---|---|
| CVI ≥ 0.90 | Sangat Baik | Instrumen siap digunakan |
| 0.80 ≤ CVI < 0.90 | Baik | Revisi minor sebelum digunakan |
| CVI < 0.80 | Tidak Memadai | Revisi substansial atau ganti item |
Misal panel terdiri dari 8 ahli (N=8). Item X1 dinilai esensial oleh 7 ahli (n_e = 7):
Nilai CVR = 0.75 ≥ 0.75 (nilai minimum untuk N=8) → Item dinyatakan VALID secara isi ✓
Dilakukan pada data empiris (setelah kuesioner disebarkan). Menguji apakah setiap item benar-benar mengukur konstruk yang dituju.
CITC (sering disebut juga item-rest correlation atau nilai r dalam output SPSS) mengukur korelasi antara satu item dengan total skor instrumen setelah item tersebut dikeluarkan. Ini adalah cara paling umum untuk uji validitas konstruk pada penelitian sosial berbasis skripsi/tesis.
| Nilai CITC (r) | Interpretasi | Keputusan Item |
|---|---|---|
| r ≥ 0.30 | Valid | Pertahankan item |
| 0.25 ≤ r < 0.30 | Marginal | Revisi wording item, coba lagi |
| r < 0.25 (atau < 0.20) | Tidak Valid | Buang item (drop) |
AVE mengukur seberapa besar varians indikator yang dapat dijelaskan oleh konstruk laten. Digunakan dalam analisis berbasis SEM / SmartPLS / CFA. Nilai AVE didapat dari factor loadings masing-masing indikator.
λ = factor loading (standardized) masing-masing indikator
| Nilai AVE | Interpretasi | Keputusan |
|---|---|---|
| AVE ≥ 0.50 | Convergent Validity Terpenuhi | Konstruk valid, lebih banyak varians dijelaskan oleh konstruk daripada error |
| AVE < 0.50 | Convergent Validity Tidak Terpenuhi | Indikator terlalu lemah; pertimbangkan menghapus item dengan loading rendah |
CR (atau Construct Reliability / Rho_c) adalah alternatif Cronbach Alpha yang lebih akurat untuk model CFA/SEM karena memperhitungkan factor loading masing-masing indikator (tidak mengasumsikan semua indikator memiliki bobot sama).
| Nilai CR | Interpretasi | Kesimpulan |
|---|---|---|
| CR ≥ 0.70 | Reliabilitas Komposit Baik | Konstruk reliabel — gunakan dalam analisis SEM/PLS |
| 0.60 ≤ CR < 0.70 | Dapat Diterima (Eksploratori) | Masih dapat digunakan untuk penelitian eksploratori |
| CR < 0.60 | Tidak Memadai | Revisi instrumen, tambah indikator |
Untuk memastikan konstruk yang berbeda benar-benar mengukur hal yang berbeda, gunakan kriteria Fornell-Larcker:
Cronbach Alpha (α) adalah indeks konsistensi internal yang paling banyak digunakan dalam penelitian sosial. Berikut panduan lengkapnya.
Cronbach Alpha mengukur rata-rata korelasi antar seluruh pasangan item dalam instrumen, lalu mengestimasi konsistensi internal secara keseluruhan.
k = jumlah item | σ²_i = varians tiap item | σ²_total = varians total skor
Berikut tabel interpretasi yang paling umum digunakan dalam penelitian sosial Indonesia (mengacu pada George & Mallery, 2003 dan Nunnally, 1978):
| Nilai Alpha (α) | Tingkat Reliabilitas | Rekomendasi Penggunaan |
|---|---|---|
| α ≥ 0.90 | Sangat Tinggi / Sempurna | Excellent — siap digunakan untuk penelitian klinis/kesehatan dan skripsi |
| 0.80 ≤ α < 0.90 | Tinggi / Baik | Good — memenuhi standar penelitian akademik dengan baik |
| 0.70 ≤ α < 0.80 | Cukup / Dapat Diterima | Acceptable — standar minimum untuk penelitian sosial dan skripsi |
| 0.60 ≤ α < 0.70 | Kurang / Dipertanyakan | Questionable — hanya diterima untuk penelitian eksploratori awal |
| 0.50 ≤ α < 0.60 | Rendah / Tidak Dapat Diterima | Poor — revisi instrumen disarankan |
| α < 0.50 | Sangat Rendah / Ditolak | Unacceptable — instrumen harus dirancang ulang |
Item-item mengukur konstruk yang sama dan unidimensional. Semua item memiliki skala yang sama (misal: semua Likert 1–5).
Alpha sangat dipengaruhi jumlah item — makin banyak item, makin tinggi alpha. Alpha tinggi belum tentu valid!
| Kondisi | Gunakan | Alasan |
|---|---|---|
| Analisis skala sederhana (SPSS) | Cronbach Alpha | Tersedia di semua software, mudah dilaporkan |
| SEM / CFA / SmartPLS | CR (Composite Reliability) | Lebih akurat karena mempertimbangkan loading berbeda-beda |
| Penelitian skripsi/tesis umum | Cronbach Alpha | Standar baku di Indonesia, diterima semua penguji |
| Jurnal internasional (SEM) | CR + AVE | Standar pelaporan untuk model measurement |
Panduan lengkap dari awal hingga laporan: cara menjalankan uji validitas dan reliabilitas menggunakan SPSS, Python, atau SmartPLS.
Pastikan setiap item instrumen memiliki kolom tersendiri (X1, X2, X3, …, Xk). Skala harus numerik. Reverse item harus sudah di-recode sebelum analisis.
Klik Analyze → Scale → Reliability Analysis. Pindahkan semua item konstruk ke kotak "Items". Pastikan Model = Alpha.
Klik tombol Statistics. Centang: Item, Scale, Scale if item deleted. Klik Continue → OK. Output utama: Cronbach Alpha dan tabel Item-Total Statistics.
Ini adalah nilai CITC. Item dengan nilai r < 0.30 → hapus. Setelah menghapus item, ulangi analisis hingga semua item memenuhi kriteria.
Setelah item-item tidak valid dibuang, baca nilai Reliability Statistics → Cronbach's Alpha. Nilai ≥ 0.70 → instrumen reliabel. Catat nilai ini untuk dilaporkan di Bab 3.
Di SmartPLS: buat outer model dengan semua indikator mengarah ke konstruk latennya. Di AMOS: buat CFA diagram dengan setiap indikator terhubung ke konstruk.
SmartPLS: klik Calculate → PLS Algorithm. AMOS: klik tombol Calculate estimates. Dapatkan nilai outer loading (standardized factor loading) untuk setiap indikator.
Indikator dengan loading < 0.50 → pertimbangkan untuk dihapus. Indikator dengan loading 0.50–0.70 → masih dapat diterima jika AVE ≥ 0.50. Loading > 0.70 → ideal.
SmartPLS otomatis menampilkan AVE dan Composite Reliability di tabel Construct Reliability and Validity. AMOS: hitung manual dari output standardized loading. Targetkan AVE ≥ 0.50 dan CR ≥ 0.70.
SmartPLS: Lihat tabel Discriminant Validity → Fornell-Larcker Criterion. Pastikan nilai diagonal (√AVE) lebih besar dari semua nilai di baris/kolom yang sama.
| Uji | Indikator | Nilai Minimum | Keputusan jika Tidak Terpenuhi |
|---|---|---|---|
| Content Validity | CVR per item | ≥ nilai kritis Lawshe (N ahli) | Revisi/hapus item |
| Content Validity | CVI instrumen | ≥ 0.80 | Revisi substansial instrumen |
| Construct Validity (SPSS) | CITC (r) | ≥ 0.30 | Hapus item, ulangi analisis |
| Construct Validity (SEM) | Factor Loading (λ) | ≥ 0.50 | Hapus indikator lemah |
| Convergent Validity | AVE | ≥ 0.50 | Hapus indikator loading rendah |
| Discriminant Validity | √AVE vs r antar-konstruk | √AVE > r | Periksa multikolinearitas konstruk |
| Reliabilitas (SPSS) | Cronbach Alpha (α) | ≥ 0.70 | Revisi item, hapus yang melemahkan alpha |
| Reliabilitas (SEM) | Composite Reliability (CR) | ≥ 0.70 | Tambah/perbaiki indikator |
Kalimat siap pakai untuk Bab 3 (Metodologi) dan Bab 4 (Hasil) skripsi/tesis Anda. Ganti bagian yang dicetak tebal sesuai hasil analisis.
Lawshe, C. H. (1975). A quantitative approach to content validity. Personnel Psychology, 28(4), 563–575.
Nunnally, J. C. (1978). Psychometric theory (2nd ed.). McGraw-Hill.
George, D., & Mallery, P. (2003). SPSS for Windows. Pearson.
Fornell, C., & Larcker, D. F. (1981). Evaluating structural equation models. Journal of Marketing Research, 18(1), 39–50.
Hair, J. F., et al. (2019). Multivariate Data Analysis (8th ed.). Cengage.
Hair, J. F., et al. (2021). A Primer on PLS-SEM. Sage.
Setelah memahami teori validitas dan reliabilitas, langkah selanjutnya adalah menjalankan analisisnya. Tidak perlu instal SPSS atau belajar coding dari nol.
Ruang Statistika menyediakan 30+ modul analisis statistik berbasis Python yang dapat diakses langsung dari browser — gratis untuk modul esensial.
Tidak perlu instal SPSS, Python, atau R. Cukup upload data Excel/CSV dan analisis langsung berjalan.
Hasil analisis disajikan dalam tabel terformat rapi dan interpretasi otomatis yang siap masuk ke Bab 3 dan Bab 4 skripsi.
Setiap hasil diinterpretasikan otomatis oleh AI dalam Bahasa Indonesia akademis — format skripsi Indonesia atau APA 7th.
Stuck di analisis? Konsultasi langsung dengan Yogo via WhatsApp untuk panduan metodologi dan interpretasi hasil.
30+ modul analisis statistik berbasis Python, langsung dari browser. Tidak perlu instalasi apapun.
🌐 Buka Ruang StatistikaStatistisi Ahli · Demografer · Founder Ruang Statistika
Yogo Aryo Jatmiko adalah seorang Statistisi Ahli di Badan Pusat Statistik (BPS) Indonesia dengan lebih dari 10 tahun pengalaman di bidang statistik populasi dan demografi. Ia juga merupakan Dosen Demografi di Politeknik Statistika STIS, lembaga kedinasan di bawah BPS.
Sebagai peneliti aktif dengan lebih dari 8 publikasi jurnal, Yogo memiliki keahlian mendalam dalam analisis data kependudukan, proyeksi penduduk, dan pemodelan statistik lanjutan. Ia terlibat langsung dalam Tim Proyeksi Penduduk SP2020 dan berbagai proyek strategis BPS. Dikenal sebagai pembicara webinar nasional, termasuk sesi analisis data JASP dan AI untuk 500+ peserta dari berbagai universitas di Indonesia.
Regresi, SEM, CFA, Mediasi, Moderasi, ANOVA
Life Table, Proyeksi Penduduk, Kohort-Komponen
ARIMA, Regresi Bayesian, SAE-HB
SPSS, R/RStudio, Python, AMOS, SmartPLS, JASP, Stata
LinkedIn · ResearchGate · ORCID · Google Scholar