Cara Menghitung Varians

Pengarang: Robert Simon
Tanggal Pembuatan: 21 Juni 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
Menentukan Variansi atau Menghitung Variansi Suatu Data Tunggal Dengan Cepat dan Benar
Video: Menentukan Variansi atau Menghitung Variansi Suatu Data Tunggal Dengan Cepat dan Benar

Isi

Varians mengukur penyebaran kumpulan data. Ini sangat berguna dalam membangun model statistik: varians rendah dapat menjadi indikasi bahwa Anda mendeskripsikan kesalahan atau gangguan acak alih-alih hubungan yang mendasari dalam data. Dengan artikel ini, wikiHow mengajari Anda cara menghitung varians.

Langkah

Metode 1 dari 2: Hitung varians sampel

  1. Tulis kumpulan data sampel Anda. Dalam kebanyakan kasus, ahli statistik hanya memiliki informasi tentang sampel, atau bagian dari populasi yang mereka pelajari. Misalnya, daripada melakukan analisis umum tentang "harga setiap mobil di Jerman", seorang ahli statistik mungkin menemukan biaya sampel acak dari beberapa ribu mobil. Ahli statistik dapat menggunakan sampel ini untuk mendapatkan perkiraan yang tepat tentang harga mobil di Jerman. Namun, angka tersebut kemungkinan besar tidak akan sama persis dengan angka yang sebenarnya.
    • Sebagai contoh: Saat menganalisis jumlah muffin yang dijual per hari di kedai kopi, Anda mengambil sampel enam hari secara acak dan mendapatkan hasil sebagai berikut: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. Ini adalah sampel, bukan populasi, karena Anda tidak memiliki data setiap hari toko buka.
    • Jika setiap Poin data di master, silakan pergi ke metode di bawah ini.

  2. Tuliskan rumus varians sampel. Varians dari kumpulan data menunjukkan tingkat penyebaran titik data. Semakin dekat varians ke nol, semakin dekat titik data yang dikelompokkan. Saat bekerja dengan kumpulan data sampel, gunakan rumus berikut untuk menghitung varians:
    • = /(n - 1)
    • adalah varians. Varians selalu dihitung dalam satuan kuadrat.
    • mewakili nilai dalam kumpulan data Anda.
    • ∑, yang berarti "jumlah", memberi tahu Anda untuk menghitung parameter berikut untuk setiap nilai, lalu menjumlahkannya.
    • x̅ adalah mean sampel.
    • n adalah jumlah titik data.

  3. Hitung mean sampel. Simbol x̅ atau "x-horizontal" digunakan untuk menunjukkan mean sampel. Hitung seperti yang Anda lakukan pada rata-rata: jumlahkan semua titik data dan bagi dengan jumlah titik.
    • Sebagai contoh: Pertama, tambahkan poin data Anda: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Selanjutnya, bagi hasilnya dengan jumlah titik data, dalam contoh ini enam: 84 ÷ 6 = 14.
      Rata-rata sampel = x̅ = 14.
    • Anda dapat menganggap mean sebagai "titik pusat" dari data. Jika data dipusatkan di sekitar mean, variansnya rendah. Jika mereka tersebar jauh dari mean, variansnya tinggi.

  4. Kurangi mean dari setiap titik data. Sekarang saatnya menghitung - x̅, di mana setiap titik dalam kumpulan data Anda adalah. Setiap hasil akan menunjukkan penyimpangan dari rata-rata setiap titik yang sesuai, atau sederhananya, jarak dari titik tersebut ke rata-rata.
    • Sebagai contoh:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Sangat mudah untuk mengecek perhitungan anda, karena hasilnya harus berjumlah nol, hal ini karena menurut definisi mean, hasil negatif (jarak dari mean ke angka kecil). hasil positif (jarak dari rata-rata ke angka yang lebih besar) sepenuhnya dihilangkan
  5. Kuadratkan semua hasil. Seperti disebutkan di atas, daftar deviasi saat ini (- x̅) memiliki jumlah nol, yang berarti "deviasi rata-rata" juga akan selalu nol dan tidak ada yang dapat dikatakan tentang penyebaran data. Untuk mengatasi masalah ini, kami mencari kuadrat dari setiap deviasi. Berkat itu, semua bilangan positif, nilai negatif dan nilai positif tidak lagi saling meniadakan dan memberikan jumlah nol.
    • Sebagai contoh:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Anda sekarang memiliki (- x̅) untuk setiap titik data dalam sampel.
  6. Temukan jumlah nilai kuadrat. Sekarang adalah waktu untuk menghitung seluruh pembilang rumus tersebut: ∑. Cyclo besar, ∑, mengharuskan Anda menambahkan nilai elemen berikut untuk setiap nilai. Anda telah menghitung (- x̅) untuk setiap nilai dalam sampel, jadi yang perlu Anda lakukan hanyalah menjumlahkan hasilnya.
    • Sebagai contoh: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Bagilah dengan n - 1, di mana n adalah jumlah titik data. Dahulu kala, saat menghitung varians sampel, ahli statistik hanya membagi n. Pembagian tersebut akan menghasilkan rata-rata deviasi kuadrat, yang sama persis dengan varians sampel tersebut. Akan tetapi, perlu diingat bahwa sampel hanyalah perkiraan dari populasi yang lebih besar. Jika Anda mengambil sampel acak lain dan melakukan perhitungan yang sama, Anda akan mendapatkan hasil yang berbeda. Ternyata, membagi dengan n -1 alih-alih n memberi Anda perkiraan yang lebih baik untuk varians dari populasi yang lebih besar - yang benar-benar Anda pedulikan. Koreksi ini sangat umum sehingga sekarang definisi varians sampel yang diterima.
    • Sebagai contoh: Ada enam titik data dalam sampel, jadi n = 6.
      Varians sampel = 33,2
  8. Pahami varians dan deviasi standar. Perhatikan bahwa, karena ada pangkat dalam rumus, varians diukur dalam kuadrat dari unit data asli. Ini membingungkan secara visual. Sebaliknya, sering kali deviasi standar cukup berguna. Tetapi tidak ada gunanya membuang-buang usaha, karena deviasi standar ditentukan oleh akar kuadrat dari varians. Itulah sebabnya varians sampel ditulis dalam istilah, dan deviasi standar sampel adalah.
    • Misalnya, standar deviasi sampel di atas = s = √33.2 = 5.76.
    iklan

Metode 2 dari 2: Hitung varians suatu populasi

  1. Dimulai dengan kumpulan data master. Istilah "populasi" digunakan untuk merujuk pada semua observasi yang relevan. Misalnya, jika Anda meneliti usia penduduk Hanoi, keseluruhan populasi Anda akan mencakup usia semua orang yang tinggal di Hanoi. Biasanya Anda akan membuat spreadsheet untuk kumpulan data besar seperti ini, tetapi berikut ini contoh kumpulan data yang lebih kecil:
    • Sebagai contoh: Di dalam ruangan sebuah akuarium, tepatnya ada enam akuarium. Enam tangki ini berisi jumlah ikan berikut:





  2. Tuliskan rumus untuk varian keseluruhan. Karena populasi berisi semua data yang kita butuhkan, rumus ini memberi kita varian yang tepat dari populasi tersebut. Untuk membedakannya dari varians sampel (yang hanya merupakan perkiraan), ahli statistik menggunakan variabel lain:
    • σ = /n
    • σ = varians sampel. Ini adalah sosis yang biasanya berbentuk kotak. Varians diukur dalam satuan kuadrat.
    • merepresentasikan elemen dalam kumpulan data Anda.
    • Elemen dalam ∑ dihitung untuk setiap nilai, lalu dijumlahkan.
    • μ adalah rata-rata keseluruhan.
    • n adalah jumlah titik data dalam populasi.
  3. Temukan mean dari populasi. Saat menganalisis populasi, simbol μ ("mu") mewakili mean aritmatika. Untuk mencari mean, jumlahkan semua titik data, lalu bagi dengan jumlah titik.
    • Anda dapat menganggap mean sebagai "rata-rata", tetapi berhati-hatilah, karena kata itu memiliki banyak definisi matematika.
    • Sebagai contoh: nilai rata-rata = μ = = 10,5
  4. Kurangi mean dari setiap titik data. Poin data yang lebih dekat ke mean memiliki perbedaan yang mendekati nol. Ulangi masalah pengurangan untuk semua titik data, dan Anda mungkin akan mulai merasakan penyebaran data.
    • Sebagai contoh:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Persegi setiap tanda. Pada tahap ini, beberapa hasil yang diperoleh dari langkah sebelumnya akan negatif dan beberapa akan positif.Jika Anda memvisualisasikan data pada garis isomorfik, kedua item ini mewakili angka di kiri dan kanan mean. Ini tidak akan berguna dalam menghitung varians, karena kedua kelompok ini akan saling meniadakan. Sebaliknya, kuadratkan semuanya sehingga semuanya positif.
    • Sebagai contoh:
      (- μ) untuk setiap nilai saya berjalan dari 1 sampai 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Temukan rata-rata hasil Anda. Anda sekarang memiliki nilai untuk setiap titik data, terkait (tidak secara langsung) dengan seberapa jauh titik data tersebut dari mean. Rata-rata dengan menjumlahkannya dan membaginya dengan jumlah nilai yang Anda miliki.
    • Sebagai contoh:
      Varians keseluruhan = 24,25
  7. Hubungi resep. Jika Anda tidak yakin bagaimana rumus ini cocok dengan rumus yang diuraikan di awal metode, tuliskan seluruh soal dengan tangan, dan jangan menyingkat:
    • Setelah mencari selisih mean dan kuadrat, Anda punya (- μ), (- μ), dan seterusnya sampai (- μ), di mana titik data terakhir. di kumpulan data.
    • Untuk mencari rata-rata dari nilai-nilai ini, jumlahkan keduanya dan bagi dengan n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Setelah menulis ulang pembilang dengan notasi sigmoid, Anda memiliki /n, varian rumus.
    iklan

Nasihat

  • Karena varians sulit untuk diinterpretasikan, nilai ini sering dihitung sebagai titik awal untuk mencari simpangan baku.
  • Menggunakan "n-1" sebagai ganti "n" di penyebut adalah teknik yang disebut koreksi Bessel. Sampel hanyalah perkiraan dari populasi lengkap, dan rata-rata sampel memiliki bias tertentu untuk mencocokkan perkiraan itu. Koreksi ini menghilangkan bias di atas. Ini menyangkut fakta bahwa setelah n - 1 titik data telah dicacah, maka titik terakhir n adalah konstanta, karena hanya nilai tertentu yang digunakan untuk menghitung mean sampel (x̅) dalam rumus varians.