Hitung jumlah kuadrat (SSE)

Pengarang: Charles Brown
Tanggal Pembuatan: 9 Februari 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
DATA MINING !!! Jumlah kuadrat galat, SSE, MSE, dan MAPE
Video: DATA MINING !!! Jumlah kuadrat galat, SSE, MSE, dan MAPE

Isi

Jumlah kuadrat, atau SSE, adalah kalkulasi statistik awal yang mengarah ke nilai data yang berbeda. Saat Anda memiliki sekumpulan nilai data, akan berguna untuk dapat menentukan seberapa dekat keterkaitan nilai-nilai ini. Anda harus mengatur data Anda dalam tabel dan kemudian melakukan penghitungan yang cukup sederhana. Setelah Anda menemukan SSE untuk kumpulan data, Anda kemudian dapat menemukan varians dan deviasi standar.

Melangkah

Metode 1 dari 3: Hitung SSE dengan tangan

  1. Buat tabel tiga kolom. Cara paling jelas untuk menghitung SSE adalah memulai dengan tabel tiga kolom. Beri label pada tiga kolom Nilai{ displaystyle { text {Nilai}}}Isi detailnya. Kolom pertama berisi nilai pengukuran Anda. Isi kolomnya Nilai{ displaystyle { text {Nilai}}}Hitung meannya. Sebelum Anda dapat menghitung kesalahan untuk setiap pengukuran, Anda harus menghitung mean dari seluruh kumpulan data.
    • Rata-rata kumpulan data adalah jumlah nilai dibagi dengan jumlah nilai dalam kumpulan. Ini dapat direpresentasikan secara simbolis, dengan variabel μ{ displaystyle mu}Hitung nilai kesalahan individu. Di kolom kedua tabel Anda, Anda harus memasukkan nilai kesalahan untuk setiap nilai data. Kesalahannya adalah perbedaan antara pengukuran dan rata-rata.
      • Untuk kumpulan data tertentu, kurangi mean, 98,87, dari setiap nilai terukur dan isi kolom kedua dengan hasilnya. Sepuluh perhitungan ini adalah sebagai berikut:
        • 99,098,87=0,13{ displaystyle 99,0-98,87 = 0,13}Hitung SSE. Di kolom ketiga tabel, temukan kuadrat dari setiap nilai yang dihasilkan di kolom tengah. Ini mewakili kuadrat penyimpangan dari mean untuk setiap nilai data yang diukur.
          • Untuk setiap nilai di kolom tengah, gunakan kalkulator untuk menghitung kuadrat. Catat hasilnya di kolom ketiga, sebagai berikut:
            • 0,132=0,0169{ displaystyle 0,13 ^ {2} = 0,0169}Tambahkan kuadrat kesalahan. Langkah terakhir adalah menemukan jumlah nilai di kolom ketiga. Hasil yang diinginkan adalah SSE, atau jumlah kuadrat kesalahan.
              • Untuk kumpulan data ini, SSE dihitung dengan menambahkan sepuluh nilai di kolom ketiga:
              • S.S.E=6,921{ displaystyle SSE = 6,921}Beri label kolom pada spreadsheet. Anda membuat tabel dengan tiga kolom di Excel, dengan tiga judul yang sama seperti di atas.
                • Di sel A1, ketik "Nilai" sebagai tajuk.
                • Di kotak B1, ketik "Deviasi" sebagai tajuk.
                • Di kotak C1, ketik "Deviasi kuadrat" sebagai judul.
              • Masukkan detail Anda. Di kolom pertama Anda harus memasukkan nilai pengukuran Anda. Jika set kecil, Anda dapat dengan mudah mengetiknya dengan tangan. Jika Anda memiliki kumpulan data yang besar, Anda mungkin perlu menyalin dan menempelkan data ke dalam kolom.
              • Tentukan rata-rata titik data. Excel memiliki fungsi yang menghitung rata-rata untuk Anda. Di sel kosong di bawah tabel data Anda (tidak masalah sel mana yang Anda pilih), masukkan berikut ini:
                • = Rata-rata (A2: ___)
                • Jangan masukkan spasi kosong. Isi ruang itu dengan nama sel titik data terakhir Anda. Misalnya, jika Anda memiliki 100 titik data, Anda akan menggunakan fungsi:
                  • = Rata-rata (A2: A101)
                  • Fungsi ini berisi data dari sel A2 hingga A101, karena baris atas berisi judul kolom.
                • Saat Anda menekan Enter atau saat Anda mengklik ke sel lain dalam tabel, sel yang baru diprogram secara otomatis diisi dengan rata-rata nilai data Anda.
              • Masukkan fungsi untuk pengukuran kesalahan. Di sel kosong pertama di kolom "Deviasi", masukkan fungsi untuk menghitung perbedaan antara setiap titik data dan mean. Untuk melakukan ini, gunakan nama sel tempat mean berada. Anggaplah Anda telah menggunakan sel A104 untuk saat ini.
                • Fungsi penghitungan kesalahan yang Anda masukkan di sel B2 adalah:
                  • = A2- $ A $ 104. Tanda dolar diperlukan untuk memastikan Anda mengunci kotak A104 untuk perhitungan apa pun.
              • Masukkan fungsi untuk kesalahan kuadrat. Di kolom ketiga, Anda dapat menginstruksikan Excel untuk menghitung kuadrat yang diinginkan.
                • Di sel C2, masukkan fungsi berikut:
                  • = B2 ^ 2
              • Salin fungsi untuk mengisi seluruh tabel. Setelah memasukkan fungsi di sel atas setiap kolom, masing-masing B2 dan C2, Anda perlu mengisi seluruh tabel. Anda dapat mengetik ulang fungsi tersebut di baris mana pun pada tabel, tetapi ini akan memakan waktu terlalu lama. Dengan menggunakan mouse Anda, sorot sel B2 dan C2 bersamaan, dan tanpa melepaskan tombol mouse, seret ke sel paling bawah dari setiap kolom.
                • Dengan asumsi Anda memiliki 100 titik data di tabel Anda, seret mouse Anda ke sel B101 dan C101.
                • Saat Anda melepaskan tombol mouse, rumus disalin ke semua sel tabel. Tabel harus secara otomatis diisi dengan nilai yang dihitung.
              • Temukan SSE. Kolom C tabel Anda berisi semua nilai kesalahan kuadrat. Langkah terakhir adalah membiarkan Excel menghitung jumlah dari nilai-nilai ini.
                • Dalam sel di bawah tabel, mungkin C102 dalam contoh ini, masukkan fungsi berikut:
                  • = Jumlah (C2: C101)
                • Jika Anda mengklik Enter atau mengklik di sel lain dari tabel, Anda akan mendapatkan nilai SSE dari data Anda.

Metode 3 dari 3: Hubungkan SSE dengan statistik lain

  1. Hitung deviasi dari SSE. Menemukan SSE untuk kumpulan data umumnya merupakan blok bangunan untuk menemukan nilai lain yang lebih berguna. Yang pertama adalah varians. Varians adalah ukuran seberapa besar data yang diukur menyimpang dari mean. Ini sebenarnya adalah mean dari perbedaan kuadrat dari mean.
    • Karena SSE adalah jumlah dari kesalahan kuadrat, Anda dapat mencari mean (yaitu varians) hanya dengan membaginya dengan jumlah nilai. Namun, jika Anda menghitung varians dari rangkaian sampel, bukan seluruh populasi, Anda membagi varians dengan (n-1), bukan dengan n. Begitu:
      • Varians = SSE / n, jika Anda menghitung varians dari seluruh populasi.
      • Varians = SSE / (n-1), saat menghitung varians sampel data.
    • Untuk masalah pengambilan sampel suhu pasien, kita dapat mengasumsikan bahwa 10 pasien hanyalah sampel. Oleh karena itu, varians dihitung sebagai berikut:
      • Perbedaan=SSE(n1){ displaystyle { text {Varians}} = { frac { text {SSE}} {(n-1)}}}Hitung deviasi standar SSE. Simpangan baku adalah nilai yang umum digunakan yang menunjukkan seberapa jauh nilai suatu kumpulan data menyimpang dari rata-rata. Simpangan baku adalah akar kuadrat dari varians. Ingatlah bahwa varians adalah mean dari pengukuran kesalahan kuadrat.
        • Oleh karena itu, setelah menghitung SSE, Anda dapat menemukan deviasi standar seperti ini:
          • Simpangan baku=SSEn1{ displaystyle { text {Simpangan baku}} = { sqrt { frac { text {SSE}} {n-1}}}}Gunakan SSE untuk menentukan kovarian. Artikel ini berfokus pada kumpulan data yang hanya mengukur satu nilai dalam satu waktu. Namun, dalam banyak penelitian Anda dapat membandingkan dua nilai yang berbeda. Misalnya, Anda ingin mengetahui bagaimana kedua nilai tersebut berhubungan satu sama lain, tidak hanya dengan mean kumpulan data. Nilai ini adalah kovarians.
            • Perhitungan kovarian terlalu rinci untuk dijelaskan di sini, kecuali untuk dicatat bahwa Anda akan menggunakan SSE untuk setiap tipe data dan kemudian membandingkannya. Untuk penjelasan lebih rinci tentang kovarian dan perhitungan yang terlibat, Anda dapat menemukan artikel tentang topik ini di wikiHow.
            • Sebagai contoh penggunaan kovarians, Anda dapat membandingkan usia pasien dalam penelitian medis dengan efektivitas suatu obat dalam menurunkan suhu demam. Kemudian Anda memiliki satu kumpulan data usia dan satu kumpulan data suhu kedua. Anda kemudian akan menemukan SSE untuk setiap kumpulan data, dan dari sana varians, deviasi standar, dan kovarian.