Tapoja laskea varianssi

Kirjoittaja: Robert Simon
Luomispäivä: 21 Kesäkuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
Keskihajonta
Video: Keskihajonta

Sisältö

Varianssi mittaa tietojoukon leviämistä. Se on erittäin hyödyllinen tilastollisten mallien rakentamisessa: pieni varianssi voi olla osoitus siitä, että kuvaat satunnaisvirhettä tai melua tietojen taustalla olevan suhteen sijasta. Tämän artikkelin avulla wikiHow opettaa sinulle varianssin laskemisen.

Askeleet

Menetelmä 1/2: Laske näytteen varianssi

  1. Kirjoita näytetietojoukko. Useimmissa tapauksissa tilastotieteilijöillä on tietoa vain otoksesta tai tutkittavan väestön osajoukosta. Esimerkiksi sen sijaan, että tekisi yleisen analyysin "kaikkien autojen kustannuksista Saksassa", tilastotieteilijä saattaa löytää muutaman tuhannen auton satunnaisotoksen kustannukset. Tilastotieteilijä voi käyttää tätä otosta saadakseen hyvän arvion Saksan autokustannuksista. On kuitenkin todennäköisempää, että se ei vastaa tarkalleen todellisia lukuja.
    • Esimerkiksi: Analysoidessasi päivittäin kahvilassa myytävien muffinien määrää otit satunnaisen kuuden päivän näytteen ja saat seuraavat tulokset: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. Tämä on näyte, ei populaatio, koska sinulla ei ole tietoja päivästä, jolloin kauppa on auki.
    • Jos joka Datapisteet masterissa, siirry alla olevaan menetelmään.

  2. Kirjoita näyte-varianssikaava. Tietojoukon varianssi osoittaa datapisteiden hajonta-asteen. Mitä lähempänä varianssi on nolla, sitä lähempänä datapisteet on ryhmitelty. Kun työskentelet näytetietojoukkojen kanssa, käytä seuraavaa kaavaa varianssin laskemiseen:
    • = /(n - 1)
    • on varianssi. Varianssi lasketaan aina neliöyksikköinä.
    • edustaa arvoa tietojoukossa.
    • Sum, joka tarkoittaa "summa", kehottaa sinua laskemaan seuraavat parametrit kullekin arvolle ja lisäämään ne sitten yhteen.
    • x̅ on näytteen keskiarvo.
    • n on datapisteiden lukumäärä.

  3. Laske näytteen keskiarvo. Symbolia x̅ tai "x-horizontal" käytetään osoittamaan näytteen keskiarvo. Laske kuten keskimäärin: lisää kaikki datapisteet ja jaa se pisteiden lukumäärällä.
    • Esimerkiksi: Lisää ensin datapisteet: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Jaa seuraavaksi tulos datapisteiden lukumäärällä, tässä tapauksessa kuusi: 84 ÷ 6 = 14.
      Näytteen keskiarvo = x̅ = 14.
    • Voit ajatella keskiarvoa tietojen "keskipisteenä". Jos tiedot keskitetään keskiarvon ympärille, varianssi on pieni. Jos ne ovat hajallaan kaukana keskiarvosta, varianssi on suuri.

  4. Vähennä keskiarvo kustakin datapisteestä. Nyt on aika laskea - x̅, missä tietojoukon kukin piste on. Jokainen tulos osoittaa poikkeaman kunkin vastaavan pisteen keskiarvosta tai yksinkertaisesti sanottuna etäisyyden siitä keskiarvoon.
    • Esimerkiksi:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x = 7-14 = -7
      - x = 9 - 14 = -5
      - x = 13-14 = -1
    • Laskelmiesi tarkistaminen on erittäin helppoa, koska tulosten on oltava nollia, koska keskiarvon keskiarvolla negatiiviset tulokset (etäisyys keskiarvosta pieniin lukuihin). positiiviset tulokset (etäisyys keskiarvosta suurempaan lukuun) eliminoidaan kokonaan.
  5. Neliö kaikki tulokset. Kuten yllä todettiin, nykyisellä poikkeamaluettelolla (- x̅) on summa nolla. Tämä tarkoittaa, että "keskimääräinen poikkeama" on myös aina nolla, eikä tiedon hajonnasta voida sanoa mitään. Tämän ongelman ratkaisemiseksi löydämme kunkin poikkeaman neliön. Tämän seurauksena kaikki ovat positiivisia lukuja, negatiiviset ja positiiviset arvot eivät enää peruuta toisiaan ja antavat summalle nollan.
    • Esimerkiksi:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Sinulla on nyt (- x̅) jokaiselle näytteen datapisteelle.
  6. Etsi neliöarvojen summa. Nyt on aika laskea kaavan koko osoitin: ∑. Suuri syklo, ∑, edellyttää, että lisäät jokaiselle arvolle seuraavan elementin arvon. Olet laskenut (- x̅) jokaiselle otoksen arvolle, joten sinun tarvitsee vain lisätä tulokset yhteen.
    • Esimerkiksi: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Jaa n - 1: llä, missä n on datapisteiden lukumäärä. Kauan sitten otosvarianssin laskemisessa tilastotieteilijät jaettiin vain n: llä. Tämä jako antaa sinulle neliöpoikkeaman keskiarvon, joka vastaa tarkalleen kyseisen näytteen varianssia. Muista kuitenkin, että otos on vain arvio suuremmasta populaatiosta. Jos otat toisen satunnaisotoksen ja teet saman laskelman, saat toisenlaisen tuloksen. Kuten käy ilmi, jakamalla n -1: llä n: n sijasta saat paremman arvion suuremman väestön varianssista - josta todella välität. Tämä korjaus on niin yleistä, että se on nyt hyväksytty määritelmä otosvarianssista.
    • Esimerkiksi: Otoksessa on kuusi datapistettä, joten n = 6.
      Näytteen varianssi = 33,2
  8. Ymmärrä varianssi ja keskihajonta. Huomaa, että koska kaavassa on voimia, varianssi mitataan alkuperäisten tietojen yksikköjen neliössä. Tämä on visuaalisesti hämmentävää. Sen sijaan usein keskihajonta on varsin hyödyllinen. Mutta ei ole mitään syytä tuhlata vaivaa, koska keskihajonta määräytyy varianssin neliöjuurella. Siksi otosvarianssi kirjoitetaan termeinä, ja näytteen keskihajonta on.
    • Esimerkiksi yllä olevan näytteen keskihajonta = s = √33,2 = 5,76.
    mainos

Menetelmä 2/2: Laske populaation varianssi

  1. Aloitetaan perustietojoukosta. Termiä "populaatio" käytetään viittaamaan kaikkiin asiaankuuluviin havaintoihin. Jos esimerkiksi tutkit Hanoin asukkaiden ikää, koko väestösi sisältää kaikkien Hanoissa asuvien ihmisten iät. Yleensä luot taulukon tällaiselle suurelle tietojoukolle, mutta tässä on pienempi esimerkkitietojoukko:
    • Esimerkiksi: Akvaarion huoneessa on täsmälleen kuusi akvaariota. Nämä kuusi säiliötä sisältävät seuraavan määrän kaloja:





  2. Kirjoita yleisen varianssin kaava. Koska populaatio sisältää kaikki tarvitsemamme tiedot, tämä kaava antaa meille populaation tarkan varianssin. Erottaakseen sen otosvarianssista (joka on vain arvio), tilastotieteilijät käyttävät muita muuttujia:
    • σ = /n
    • σ = näytteen varianssi. Tämä on normaalisti neliönmuotoinen makkara. Varianssi mitataan neliöyksikköinä.
    • edustaa tietojoukon elementtiä.
    • Elementti ∑: ssä lasketaan jokaiselle arvolle ja lasketaan yhteen.
    • μ on kokonaiskeskiarvo.
    • n on tietopisteiden määrä populaatiossa.
  3. Selvitä väestön keskiarvo. Kun analysoidaan populaatiota, symboli μ ("mu") edustaa aritmeettista keskiarvoa. Löydä keskiarvo laskemalla yhteen kaikki datapisteet ja jakamalla sitten pisteiden lukumäärä.
    • Voit ajatella tarkoittavan "keskimääräiseksi", mutta ole varovainen, koska sanalla on monia matemaattisia määritelmiä.
    • Esimerkiksi: keskiarvo = μ = = 10,5
  4. Vähennä keskiarvo kustakin datapisteestä. Lähempänä keskiarvoa olevilla datapisteillä on ero lähempänä nollaa. Toista vähennysongelma kaikille datapisteille, ja alat todennäköisesti tuntea datan hajaantumisen.
    • Esimerkiksi:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Neliö jokainen merkki. Tässä vaiheessa jotkut edellisestä vaiheesta saadut tulokset ovat negatiivisia ja jotkut positiivisia.Jos tiedot on tarkoitus visualisoida isometrisellä viivalla, nämä kaksi kohtaa edustavat keskiarvon vasemmalla ja oikealla puolella olevia lukuja. Tästä ei olisi hyötyä varianssin laskemisessa, koska nämä kaksi ryhmää estäisivät toisensa. Sen sijaan neliö ne kaikki, jotta ne kaikki ovat positiivisia.
    • Esimerkiksi:
      (- μ) jokaiselle arvolle i kestää välillä 1-6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Löydä tulostesi keskiarvo. Sinulla on nyt arvo jokaiselle datapisteelle, joka liittyy (ei suoraan) siihen, kuinka kaukana kyseinen datapiste on keskiarvosta. Keskiarvo lisäämällä ne yhteen ja jakamalla arvojen lukumäärällä.
    • Esimerkiksi:
      Kokonaisvarianssi = 24,25
  7. Yhteystiedot resepti. Jos et ole varma, kuinka tämä sopii menetelmän alussa hahmoteltuun kaavaan, kirjoita koko ongelma muistiin käsin äläkä lyhennä:
    • Kun olet löytänyt erotuksen keskiarvosta ja neliöittämisestä, saat (- μ), (- μ) ja niin edelleen, kunnes (- μ), missä on viimeinen datapiste. tietojoukossa.
    • Löydät näiden arvojen keskiarvon lisäämällä ne yhteen ja jakamalla n: llä: ((- μ) + (- μ) + ... + (- μ)) / n
    • Kun olet kirjoittanut osoittajan sigmoidimerkinnällä, sinulla on /n, kaavan varianssi.
    mainos

Neuvoja

  • Koska varianssia on vaikea tulkita, tämä arvo lasketaan usein lähtökohtana keskihajonnan löytämiselle.
  • "N-1": n käyttö nimikkeen "n" sijasta on tekniikka, jota kutsutaan Besselin korjaukseksi. Otos on vain arvio täydestä populaatiosta, ja otoksen keskiarvolla on tietty puolueellisuus vastaamaan tätä estimaattia. Tämä korjaus eliminoi yllä olevan harhaa. Se koskee sitä, että kun n - 1 datapistettä on lueteltu, viimeinen piste n oli vakio, koska varianssikaavassa näytteen keskiarvon (x̅) laskemiseen käytettiin vain tiettyjä arvoja.