Laske kovarianssi

Kirjoittaja: Judy Howell
Luomispäivä: 2 Heinäkuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
Kahden muuttujan yhteisjakauma, korrelaatio
Video: Kahden muuttujan yhteisjakauma, korrelaatio

Sisältö

Kovarianssi on tilastollinen laskelma kahden tietojoukon välisen suhteen lisäämiseksi. Oletetaan esimerkiksi, että antropologit tutkivat väestön pituutta ja painoa tietyssä kulttuurissa. Kutakin tutkittavaa henkilöä kohden pituus ja paino voidaan näyttää tietoparilla (x, y). Näitä arvoja voidaan käyttää vakiokaavassa kovarianssisuhteen laskemiseksi. Tässä artikkelissa selitetään ensin laskelmat tietojoukon kovarianssin määrittämiseksi. Seuraavaksi käsitellään kahta muuta automaattista tapaa määrittää tulos.

Astua

Menetelmä 1/4: Laske kovarianssi käsin käyttäen standardikaavaa

  1. Opi kovarianssikaava ja sen osat. Kovarianssin laskemisen vakiokaava on Σ(XiXkeskim)(yiykeskim)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Rakenna tietotaulukko. Ennen kuin aloitat, on hyödyllistä kerätä tietojasi. Luo taulukko, joka koostuu viidestä sarakkeesta. Sinun on ilmoitettava jokainen sarake seuraavasti:
    • X{ displaystyle x}Laske x datapisteen keskiarvo. Tämä esimerkkitietojoukko sisältää 9 numeroa. Löydät keskiarvon lisäämällä ne yhteen ja jakamalla summa 9: llä. Tulokseksi saadaan 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Kun jaat tämän 9: llä, saat keskiarvon. 4.89. Tätä arvoa käytetään x: nä (keskiarvo) tulevissa laskelmissa.
    • Laske y-datapisteiden keskiarvo. Tämän y-sarakkeen on myös koostuttava 9 datapisteestä, jotka ovat yhtäpitäviä x-datapisteen kanssa. Määritä näiden keskiarvo. Tämän näytetietojoukon arvoksi tulee 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Jaa tämä summa 9: llä, jolloin saadaan keskiarvo 5,44. Käytät arvoa 5.44 y (keskiarvo) -arvona tulevissa laskelmissa.
    • Laske arvot (XiXkeskim){ displaystyle (x_ {i} -x _ { text {avg}})}Laske arvot (yiykeskim){ displaystyle (y_ {i} -y _ { text {avg}})}Laske kunkin tietorivin tuotteet. Täytät viimeisen sarakkeen rivit kertomalla lasketut numerot kahdessa edellisessä sarakkeessa (XiXkeskim){ displaystyle (x_ {i} -x _ { text {avg}})}Etsi arvojen summa viimeisestä sarakkeesta. Tässä tulee symboli Σ. Kun olet tehnyt kaikki tähän mennessä tehdyt laskelmat, lisää tulokset yhteen. Tämän esimerkkitietojoukon viimeisessä sarakkeessa pitäisi nyt olla yhdeksän arvoa. Lisää nämä yhdeksän numeroa yhteen. Kiinnitä huomiota siihen, onko luku positiivinen vai negatiivinen.
      • Tämän näytetietojoukon summan tulisi olla -64,57. Kirjoita tämä summa sarakkeen alaosaan. Tämä on kovarianssivakion kaavan osoittajan arvo.
    • Laske kovarianssikaavan nimittäjä. Kovarianssivakiokaavan osoittaja on juuri laskemasi arvo. Nimittäjää edustaa (n-1), ja se on yksi pienempi kuin tietojoukon dataparien määrä.
      • Tässä esimerkkitehtävässä on yhdeksän dataparia, joten n on 9. Siksi (n-1): n arvo on yhtä suuri kuin 8.
    • Jaa osoittaja nimittäjällä. Kovarianssin laskemisen viimeinen vaihe on jakaa osoitin, Σ(XiXkeskim)(yiykeskim){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Huomaa, mitä toistuvia laskelmia on. Kovarianssi on laskelma, joka sinun on tehtävä käsin muutaman kerran, jotta ymmärrät tuloksen merkityksen. Jos kuitenkin aiot käyttää kovarianssia rutiininomaisesti tietojen tulkinnassa, tarvitset nopeamman ja automatisoidun tavan saada tulokset. Tähän mennessä olet ehkä huomannut, että suhteellisen pienen, vain yhdeksän dataparin sisältämän tietojoukkomme kanssa laskelmat koostuivat kahdesta keskiarvosta, kahdeksantoista erillisestä vähennyslaskusta, yhdeksästä kertolaskusta, yhdestä yhteenlaskusta ja lopuksi toisesta jaosta. Se on 31 suhteellisen pientä laskutoimitusta ratkaisun löytämiseksi. Matkan varrella saatat menettää negatiivisia merkkejä tai kopioida tulokset väärin, joten vastaus ei ole enää oikea.
    • Luo kovarianssin laskentataulukko. Jos tunnet Excelin (tai muun laskentaohjelman), voit helposti luoda taulukon kovarianssin määrittämiseksi. Merkitse viiden sarakkeen otsikot samalla tavalla kuin teit käsin laskutoimituksia varten: x, y, (x (i) -x (avg)), (y (i) -y (avg)) ja Product.
      • Nimeämisen yksinkertaistamiseksi soita kolmannelle sarakkeelle esimerkiksi "x ero" ja neljäs sarake "y ero", kunhan muistat tietojen merkityksen.
      • Jos taulukko alkaa laskentataulukon vasemmassa yläkulmassa, solu A1 merkitään x: llä, kun taas muut tarrat jatkavat soluun E1.
    • Syötä datapisteet. Syötä tietoarvot kahteen sarakkeeseen x ja y. Muista, että datapisteiden järjestyksellä on merkitystä, joten sinun on sovitettava jokainen y vastaavaan arvoon x.
      • X-arvot alkavat solusta A2 ja jatkavat tarvitsemasi tietopisteiden määrään saakka.
      • Y-arvot alkavat solusta B2 ja jatkavat tarvitsemasi määrän datapisteitä.
    • Määritä x- ja y-arvojen keskiarvot. Excel laskee keskiarvot sinulle nopeasti. Kirjoita kunkin tietosarakkeen alapuolelle ensimmäiseen tyhjään soluun kaava = AVERAGE (A2: A ___). Täytä tyhjä tila viimeisen datapistettä vastaavan solun numerolla.
      • Jos sinulla on esimerkiksi 100 datapistettä, solut A2 - A101 täytetään, joten soluun kirjoitat = AVERAGE (A2: A101).
      • Kirjoita y-tietoihin kaava = AVERAGE (B2: B101).
      • Muista, että kaava Excelissä alkaa "=" - merkillä.
    • Kirjoita sarakkeen kaava (x (i) -x (keskim.)). Syötä soluun C2 kaava ensimmäisen vähennyksen laskemiseksi. Tästä kaavasta tulee: = A2 -___. Täytä tyhjä tila solun osoitteella, joka sisältää x-datan keskiarvon.
      • Esimerkiksi 100 datapisteestä keskiarvo on solussa A103, joten kaavastasi tulee: = A2-A103.
    • Toista datapisteiden kaava (y (i) -y (avg)). Samaa esimerkkiä noudattaen se siirtyy soluun D2. Kaavasta tulee: = B2-B103.
    • Kirjoita Tuote-sarakkeen kaava. Kirjoita viidenteen sarakkeeseen soluun E2 kaava kahden edellisen solun tuloksen laskemiseksi. Tästä tulee sitten: = C2 * D2.
    • Kopioi kaavat taulukon täyttämiseksi. Tähän asti olet ohjelmoinut vain muutaman ensimmäisen datapisteen riville 2. Merkitse hiirellä solut C2, D2 ja E2. Aseta kohdistin pieneen laatikkoon oikeassa alakulmassa, kunnes plusmerkki tulee näkyviin. Laajenna valintaa ja täytä koko tietotaulukko napsauttamalla ja pitämällä hiiren painiketta painettuna ja vetämällä hiirtä alas. Tämä vaihe kopioi automaattisesti kolme kaavaa soluista C2, D2 ja E2 koko taulukkoon. Taulukko tulee täyttää automaattisesti kaikilla laskelmilla.
    • Ohjelmoi viimeisen sarakkeen summa. Tarvitset Tuote-sarakkeessa olevien tuotteiden summan. Kirjoita tyhjään soluun kyseisen sarakkeen viimeisen datapisteen alapuolelle kaava: = SUM (E2: E ___). Täytä tyhjä tila viimeisen datapisteen soluosoitteella.
      • 100 datapistettä sisältävässä esimerkissä tämä kaava menee soluun E103. Tyyppi: = SUMMA (E2: E102).
    • Määritä kovarianssi. Voit myös antaa Excelin suorittaa lopullisen laskelman puolestasi. Viimeinen laskelma solussa E103 esimerkissämme edustaa kovarianssikaavan osoitinta. Kirjoita heti tämän solun alle kaava: = E103 / ___. Täytä tyhjä tila tietopisteiden määrällä. Esimerkissämme tämä on 100. Tulos on tietojen kovarianssi.

Tapa 3/4: Kovarianssilaskurien käyttäminen verkossa

  1. Hae verkossa kovarianssilaskimia. Eri kouluilla, yrityksillä tai muilla lähteillä on verkkosivustoja, jotka laskevat kovarianssiarvot sinulle helposti. Käytä hakutermiä "kovarianssilaskin" hakukoneessa.
  2. Anna tietosi. Lue verkkosivuston ohjeet huolellisesti varmistaaksesi, että syötät tiedot oikein. On tärkeää, että tietoparejasi pidetään järjestyksessä, muuten syntyvä tulos on väärä kovarianssi. Verkkosivustoilla on erilainen tyyli tietojen syöttämiseen.
    • Esimerkiksi verkkosivustolla http://ncalculators.com/statistics/covariance-calculator.htm on vaakasuora ruutu x-arvojen syöttämistä varten ja toinen vaakaruutu y-arvojen syöttämistä varten. Sinun on annettava tietosi pilkuilla erotettuna. Siksi tässä artikkelissa aiemmin laskettu x-datajoukko tulisi sitten kirjoittaa 1,3,2,5,8,7,12,2,4. Y-tiedot muodossa 8,6,9,4,3,3,2,7,7.
    • Toisella sivustolla, https://www.thecalculator.co/math/Covariance-Calculator-705.html, sinua pyydetään syöttämään x-tiedot ensimmäiseen ruutuun. Tiedot syötetään pystysuunnassa, yksi kohde riviä kohden. Siksi tämän sivuston merkintä näyttää tältä:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Laske tulokset. Näiden online-laskelmien houkutteleva asia on, että tietojen syöttämisen jälkeen sinun on vain napsautettava "Laske" -painiketta ja tulokset näkyvät automaattisesti. Useimmat sivustot tarjoavat välilaskelmat x (avg), y (avg) ja n.

Menetelmä 4/4: Kovarianssin tulosten tulkinta

  1. Etsi positiivinen tai negatiivinen suhde. Kovarianssi on yksi tilastollinen luku, joka osoittaa yhden tietojoukon ja toisen välisen suhteen. Johdannossa mainitussa esimerkissä mitataan korkeus ja paino. Voit odottaa, että ihmisten kasvaessa myös heidän painonsa kasvaa, mikä johtaa positiiviseen kovarianssinäkökulmaan. Toinen esimerkki: Oletetaan, että kerätään tietoja, jotka osoittavat, kuinka monta tuntia joku harrastaa golfia ja minkä pisteet hän saavuttaa. Tässä tapauksessa odotat negatiivista kovarianssia, mikä tarkoittaa, että kun harjoitustuntien määrä kasvaa, golfpisteet laskevat. (Golfissa matalampi pisteet on parempi).
    • Harkitse edellä laskettua näytetietojoukkoa. Tuloksena oleva kovarianssi on -8,07. Miinusmerkki tarkoittaa, että kun x-arvot kasvavat, y-arvot yleensä pienenevät. Voit nähdä, että tämä on totta tarkastelemalla joitain arvoja. Esimerkiksi x-arvot 1 ja 2 vastaavat y-arvoja 7, 8 ja 9. x-arvot 8 ja 12 on kytketty vastaavasti y-arvoihin 3 ja 2. .
  2. Tulkitse kovarianssin suuruus. Jos kovarianssipisteiden määrä on suuri, joko suuri positiivinen luku tai suuri negatiivinen luku, voit tulkita tämän kahdeksi vahvasti toisiinsa kytketyksi tietoelementiksi joko positiivisella tai negatiivisella tavalla.
    • Näytetietojoukon kovarianssi -8,07 on melko suuri. Huomaa, että tiedot vaihtelevat välillä 1 - 12. Joten 8 on melko suuri luku. Tämä osoittaa melko vahvan suhteen datajoukkojen x ja y välillä.
  3. Ymmärtää suhteen puute. Jos tulos on kovarianssi, joka on yhtä suuri tai hyvin lähellä nollaa, voit päätellä, että datapisteet eivät liity toisiinsa. Toisin sanoen yhden arvon kasvu voi, mutta ei tarvitse johtaa arvon nousuun. Nämä kaksi termiä liittyvät toisiinsa lähes satunnaisesti.
    • Oletetaan, että suhteutat kengän koot kokeen arvosanoihin. Koska on niin paljon tekijöitä, jotka vaikuttavat opiskelijan tenttipisteisiin, kovarianssiarvon voidaan odottaa olevan lähellä nollaa. Tämä osoittaa, että näiden kahden arvon välillä ei ole miltei mitään yhteyttä.
  4. Tarkastele suhdetta graafisesti. Kovarianssin visuaalisen ymmärtämisen voi piirtää datapisteesi x, y-käyrään. Kun teet sen, sinun pitäisi nähdä melko helposti, että pisteet, vaikka ne eivät olekaan suorassa linjassa, pyrkivät lähestymään klusteria lävistäjänä ylhäältä vasemmalta alhaalta oikealle. Tämä on kuvaus negatiivisesta kovarianssista. Voit myös nähdä, että kovarianssin arvo on -8,07. Tämä on melko suuri määrä datapisteisiin verrattuna. Suuri määrä viittaa siihen, että kovarianssi on melko voimakas, minkä voit päätellä datapisteiden lineaarisesta muodosta.
    • Voit käydä tämän läpi lukemalla artikkeleita pisteiden piirtämisestä wikiHow: n koordinaattijärjestelmässä.

Varoitukset

  • Kovarianssia on rajoitetusti sovellettu tilastoihin. Se on usein askel kohti korrelaatiokertoimien tai muiden käsitteiden laskemista. Ole varovainen kovarianssipisteisiin perustuvien liian rohkeiden tulkintojen suhteen.