Innhold
En av de vanligste metodene som brukes i statistikk for å studere data er korrelasjonsanalyse, som kan brukes til å bestemme innflytelsen av en størrelse på en annen. La oss se hvordan denne analysen kan utføres i Excel.
Formål med korrelasjonsanalyse
Korrelasjonsanalyse lar deg finne avhengigheten til en indikator av en annen, og hvis den blir funnet, beregne korrelasjonskoeffisient (grad av forhold), som kan ta verdier fra -1 til +1:
- hvis koeffisienten er negativ, er avhengigheten invers, dvs. at en økning i en verdi fører til en reduksjon i den andre og omvendt.
- hvis koeffisienten er positiv, er avhengigheten direkte, dvs. at en økning i en indikator fører til en økning i den andre og omvendt.
Styrken på avhengigheten bestemmes av modulen til korrelasjonskoeffisienten. Jo større verdien er, desto sterkere påvirker endringen i en verdi den andre. Ut fra dette, med en null koeffisient, kan det hevdes at det ikke er noen sammenheng.
Utføre korrelasjonsanalyse
For å lære og bedre forstå korrelasjonsanalyse, la oss prøve den for tabellen nedenfor.
Her er dataene om gjennomsnittlig daglig temperatur og gjennomsnittlig luftfuktighet for månedene i året. Vår oppgave er å finne ut om det er en sammenheng mellom disse parameterne og i så fall hvor sterk.
Metode 1: Bruk CORREL-funksjonen
Excel har en spesiell funksjon som lar deg lage en korrelasjonsanalyse – CORREL. Syntaksen ser slik ut:
КОРРЕЛ(массив1;массив2).
Prosedyren for å jobbe med dette verktøyet er som følger:
- Vi kommer opp i en ledig celle i tabellen der vi planlegger å beregne korrelasjonskoeffisienten. Klikk deretter på ikonet "fx (Sett inn funksjon)" til venstre for formellinjen.
- Velg en kategori i det åpnede funksjonsinnsettingsvinduet "Statistisk" (eller “Full alfabetisk liste”), blant de foreslåtte alternativene vi noterer oss "CORREL" og klikk OK.
- Funksjonsargumentvinduet vil vises på skjermen med markøren i det første feltet motsatt "Array 1". Her indikerer vi koordinatene til cellene i den første kolonnen (uten tabelloverskriften), hvis data må analyseres (i vårt tilfelle, B2:B13). Du kan gjøre dette manuelt ved å skrive inn de ønskede tegnene ved hjelp av tastaturet. Du kan også velge ønsket område direkte i selve tabellen ved å holde nede venstre museknapp. Så går vi videre til det andre argumentet "Array 2", ganske enkelt ved å klikke i det aktuelle feltet eller ved å trykke på tasten Tab. Her indikerer vi koordinatene til celleområdet i den andre analyserte kolonnen (i tabellen vår er dette C2:C13). Klikk når du er klar OK.
- Vi får korrelasjonskoeffisienten i cellen med funksjonen. Betydning "-0,63" indikerer et moderat sterkt omvendt forhold mellom de analyserte dataene.
Metode 2: Bruk "Analysis Toolkit"
En alternativ måte å utføre korrelasjonsanalyse på er å bruke "Pakkeanalyse", som først må aktiveres. For dette:
- Gå til menyen "fil".
- Velg et element fra listen til venstre "Parametere".
- Klikk på underseksjonen i vinduet som vises “Tillegg”. Deretter i høyre del av vinduet helt nederst for parameteren "Kontroll" Velg "Excel-tillegg" og klikk "Gå".
- Merk av i vinduet som åpnes "Analysepakke" og bekreft handlingen ved å trykke på knappen OK.
Alt er klart, "Analysepakke" aktivert. Nå kan vi gå videre til hovedoppgaven vår:
- Trykk på knappen "Dataanalyse", som er i fanen "Data".
- Et vindu vises med en liste over tilgjengelige analysealternativer. Vi feirer "Sammenheng" og klikk OK.
- Et vindu vises på skjermen der du må spesifisere følgende parametere:
- "Inndataintervall". Vi velger hele spekteret av analyserte celler (det vil si begge kolonnene på en gang, og ikke en om gangen, slik tilfellet var i metoden beskrevet ovenfor).
- "Grupper". Det er to alternativer å velge mellom: etter kolonner og rader. I vårt tilfelle er det første alternativet egnet, fordi. slik er de analyserte dataene plassert i tabellen. Hvis overskrifter er inkludert i det valgte området, merk av i boksen ved siden av "Etiketter i første linje".
- "Utdataalternativer". Du kan velge et alternativ "Utgangsintervall", i dette tilfellet vil resultatene av analysen bli satt inn på gjeldende ark (du må spesifisere adressen til cellen som resultatene skal vises fra). Det er også foreslått å vise resultatene på et nytt ark eller i en ny bok (dataene vil bli satt inn helt i begynnelsen, dvs. fra cellen (A1). Som et eksempel går vi "Nytt regneark" (valgt som standard).
- Når alt er klart, klikk OK.
- Vi får samme korrelasjonskoeffisient som i den første metoden. Dette tyder på at vi i begge tilfeller gjorde alt riktig.
konklusjonen
Derfor er det å utføre korrelasjonsanalyse i Excel en ganske automatisert og lett å lære. Alt du trenger å vite er hvor du finner og hvordan du setter opp det nødvendige verktøyet, og i tilfelle "løsningspakke", hvordan aktivere den, hvis den ikke allerede var aktivert i programinnstillingene før.