Regression i Excel är ett sätt att automatisera den statistiska processen att jämföra flera uppsättningar information för att se hur förändringar i oberoende variabler påverkar förändringar i beroende variabler. Om du någonsin har velat hitta en korrelation mellan två saker är att använda regressionsanalys i Excel ett av de bästa sätten att göra det.
Instruktionerna i den här artikeln gäller Excel 2019, Excel 2016, Excel 2013, Excel 2010.
Vad är meningen med regression?
Regression är en statistisk modelleringsmetod som analytiker använder för att fastställa samband mellan flera variabler.
Regressionsanalys börjar med en enda variabel du försöker analysera och oberoende variabler du testar för att se om de påverkar den enskilda variabeln. Analysen tittar på förändringar i de oberoende variablerna och försöker korrelera dessa förändringar med resulterande förändringar i den enda (beroende) variabeln.
Det här kan låta som avancerad statistik, men Excel gör denna komplexa analys tillgänglig för alla.
Utför linjär regression i Excel
Den enklaste formen av regressionsanalys är linjär regression. Enkel linjär regression tittar på sambandet mellan endast två variabler.
Till exempel visar följande kalkylblad data som innehåller antalet kalorier en person åt varje dag och deras vikt den dagen.
Eftersom det här kalkylarket innehåller två kolumner med data, och en variabel potentiellt kan påverka den andra, kan du köra en regressionsanalys på denna data med hjälp av Excel.
Enabling Analysis ToolPak-tillägg
Innan du kan använda Excels regressionsanalysfunktion måste du aktivera Analysis ToolPak-tillägget på skärmen med Excel- alternativ.
-
I Excel, välj menyn File och välj Options.
-
Välj Add-ins i den vänstra navigeringsmenyn. Se sedan till att Excel-tillägg är v alt i fältet Manage.
-
Slutligen, välj Go-knappen.
-
I popup-fönstret för tillägg. Aktivera Analysis ToolPack genom att klicka på rutan framför det för att lägga till en bock och välj OK.
Nu när Analysis ToolPak är aktiverat är du redo att börja göra regressionsanalys i Excel.
Hur man utför enkel linjär regression i Excel
Med hjälp av kalkylarket vikt och kalorier som exempel kan du utföra en linjär regressionsanalys i Excel enligt följande.
-
Välj menyn Data. Välj sedan Dataanalys i gruppen Analysis.
-
I fönstret Data Analysis, välj Regression från listan och klicka på OK.
-
Input Y-intervall är cellintervallet som innehåller den beroende variabeln. I det här exemplet är det vikten. Input X Range är intervallet av celler som innehåller den oberoende variabeln. I det här exemplet är det kalorikolumnen.
-
Välj Etiketter för rubrikcellerna och välj sedan New Worksheet för att skicka resultaten till ett nytt kalkylblad. Välj OK för att låta Excel köra analysen och skicka resultaten till ett nytt ark.
-
Undersök det nya arbetsbladet. Analysresultatet har ett antal värden som du behöver förstå för att tolka resultaten.
Var och en av dessa siffror har följande betydelser:
- Multiple R: Korrelationskoefficienten. 1 indikerar en stark korrelation mellan de två variablerna, medan -1 betyder att det finns ett starkt negativt samband. 0 betyder att det inte finns någon korrelation.
- R Square: Bestämningskoefficienten, som visar hur många punkter mellan de två variablerna som faller på regressionslinjen. Statistiskt sett är detta summan av kvadrerade avvikelser från medelvärdet.
- Adjusted R Square: Ett statistiskt värde som kallas R-kvadrat som är justerat för antalet oberoende variabler du har v alt.
- Standard Error: Hur exakta regressionsanalysresultaten är. Om det här felet är litet är dina regressionsresultat mer exakta.
- Observations: Antalet observationer i din regressionsmodell.
De återstående värdena i regressionsutgången ger dig information om mindre komponenter i regressionsanalysen.
- df: Statistiskt värde känt som frihetsgrader relaterat till varianskällorna.
- SS: Summan av kvadrater. Förhållandet mellan restsumman av kvadrater kontra total SS bör vara mindre om de flesta av dina data passar regressionslinjen.
- MS: Medelkvadrat för regressionsdata.
- F: F-statistiken (F-test) för nollhypotes. Detta ger regressionsmodellens betydelse.
- Significance F: Statistiskt värde känt som P-värdet för F.
Om du inte förstår statistik och beräknande regressionsmodeller kommer värdena längst ner i sammanfattningen inte att ha någon större betydelse. Men Multiple R och R Square är de två viktigaste.
Som du kan se har kalorier i det här exemplet en stark korrelation till totalvikten.
Multipel linjär regressionsanalys i Excel
För att utföra samma linjära regression men med flera oberoende variabler, välj hela intervallet (flera kolumner och rader) för Input X Range.
När du väljer flera oberoende variabler är det mindre troligt att du hittar en lika stark korrelation eftersom det finns så många variabler.
Men en regressionsanalys i Excel kan hjälpa dig att hitta korrelationer med en eller flera av de variabler som du kanske inte inser existerar bara genom att granska data manuellt.