Hur man kör regression i Excel

Innehållsförteckning:

Hur man kör regression i Excel
Hur man kör regression i Excel
Anonim

Regression i Excel är ett sätt att automatisera den statistiska processen att jämföra flera uppsättningar information för att se hur förändringar i oberoende variabler påverkar förändringar i beroende variabler. Om du någonsin har velat hitta en korrelation mellan två saker är att använda regressionsanalys i Excel ett av de bästa sätten att göra det.

Instruktionerna i den här artikeln gäller Excel 2019, Excel 2016, Excel 2013, Excel 2010.

Vad är meningen med regression?

Regression är en statistisk modelleringsmetod som analytiker använder för att fastställa samband mellan flera variabler.

Regressionsanalys börjar med en enda variabel du försöker analysera och oberoende variabler du testar för att se om de påverkar den enskilda variabeln. Analysen tittar på förändringar i de oberoende variablerna och försöker korrelera dessa förändringar med resulterande förändringar i den enda (beroende) variabeln.

Det här kan låta som avancerad statistik, men Excel gör denna komplexa analys tillgänglig för alla.

Utför linjär regression i Excel

Den enklaste formen av regressionsanalys är linjär regression. Enkel linjär regression tittar på sambandet mellan endast två variabler.

Till exempel visar följande kalkylblad data som innehåller antalet kalorier en person åt varje dag och deras vikt den dagen.

Image
Image

Eftersom det här kalkylarket innehåller två kolumner med data, och en variabel potentiellt kan påverka den andra, kan du köra en regressionsanalys på denna data med hjälp av Excel.

Enabling Analysis ToolPak-tillägg

Innan du kan använda Excels regressionsanalysfunktion måste du aktivera Analysis ToolPak-tillägget på skärmen med Excel- alternativ.

  1. I Excel, välj menyn File och välj Options.

    Image
    Image
  2. Välj Add-ins i den vänstra navigeringsmenyn. Se sedan till att Excel-tillägg är v alt i fältet Manage.

    Image
    Image
  3. Slutligen, välj Go-knappen.

    Image
    Image
  4. I popup-fönstret för tillägg. Aktivera Analysis ToolPack genom att klicka på rutan framför det för att lägga till en bock och välj OK.

    Image
    Image

Nu när Analysis ToolPak är aktiverat är du redo att börja göra regressionsanalys i Excel.

Hur man utför enkel linjär regression i Excel

Med hjälp av kalkylarket vikt och kalorier som exempel kan du utföra en linjär regressionsanalys i Excel enligt följande.

  1. Välj menyn Data. Välj sedan Dataanalys i gruppen Analysis.

    Image
    Image
  2. I fönstret Data Analysis, välj Regression från listan och klicka på OK.

    Image
    Image
  3. Input Y-intervall är cellintervallet som innehåller den beroende variabeln. I det här exemplet är det vikten. Input X Range är intervallet av celler som innehåller den oberoende variabeln. I det här exemplet är det kalorikolumnen.

    Image
    Image
  4. Välj Etiketter för rubrikcellerna och välj sedan New Worksheet för att skicka resultaten till ett nytt kalkylblad. Välj OK för att låta Excel köra analysen och skicka resultaten till ett nytt ark.

    Image
    Image
  5. Undersök det nya arbetsbladet. Analysresultatet har ett antal värden som du behöver förstå för att tolka resultaten.

    Image
    Image

    Var och en av dessa siffror har följande betydelser:

    • Multiple R: Korrelationskoefficienten. 1 indikerar en stark korrelation mellan de två variablerna, medan -1 betyder att det finns ett starkt negativt samband. 0 betyder att det inte finns någon korrelation.
    • R Square: Bestämningskoefficienten, som visar hur många punkter mellan de två variablerna som faller på regressionslinjen. Statistiskt sett är detta summan av kvadrerade avvikelser från medelvärdet.
    • Adjusted R Square: Ett statistiskt värde som kallas R-kvadrat som är justerat för antalet oberoende variabler du har v alt.
    • Standard Error: Hur exakta regressionsanalysresultaten är. Om det här felet är litet är dina regressionsresultat mer exakta.
    • Observations: Antalet observationer i din regressionsmodell.

    De återstående värdena i regressionsutgången ger dig information om mindre komponenter i regressionsanalysen.

    • df: Statistiskt värde känt som frihetsgrader relaterat till varianskällorna.
    • SS: Summan av kvadrater. Förhållandet mellan restsumman av kvadrater kontra total SS bör vara mindre om de flesta av dina data passar regressionslinjen.
    • MS: Medelkvadrat för regressionsdata.
    • F: F-statistiken (F-test) för nollhypotes. Detta ger regressionsmodellens betydelse.
    • Significance F: Statistiskt värde känt som P-värdet för F.

    Om du inte förstår statistik och beräknande regressionsmodeller kommer värdena längst ner i sammanfattningen inte att ha någon större betydelse. Men Multiple R och R Square är de två viktigaste.

Som du kan se har kalorier i det här exemplet en stark korrelation till totalvikten.

Multipel linjär regressionsanalys i Excel

För att utföra samma linjära regression men med flera oberoende variabler, välj hela intervallet (flera kolumner och rader) för Input X Range.

Image
Image

När du väljer flera oberoende variabler är det mindre troligt att du hittar en lika stark korrelation eftersom det finns så många variabler.

Men en regressionsanalys i Excel kan hjälpa dig att hitta korrelationer med en eller flera av de variabler som du kanske inte inser existerar bara genom att granska data manuellt.

Rekommenderad: