Ett T-test är ett sätt att avgöra om det finns statistiskt signifikanta skillnader mellan datauppsättningar, med hjälp av en Students t-fördelning. T-testet i Excel är ett T-test med två prov som jämför medelvärdet av två prover. Den här artikeln förklarar vad statistisk signifikans betyder och visar hur man gör ett T-test i Excel.
Instruktionerna i den här artikeln gäller Excel 2019, 2016, 2013, 2010, 2007; Excel för Microsoft 365 och Excel Online.
Vad är statistisk signifikans?
Föreställ dig att du vill veta vilken av två tärningar som ger bättre poäng. Du slår den första tärningen och får en 2; du slår den andra tärningen och får en 6:a. Säger detta dig att den andra tärningen vanligtvis ger högre poäng? Om du svarade "Naturligtvis inte", så har du redan en viss förståelse för statistisk signifikans. Du förstår att skillnaden berodde på den slumpmässiga förändringen i poängen, varje gång en tärning kastas. Eftersom provet var mycket litet (endast ett kast) visade det inte något signifikant.
Föreställ dig nu att du slår varje tärning 6 gånger:
- Den första tärningen slår 3, 6, 6, 4, 3, 3; Genomsnitt=4,17
- Den andra tärningen slår 5, 6, 2, 5, 2, 4; Genomsnitt=4,00
Bevisar detta nu att den första tärningen ger högre poäng än den andra? Antagligen inte. Ett litet urval med en relativt liten skillnad mellan medelvärdena gör det troligt att skillnaden fortfarande beror på slumpmässiga variationer. När vi ökar antalet tärningskast blir det svårt att ge ett sunt förnuftssvar på frågan - är skillnaden mellan poängen resultatet av slumpmässig variation eller är det faktiskt mer sannolikt att den ena ger högre poäng än den andra?
Signifikans är sannolikheten att en observerad skillnad mellan stickproven beror på slumpmässiga variationer. Signifikans kallas ofta alfanivån eller helt enkelt 'α'. Konfidensnivån, eller helt enkelt 'c', är sannolikheten att skillnaden mellan stickproven inte beror på slumpmässig variation; med andra ord, att det finns en skillnad mellan de underliggande populationerna. Därför: c=1 – α
Vi kan ställa in "α" på vilken nivå vi vill, för att känna oss säkra på att vi har bevisat betydelse. Mycket ofta används α=5% (95% konfidens), men om vi vill vara riktigt säkra på att eventuella skillnader inte orsakas av slumpmässig variation, kan vi tillämpa en högre konfidensnivå med α=1% eller till och med α=0,1 %.
Olika statistiska tester används för att beräkna signifikans i olika situationer. T-tester används för att avgöra om medelvärdet för två populationer är olika och F-tester används för att avgöra om varianserna är olika.
Varför testa för statistisk signifikans?
När vi jämför olika saker måste vi använda signifikanstestning för att avgöra om den ena är bättre än den andra. Detta gäller många fält, till exempel:
- I företag måste människor jämföra olika produkter och marknadsföringsmetoder.
- Inom sport måste människor jämföra olika utrustning, tekniker och konkurrenter.
- Inom teknik måste människor jämföra olika konstruktioner och parameterinställningar.
Om du vill testa om något presterar bättre än något annat, inom något område, måste du testa för statistisk signifikans.
Vad är en Students T-distribution?
En students t-fördelning liknar en normal (eller gaussisk) fördelning. Dessa är båda klockformade fördelningar med de flesta resultat nära medelvärdet, men vissa sällsynta händelser är ganska långt från medelvärdet i båda riktningarna, så kallade fördelningens svansar.
Den exakta formen på studentens t-fördelning beror på urvalsstorleken. För prover på mer än 30 är det mycket likt normalfördelningen. När urvalsstorleken minskas blir svansarna större, vilket representerar den ökade osäkerheten som kommer från att dra slutsatser baserade på ett litet urval.
Hur man gör ett T-test i Excel
Innan du kan tillämpa ett T-test för att avgöra om det finns en statistiskt signifikant skillnad mellan medelvärdet för två prover, måste du först utföra ett F-test. Detta beror på att olika beräkningar utförs för T-testet beroende på om det finns en signifikant skillnad mellan varianserna.
Du behöver Analysis Toolpak-tillägget aktiverat för att utföra denna analys.
Kontrollera och ladda analysverktygstillägget
Följ dessa steg för att kontrollera och aktivera analysverktygspaketet:
- Välj fliken FILE >välj Options.
- I dialogrutan Alternativ, välj Add-Ins från flikarna på vänster sida.
-
Längst ned i fönstret, välj rullgardinsmenyn Hantera och välj sedan Excel-tillägg. Välj Gå.
-
Se till att kryssrutan bredvid Analysis Toolpak är markerad och välj sedan OK.
- Analysis Toolpak är nu aktiv och du är redo att tillämpa F-Test och T-Test.
Utföra ett F-Test och ett T-Test i Excel
-
Ange två datauppsättningar i ett kalkylblad. I det här fallet överväger vi försäljningen av två produkter under en vecka. Det genomsnittliga dagliga försäljningsvärdet för varje produkt beräknas också, tillsammans med dess standardavvikelse.
-
Välj fliken Data > Dataanalys
-
Välj F-Test två-prov för avvikelser från listan och välj sedan OK.
F-testet är mycket känsligt för icke-normalitet. Det kan därför vara säkrare att använda ett Welch-test, men det är svårare i Excel.
-
Välj Variable 1 Range och Variable 2 Range; ställ in alfa (0,05 ger 95 % konfidens); välj en cell i det övre vänstra hörnet av utdata, med tanke på att detta kommer att fylla 3 kolumner och 10 rader. Välj OK.
För intervallet för variabel 1 måste urvalet med den största standardavvikelsen (eller variansen) väljas.
-
Visa F-testresultaten för att avgöra om det finns en signifikant skillnad mellan varianserna. Resultaten ger tre viktiga värden:
- F: Förhållandet mellan varianserna.
- P(F<=f) one-tail: Sannolikheten att variabel 1 faktiskt inte har en större varians än variabel 2. Om denna är större än alfa, vilket är i allmänhet 0,05, då finns det ingen signifikant skillnad mellan varianserna.
- F Kritisk ensvans: Värdet på F som skulle behövas för att ge P(F<=f)=α. Om detta värde är större än F indikerar det också att det inte finns någon signifikant skillnad mellan varianserna.
P(F<=f) kan också beräknas med FDIST-funktionen med F och frihetsgraderna för varje sampel som indata. Frihetsgrader är helt enkelt antalet observationer i ett urval minus en.
-
Nu när du vet om det finns en skillnad mellan avvikelserna kan du välja lämpligt T-test. Välj fliken Data > Data Analysis och välj sedan antingen t-Test: Two-Sample Assuming Equal Varianceseller t-Test: Två-sampling med antagande om ojämna varianser
-
Oavsett vilket alternativ du valde i föregående steg, kommer du att presenteras med samma dialogruta för att ange detaljerna i analysen. För att börja, välj intervallen som innehåller proverna för Variable 1 Range och Variable 2 Range.
- Förutsatt att du vill testa om det inte finns någon skillnad mellan medelvärdena, ställ in Hypotesized Mean Difference till noll.
- Ställ in signifikansnivån Alpha (0,05 ger 95 % konfidens), och välj en cell i det övre vänstra hörnet av utdata, med tanke på att detta kommer att fylla 3 kolumner och 14 rader. Välj OK.
-
Granska resultaten för att avgöra om det finns en signifikant skillnad mellan medlen.
Precis som med F-testet, om p-värdet, i det här fallet P(T<=t), är större än alfa, så finns det ingen signifikant skillnad. I det här fallet ges dock två p-värden, ett för ett ensidigt test och det andra för ett tvåsvanstest. I det här fallet använder du tvåsvansvärdet eftersom båda variablerna med ett högre medelvärde skulle vara en signifikant skillnad.