Anonim

Teorin bakom p- värden och nollhypotesen kan tyckas komplicerad till en början, men att förstå begreppen hjälper dig att navigera i statistikvärlden. Tyvärr missbrukas dessa termer ofta i populärvetenskap, så det skulle vara användbart för alla att förstå grunderna.

Se även vår artikel Hur du raderar varannan rad i Excel

Att beräkna p- värdet för en modell och bevisa / motbevisa nollhypotesen är förvånansvärt enkelt med MS Excel. Det finns två sätt att göra det och vi täcker båda. Låt oss gräva in.

Nullhypotes och p- värde

Nollhypotesen är ett uttalande, även kallad en standardposition, som hävdar att förhållandet mellan de observerade fenomenen är obefintlig. Det kan också tillämpas på föreningar mellan två observerade grupper. Under forskningen testar du den här hypotesen och försöker motbevisa den.

Till exempel, säg att du vill observera om en viss tygdiet har betydande resultat. Nollhypotesen, i detta fall, är att det inte finns någon signifikant skillnad i testpersonernas vikt före och efter dieten. Den alternativa hypotesen är att kosten gjorde en skillnad. Detta är vad forskare skulle försöka bevisa.

P- värdet representerar chansen att den statistiska sammanfattningen skulle vara lika med eller större än det observerade värdet när nollhypotesen är sann för en viss statistisk modell. Även om det ofta uttrycks som ett decimaltal, är det i allmänhet bättre att uttrycka det i procent. Till exempel bör p- värdet 0, 1 representeras som 10%.

En låg p- värde betyder att bevisen mot nollhypotesen är stark. Detta innebär vidare att dina uppgifter är betydande. Å andra sidan innebär en hög p- värde att det inte finns några starka bevis mot hypotesen. För att bevisa att modet diet fungerar, forskare skulle behöva hitta en låg p- värde.

Ett statistiskt signifikant resultat är det som är mycket osannolikt att hända om nollhypotesen är sann. Betydelsesnivån anges med den grekiska bokstaven alfa och den måste vara större än p- värdet för att resultatet ska bli statistiskt signifikant.

Många forskare inom ett brett spektrum av fält använder p- värdet för att få en bättre och djupare inblick i de data de arbetar med. Några av de framstående områdena inkluderar sociologi, straffrätt, psykologi, finans och ekonomi.

Hitta p- värdet i Excel

Du kan hitta p- värdet för en datamängd i MS Excel via T-testfunktionen eller med hjälp av dataanalysverktyget. Först ska vi undersöka funktionen T-test. Vi undersöker fem studenter som gick på en 30-dagars diet. Vi jämför deras vikt före och efter kosten.

OBS! I denna artikel använder vi MS Excel 2010. Även om det inte är den senaste, bör stegen i allmänhet också gälla för de nyare versionerna.

T-testfunktion

Följ dessa steg för att beräkna p- värdet med funktionen T-test.

  1. Skapa och fylla i tabellen. Vårt bord ser ut så här:

  2. Klicka på valfri cell utanför ditt bord.
  3. Skriv in: = T. Test (.
  4. Skriv in det första argumentet efter den öppna konsolen. I det här exemplet är det kolumnen Före diet. Utbudet ska vara B2: B6. Hittills ser funktionen ut så här: T.Test (B2: B6.
  5. Därefter anger vi det andra argumentet. Kolumnen After Diet och dess resultat är vårt andra argument och intervallet vi behöver är C2: C6. Låt oss lägga till den till formeln: T. Test (B2: B6, C2: C6.
  6. Skriv in ett kommatecken efter det andra argumentet och distributionsalternativen med en hala och tvåfaldiga distributionsalternativ visas automatiskt i en rullgardinsmeny. Låt oss välja den första distributionen med en hala. Dubbelklicka på den.
  7. Skriv in ett annat komma.
  8. Dubbelklicka på alternativet Paired i nästa rullgardinsmeny.
  9. När du har alla element du behöver stänger du fästet. Formeln för detta exempel ser ut så här: = T. Test (B2: B6, C2: C6, 1, 1)

  10. Tryck enter. Cellen visar p- värdet omedelbart. I vårt fall är värdet 0, 133906 eller 13, 3906%.

Den högre än 5% ger denna p- värde inte starka bevis mot nollhypotesen. I vårt exempel visade inte forskningen att bantning hjälpte testpersonerna att tappa en betydande vikt. Detta betyder inte nödvändigtvis att nollhypotesen är korrekt, bara att den inte har avvisats än.

Dataanalysrutt

Med dataanalysverktyget kan du göra många coola saker, inklusive beräkningar av p- värden. För att göra saker enklare använder vi samma tabell som i föregående metod.

Så här görs.

  1. Eftersom vi redan har viktskillnaderna i D-kolumnen, hoppar vi över skillnaden beräkningen. För framtida tabeller använder du denna formel: = "Cell 1" - "Cell 2".
  2. Klicka sedan på fliken Data i huvudmenyn.
  3. Välj dataanalysverktyget.
  4. Rulla nedför listan och klicka på alternativet t-test: Paired Two Sample for Means.
  5. Klicka på OK.
  6. Ett popup-fönster visas. Det ser ut så här:

  7. Ange det första intervallet / argumentet. I vårt exempel är det B2: B6.
  8. Ange det andra intervallet / argumentet. I detta fall är det C2: C6.
  9. Lämna standardvärdet i textrutan Alpha (det är 0, 05).
  10. Klicka på alternativknappen Output Range och välj var du vill ha resultatet. Om det är A8-cellen skriver du in: $ A $ 8.
  11. Klicka på OK.
  12. Excel kommer att beräkna p- värdet och flera andra parametrar. Slutbordet kan se ut så här:

Som du kan se är p- värdet med en svans samma som i det första fallet - 0.133905569. Eftersom den är över 0, 05 gäller nollhypotesen för denna tabell, och bevisen mot den är svag.

Saker att veta om p- värdet

Här är några användbara tips om p- värderingsberäkningar i Excel.

  1. Om p- värdet är lika med 0, 05 (5%) är data i din tabell betydande. Om det är mindre än 0, 05 (5%) är de data du har mycket betydande.
  2. Om p- värdet är mer än 0, 1 (10%) är uppgifterna i din tabell obetydliga. Om det är inom området 0, 05-0, 10 har du marginellt signifikanta data.
  3. Du kan ändra alfavärdet, även om de vanligaste alternativen är 0, 05 (5%) och 0, 10 (10%).
  4. Att välja två-tailed testning kan vara det bättre valet, beroende på din hypotes. I exemplet ovan innebär test med en hala att vi undersöker om testpersonerna tappade vikt efter bantningen, och det är exakt vad vi behövde ta reda på. Men ett två-tailed test skulle också undersöka om de fick statistiskt betydande mängder vikt.
  5. P- värdet kan inte identifiera variabler. Med andra ord, om den identifierar en korrelation, kan den inte identifiera orsakerna bakom det.

P- värdet Demystifierat

Varje statistiker som är värd hans eller hennes salt måste veta ins och outs av nollhypotest och vad p- värdet betyder. Denna kunskap kommer också att vara praktiskt för forskare inom många andra områden.

Har du någonsin använt Excel för att beräkna p- värdet för en statistisk modell? Vilken metod använde du? Föredrar du ett annat sätt att beräkna det? Låt oss veta i kommentarerna.

Hur man beräknar p-värde i Excel