În ultima lecție, ați învățat cum să identificați diferențe semnificative statistic folosind metode de testare a ipotezelor. Dacă valoarea p este mai mică decât nivelul \ (\ alfa \) (de obicei 0,05), atunci rezultatele sunt semnificativ din punct de vedere statistic. Se spune că rezultatele sunt semnificative statistic atunci când diferența dintre parametrul populației ipotezate și statistica eșantionului observat este suficient de mare pentru a concluziona că este puțin probabil să se fi produs din întâmplare.

practică

Semnificație practică se referă la magnitudinea diferenței, care este cunoscută sub numele de mărimea efectului. Rezultatele sunt practic semnificative atunci când diferența este suficient de mare pentru a fi semnificativă în viața reală. Ceea ce este semnificativ poate fi subiectiv și poate depinde de context.

Rețineți că semnificația statistică este direct afectată de dimensiunea eșantionului. Reamintim că există o relație inversă între dimensiunea eșantionului și eroarea standard (adică abaterea standard a distribuției eșantionării). Diferențele foarte mici vor fi semnificative statistic, cu o dimensiune a eșantionului foarte mare. Astfel, atunci când rezultatele sunt semnificative statistic, este important să se examineze și semnificația practică. Semnificația practică nu este influențată direct de dimensiunea eșantionului.

Exemplu: Secțiunea Programului de pierdere în greutate

Cercetătorii studiază un nou program de slăbire. Folosind un eșantion mare, aceștia construiesc un interval de încredere de 95% pentru cantitatea medie de pierdere în greutate după șase luni în cadrul programului pentru a fi [0,12, 0,20]. Toate măsurătorile au fost luate în lire sterline. Rețineți că acest interval de încredere nu conține 0, deci știm că rezultatele lor au fost semnificative statistic la un nivel alfa de 0,05. Cu toate acestea, majoritatea oamenilor ar spune că rezultatele nu sunt practic semnificative, deoarece un program de scădere în greutate de șase luni ar trebui să producă o scădere medie în greutate mult mai mare decât cea observată în acest studiu.

Secțiunea Dimensiune efect

Pentru unele teste sunt utilizate în mod obișnuit măsuri ale dimensiunii efectului. De exemplu, atunci când comparăm diferența în două mijloace, calculăm adesea lui Cohen \ (d \) care este diferența dintre cele două medii de eșantion observate în unități de deviație standard:

Unde \ (s_p \) este abaterea standard colectată

Mai jos sunt standarde utilizate în mod obișnuit atunci când interpretăm lui Cohen \ (d \):

Interpretarea lui Cohen \ (d \)
0 - 0,2 Efect mic sau deloc
0,2 - 0,5 Mărimea efectului mic
0,5 - 0,8 Mărime efect mediu
0,8 sau mai mult Mărime efect mare

Pentru o singură medie, puteți calcula diferența dintre media observată și media ipoteză în unități de deviație standard: \ [d = \ frac \]

Pentru corelație și regresie putem calcula \ (r ^ 2 \) care este cunoscut sub numele de coeficient de determinare. Aceasta este proporția variației comune. Vom afla mai multe despre \ (r ^ 2 \) când vom studia regresia liniară simplă și corelația la sfârșitul acestui curs.

Exemplu: Secțiunea SAT-Math Scores

Întrebarea de cercetare: Sunt scorurile SAT-Math la un colegiu mai mari decât media populației cunoscute de 500?

Datele sunt colectate dintr-un eșantion aleatoriu de 1.200 de studenți la acel colegiu. În eșantionul respectiv, \ (\ overline = 506 \). Se știe că populația cu deviație standard este de 100. A fost efectuat un test mediu dintr-o probă, iar valoarea p rezultată a fost 0,0188. Deoarece \ (p \ leq \ alpha \), ipoteza nulă ar trebui respinsă. Aceste rezultate sunt semnificative statistic. Există dovezi că populația înseamnă că este mai mare de 500.

Dar, să luăm în considerare și semnificația practică. Diferența dintre un scor SAT-Math de 500 și un scor SAT-Math de 506 este foarte mică. Cu o abatere standard de 100, această diferență este doar \ (\ frac = 0,06 \) abateri standard. În majoritatea cazurilor, acest lucru nu ar fi considerat practic semnificativ.

Exemplu: secțiunea Commute Times

Întrebarea de cercetare: Sunt diferitele ore de navetă în Atlanta și St. Louis?

Statistici descriptive: timp de navetă Orașul N înseamnă StDev
Atlanta 500 29.110 e cel mai frecvent 20.718 e cel mai frecvent
Sf. Louis 500 21.970 e cel mai frecvent 14.232 cea mai frecventă

Folosind setul de date încorporat în StatKey, a fost efectuat un test de randomizare cu două cozi, rezultând o valoare p ×

Arcu felis bibendum ut tristique et egests quis:

  • Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris
  • Duis aute irure dolor in reprehenderit in voluptate
  • Exceptor sint occaecat cupidatat non proident