În acest subiect
Pasul 1: Determinați un interval de încredere pentru diferența dintre mediile populației
În primul rând, luați în considerare diferența dintre eșantion și apoi examinați intervalul de încredere.
Estimarea diferenței este o estimare a diferenței în media populației. Deoarece această valoare se bazează pe datele eșantionului și nu pe întreaga populație, este puțin probabil ca diferența eșantionului să fie egală cu diferența de populație. Pentru a estima mai bine diferența de populație, utilizați intervalul de încredere pentru diferență.
Intervalul de încredere oferă o gamă de valori probabile pentru diferența dintre două medii de populație. De exemplu, un nivel de încredere de 95% indică faptul că, dacă luați 100 de probe aleatorii din populație, v-ați putea aștepta ca aproximativ 95 din probe să producă intervale care să conțină diferența de populație. Intervalul de încredere vă ajută să evaluați semnificația practică a rezultatelor dvs. Folosiți-vă cunoștințele specializate pentru a determina dacă intervalul de încredere include valori care au o semnificație practică pentru situația dvs. Dacă intervalul este prea larg pentru a fi util, luați în considerare creșterea dimensiunii eșantionului. Pentru mai multe informații, accesați Ways pentru a obține un interval de încredere mai precis.
Rezultate cheie: Diferență, IC 95% pentru Diferență
În aceste rezultate, estimarea diferenței în ceea ce privește media populației pentru calificările spitalelor este de 21. Puteți fi încrezător în 95% că diferența dintre populația medie este între 14.221 și 27.779.
Pasul 2: Determinați dacă diferența este semnificativă statistic
Rezultat cheie: Valoarea P.
În aceste rezultate, ipoteza nulă afirmă că diferența de evaluare medie între două spitale este 0. Deoarece valoarea p este mai mică de 0,0001, care este mai mică decât nivelul de semnificație de 0,05, decizia este de a respinge ipoteza nulă și concluzionează că evaluările spitalelor sunt diferite.
Pasul 3: verificați datele pentru probleme
Problemele cu datele dvs., cum ar fi asimetria și valorile aberante, vă pot afecta rezultatele. Utilizați graficele pentru a căuta asimetrie (examinând răspândirea fiecărui eșantion) și pentru a identifica potențialele valori anormale.
Examinați forma datelor dvs. pentru a determina dacă datele dvs. par a fi înclinate
Când datele sunt înclinate, majoritatea datelor sunt situate în partea de sus sau de jos a graficului. Adesea, asimetria este cel mai ușor de detectat cu o histogramă sau cu o cutie.
Îndoit
Stânga
Complotul cu date înclinate la dreapta arată timpii de așteptare. Majoritatea timpilor de așteptare sunt relativ scurți și doar câteva timpi de așteptare sunt lungi. Complotul cu date înclinate la stânga arată date despre timpul de eșec. Câteva elemente eșuează imediat și multe alte elemente eșuează mai târziu.
Datele care sunt sever distorsionate pot afecta valabilitatea valorii p dacă eșantioanele dvs. sunt mici (fiecare eșantion are mai puțin de 15 valori). Dacă datele dvs. sunt puternic distorsionate și aveți un eșantion mic, luați în considerare creșterea dimensiunii eșantionului.
În aceste comploturi, datele pentru spitalul B par a fi sever distorsionate.
Identificați valorile aberante
Valorile aberante, care sunt valori ale datelor care sunt departe de alte valori ale datelor, pot afecta puternic rezultatele analizei dvs. Adesea, valorile aberante sunt cel mai ușor de identificat pe un boxplot.
Pe o cutie, asteriscurile (*) denotă valori anormale.
Încercați să identificați cauza apariției valorilor aberante. Corectați orice erori de introducere a datelor sau erori de măsurare. Luați în considerare eliminarea valorilor datelor pentru evenimente anormale, de o singură dată (numite și cauze speciale). Apoi, repetați analiza. Pentru mai multe informații, accesați Identificarea valorilor aberante.
În aceste boxplot-uri, datele pentru spitalul B au 2 valori aberante.