Hva, hvordan og hvorfor [+ 5 Learning Resources]

0 Shares

Hypotesetesting er en metode som brukes av mange analytikere i privat og offentlig sektor for å komme med sannsynlige utsagn eller antagelser om befolkningsdata.

Hvis du har jobbet med eller studert befolkningsdata, må du ha kommet over dette viktige verktøyet for hypotesetesting.

Mange metoder kan brukes for å gjøre antakelser, men ikke alle gir høyere nøyaktighet.

Og hvis du ikke er sikker på dataene dine, men likevel ønsker å bruke dem, kan det være risikabelt for organisasjonen din.

Hypotesetesting er en god strategi for å oppnå et høyere nivå av nøyaktighet. Det har vært medvirkende til befolkningsanalyse.

I denne artikkelen vil jeg diskutere hva hypotesetesting er, hvordan det fungerer, dets fordeler og dets brukstilfeller.

Så, uten videre, la oss starte!

Hva er hypotesetesting?

Hypotesetesting er en statistisk slutningsmetode analytikere bruker for å teste om tilgjengelige populasjonsdata tilstrekkelig støtter en gitt hypotese og gjøre antakelser ut av den.

Gjennom denne metoden kan analytikere enkelt vurdere en hypotese og bestemme hvor nøyaktig antagelsen er basert på dataene som er tilgjengelig.

Med enkle ord er det en testprosess basert på konklusjonsstatistikk som lar deg komme til en dom om populasjonsdata basert på innsamlede prøvedata.

Generelt er det nesten umulig for analytikere å finne eiendommer eller en bestemt parameter for hele befolkningen. Men gjennom hypotesetesting kan du gjøre en informert prediksjon og beslutning basert på prøvedataene og nøyaktigheten.

Typer hypotesetesting

De ulike typene hypotesetesting er:

Nullhypotese: Statistikken viser at prøvedataene er brå, og det er ingen korrelasjon mellom de to variablene i de gitte prøvedataene.
Alternativ hypotese: Den demonstrerer primæroppgaven og motsetter seg nullhypotesen. Det er den viktigste drivkraften i testprosessen fordi det viser en korrelasjon mellom to variabler i prøvedata.
Ikke-retningshypotese: Denne typen hypotesetesting fungerer som en tosidig hypotese. Den viser at det ikke er noen retning mellom to variabler i prøvedata, og at den sanne verdien ikke er den samme som den predikerte verdien.
Retningshypotese: Retningshypotese viser en relasjon mellom to variabler. Her kan en variabel i en prøvedata påvirke de andre variablene.
Statistisk hypotese: Den hjelper analytikere med å vurdere om dataene og verdien tilfredsstiller en viss hypotese. Det er svært nyttig for å komme med utsagn og antakelser om utfallet av en prøvepopulasjonsparameter.

La oss deretter diskutere metoder for hypotesetesting.

Metoder for hypotesetesting

For å vurdere om en spesifikk hypotese er sann eller ikke, som analytiker, vil du trenge mye plausibelt bevis for å konkludere. I denne testprosessen settes det opp en null og alternativ hypotese før vurderingen starter.

17 beste kurs/ressurser for å lære Kotlin-programmering

Hypotesetesting involverer ikke bare en enkelt metode, men mange for å vurdere om prøvedataene er gunstige. Som analytiker må du vurdere dataene og prøvestørrelsen og velge hvilken hypotesetestmetode som passer deg.

Normalitetstesting

Det er en standard hypotesetestmetode for å analysere regelmessig fordeling i prøvedata. Under testprosessen kontrolleres om de grupperte datapunktene rundt gjennomsnittet er under eller over gjennomsnittet.

I denne statistiske testingen er sjansen for at poeng går over eller under gjennomsnittet like sannsynlig. Det dannes en klokkekurve, og den er likt fordelt på begge sider av gjennomsnittet.

Z-Test testing

Det er en annen type hypotesetesting som brukes når populasjonsdataene er normalfordelt. Den tester at gjennomsnittet av to separate populasjonsparametere er forskjellige når variansen til dataene er kjent for deg.

Når du analyserer populasjonsdata, er det høyst sannsynlig at du vil bruke denne typen når dataprøvestørrelsen er mer enn tretti. Dessuten er den sentrale grensesetningen en annen grunn som gjør Z-Test egnet, ettersom teoremet sier at når prøvestørrelsene øker, er prøvene normalfordelt.

T-test testing

T-Test hypotesetesting vil bli brukt av deg når prøvestørrelsen er begrenset og vanligvis distribueres. Generelt, når prøvestørrelsen er under 30, og standardavviket til parameteren er ukjent for deg, brukes den hovedsakelig.

Når du gjør en T-test, gjør du det for å beregne konfidensintervallene til spesifikke populasjonsdata.

Chi-Square Test

Chi-kvadrat-testen er en populær hypotesetestingsprosess som ofte brukes til å vurdere egnetheten og integriteten til en distribusjon av data.

Kilde: wikipedia.org

Hovedgrunnen til at du vil bruke denne hypotesetypen er imidlertid når du vil teste populasjonsvariansen mot en populasjonsvarians med en antatt eller kjent verdi. Ulike Chi-Square-tester utføres, men den vanligste typen er Chi-Square-testen for varians og uavhengighet.

ANOVA-testing

Forkortet som Analysis of Variance, er det en statistisk testmetode som hjelper til med å sammenligne datasettene til to prøver. Det lar deg imidlertid sammenligne mer enn to metoder om gangen.

Den forklarer også en avhengig variabel og en uavhengig variabel av prøvedata. Bruken av ANOVA er ganske lik bruken av Z-Test og T-Test, men de to sistnevnte er begrenset til kun to måter.

Hvordan fungerer hypotesetesting?

Hver analytiker som bruker hypotesetesting, bruker tilfeldige prøvedata for analyse og måling. Under testingen brukes tilfeldig utvalgsdata for å teste nullhypotesen og den alternative hypotesen.

Som vi har diskutert tidligere, er nullhypotesen og den alternative hypotesen fullstendig gjensidig utelukkende, og under utfallet av testingen kan bare én være sann.

Det er imidlertid noen tilfeller når nullhypotesen forkastes; den alternative hypotesen er ikke alltid sann.

Kilde: Analytics Steps

p-verdi: Mens testprosessen starter, er p-verdien eller sannsynlighetsverdien involvert, og den viser om resultatet er signifikant eller ikke. Ikke bare det, men p-verdien viser også sannsynligheten for feil ved å avvise eller ikke avvise en nullhypotese under testingen. Den resulterende p-verdien er enten 0 eller 1, som deretter sammenlignes med signifikansnivået eller alfanivået.

Signifikansnivået her definerer den akseptable risikoen mens en nullhypotese forkastes under testingen. Det er viktig å huske at resultatet av hypotesetesten kan føre til to typer feil:

Type 1 feil oppstår når testresultatet avviser nullhypotesen selv om den er sann.
Type 2-feil vises når nullhypotesen er akseptert av prøveresultatet til tross for at den er usann.

Fix Microsoft Teams sier stadig at jeg er borte, men jeg er ikke feil

Alle verdiene som forårsaker avvisningen av nullhypotesen er lagret i det kritiske området. Og det er den kritiske verdien som skiller de kritiske regionene fra andre.

Trinn for å utføre hypotesetesting

Kilde: Medium

Hypotesetesting innebærer hovedsakelig fire trinn:

Definer hypoteser: I det første trinnet er jobben din som analytiker å definere de to hypotesene slik at bare den ene kan være sann. Nullhypotesen vil indikere at det ikke er noen forskjell i gjennomsnittlig BMI, mens den alternative hypotesen vil si at det er en signifikant forskjell i gjennomsnittlig BMI.
Plan: I neste trinn må du lage en analyseplan for hvordan du kan analysere prøvedataene. Det er viktig at du tar prøvetaking og samler inn prøvedataene for å sikre at de er utformet for å teste hypotesen din.
Analyser prøvedata: Etter å ha bestemt deg for hvordan du vil evaluere dataene, er det på tide å begynne med prosessen. Du må analysere prøvedataene fysisk slik at det ikke er redundans. Mens du analyserer dataene, bør du sjekke at prøvene er uavhengige av hverandre og at begge prøvestørrelsene er store nok.
Beregn teststatistikk: I dette stadiet må du beregne teststatistikken og finne p-verdien. P-verdien vil bli bestemt ved å anta at nullhypotesen er sann.
Vurder resultatet: I det siste trinnet må du vurdere resultatet av hypotesetesten. Her vil du bestemme om du vil forkaste nullhypotesen eller erklære dens plausibilitet basert på prøvedataene.

Nå skal vi utforske fordelene med hypotesetesting.

Fordeler med hypotesetesting

Fordelene med hypotesetesting er:

Det hjelper deg med å analysere styrken av kravet ditt på en databeslutning.
Som analytiker lar den deg lage et pålitelig miljø for å bestemme deg for prøvedata.
Den lar deg bestemme om prøvedataene som er involvert i hypotesetesting er statistisk signifikante.
Det er gunstig for å vurdere påliteligheten og validiteten til testresultater i enhver systematisk testprosess.

Det hjelper deg med å ekstrapolere dataene fra et prøvestadium til en større populasjon avhengig av kravet.

Bruk tilfeller av hypotesetesting

Hypotesetesting brukes i ulike sektorer for å gjette prøvedatas nøyaktighet på riktig måte. Noen eksempler fra den virkelige verden på hypotesetesting er:

#1. Kliniske studier

Hypotesetesting er mye brukt under kliniske studier fordi det hjelper medisinske fagfolk til å avgjøre om et nytt medikament, behandling eller prosedyre vil være effektiv eller ikke basert på prøvedata.

En lege kan tro at en behandling kan lindre kaliumnivået hos noen pasienter. Legen kan måle kaliumnivået til en gruppe pasienter før behandlingen og kontrollere nivået på nytt.

Deretter utfører legen hypotesetesting hvor H0: Uetter = Ubefore, og det angir at kaliumnivået er det samme som før etter påføring av behandlingen. En annen hypotese indikerer Ha: Uafter < Ubefore, noe som betyr at kaliumnivået har sunket etter påføring av behandlingen.

Så hvis p-verdien er mindre enn signifikansnivået, så kan legen konkludere med at behandlingen kan senke kaliumnivået.

Praktiske tips for å lage overbevisende videoer og måle suksessen deres

#2. Produksjon

Hypotesetesting brukes i produksjonsanlegg for å hjelpe veiledere med å avgjøre om den nye metoden eller teknikken er effektiv eller ikke.

For eksempel kan noen produksjonsenheter bruke hypotesetesting for å finne ut om den nye metoden hjelper dem med å redusere antall defekte produkter per batch. Anta at antallet defekte produkter er 300 per batch.

Produsenten må bestemme gjennomsnittet for det totale antallet defekte produkter produsert før og etter bruk av metoden. De kan utføre hypotesetesting og bruke hypoteser H0: Uafter = Ubefore, hvor gjennomsnittet av defekte produkter produsert etter bruk av en ny metode er det samme som før.

En annen hypotese viser at HA: Uafter ikke er lik Ubefore, noe som betyr at det totale antallet defekte produkter produsert etter bruk av den nye metoden ikke er det samme.

Etter testen, når p-verdien er mindre enn signifikansnivået, kan produksjonsenheten konkludere med at antall produserte defekte produkter har endret seg.

#3. Jordbruk

Hypotesetesting brukes ofte for å finne ut om gjødsel eller plantevernmiddel forårsaker vekst og immunitet hos planter. Biologer kan bruke testen for å bevise at en viss plante kan vokse mer enn 15 tommer etter påføring av den nye gjødselen.

Biologen kan bruke gjødsel i en måned for å samle prøvedata. Når biologen utfører en test, er en hypotese H0 U=15 tommer, noe som indikerer at gjødselen ikke forårsaker noen forbedring av plantens gjennomsnittlige vekst.

En annen hypotese viser HA: U> 15 tommer, noe som betyr at gjødselen forårsaker forbedring av plantens gjennomsnittlige vekst. Etter å ha testet når p-verdien er mindre enn signifikansnivået, kan biologen nå bevise at gjødsel gir mer vekst enn før.

Læringsressurser

#1. Statistikk: En trinn-for-trinn-introduksjon av Udemy

Udemy tilbyr et kurs om statistikk der du vil lære en trinn-for-trinn introduksjon til statistikk, som dekker hypotesetesting. Dette kurset har eksempler og leksjoner fra en tidligere Google-dataforsker for å hjelpe deg med å mestre konfidensintervaller, hypotesetester og mer.

#2. Viktig statistikk for dataanalyse av Udemy

Dette Udemy-kurset om viktig statistikk for dataanalyse vil hjelpe deg å lære statistikk med virkelige prosjekter, morsomme aktiviteter, hypotesetester, sannsynlighetsfordelinger, regresjonsanalyse og mer.

#3. Statistikk for datavitenskap og forretningsanalyse

Dette kurset om statistikk for datavitenskap og forretningsanalyse tilbys av Udemy som vil hjelpe deg å lære hypotesetesting. Den dekker ulike statistikkemner, slik at dataforskere og forretningsanalytikere kan lære og mestre dem. Den dekker inferensiell og beskrivende statistikk sammen med regresjonsanalyse.

#4. Hypotesetesting av Jim Frost

Denne boken er tilgjengelig på Amazon og er en intuitiv guide for å hjelpe analytikere med å ta datadrevne beslutninger.

Den dekker hvordan hypotesetester fungerer, hvorfor du trenger dem, hvordan du effektivt bruker konfidensintervaller, p-verdier, signifikansnivåer og mange flere emner.

#5. Hypotesetesting av Scott Hartshorn

Denne boken er unik med sine visuelle eksempler og er best for nybegynnere som søker en rask guide om hypotesetesting.

Den vil introdusere deg til betydningen av statistikk, typer og hvordan de fungerer. Det krever ikke at du har dybdekunnskap fra tidligere, men forklarer alt intuitivt.

Siste ord

Hypotesetesting hjelper til med å bekrefte en antagelse og deretter utvikle statistiske data basert på vurderingen. Det brukes i mange sektorer, fra produksjon og landbruk til kliniske studier og IT. Denne metoden er ikke bare nøyaktig, men hjelper deg også med å ta datadrevne beslutninger for organisasjonen din.

Deretter kan du sjekke læringsressursene for å bli forretningsanalytiker.