google.com, pub-2267199481962701, DIRECT, f08c47fec0942fa0
top of page

/calc/div-analyser

Gjennomsnitt, median og standardavvik

Dette verktøyet lar deg regne ut gjennomsnitt, median og standardavvik for ditt datasett. Det produserer også et histogram (søylediagram) som lar deg visuelt vurdere spredningen av dataene.

snittOgHist

Cronbachs Alpha

Verktøyet under hjelper deg med å beregne Cronbachs Alpha, en statistisk måling av intern konsistens eller pålitelighet i et sett med for eksempel spørreskjema-elementer. Cronbachs Alpha er spesielt relevant når du analyserer spørreskjemaer der flere spørsmål (elementer) er designet for å måle det samme underliggende konseptet.

For å bruke verktøyet, trenger du data fra minst to kolonner som representerer svarene fra respondentene på spørsmål som omhandler det samme temaet, for eksempel på en skala fra 1 til 5. Et typisk eksempel kan være en holdningsskala utformet for å måle respondentenes holdninger eller meninger om bestemte emner, som miljøvern eller politiske synspunkter. For å sikre at respondentene gir konsistente og ærlige svar, og at spørsmålene effektivt fanger opp ønsket informasjon, benyttes ofte flere spørsmål for å utforske det samme elementet fra ulike vinkler. Dermed antyder enighet i ett utsagn også sannsynlig enighet i et annet utsagn som formulerer samme konsept, men på en annen måte. En høy Alpha-verdi (nærmere 1.0) indikerer at elementene i skalaen har god intern konsistens, mens en verdi nærmere null indikerer svak konsistens.

 

Det er viktig å merke seg at Cronbachs Alpha er forskjellig fra Intraklassekorrelasjonskoeffisienten (ICC), som anvendes for å vurdere enighet mellom ulike vurderere eller måleinstrumenter. ICC innebærer mer komplekse beregninger som ofte utføres i statistikkprogramvare som SPSS. Du kan lese mer om hvordan dette gjøres på denne siden.

Interkvartilområdet (IQR)

Interkvartilområdet (eller inter-quartile range (IQR)) er et mål på spredningen i et datasett og representerer området innenfor de midterste 50% av verdiene. Det beregnes som forskjellen mellom det 75. og 25. persentilet, kjent som henholdsvisøvre og nedre kvartil. IQR gir et godt estimat av variabiliteten i en distribusjon og er mindre følsom for ekstreme verdier (uteliggere*) enn andre spredningsmål som standardavvik. Dette gjør IQR spesielt nyttig når vi behandler skjevfordelte data eller datasett med flere ekstremverdier. 

Under kan du regne ut IQR for et datasett. Begynn med å legge inn datasettet ditt i tekstfeltet, med ett tall per linje. Tallene trenger ikke å være i sortert rekkefølge; verktøyet vil sortere dem automatisk. Klikk så på "Beregn IQR"-knappen for å beregne interkvartilområdet samt det 25. og 75. persentilet og medianen (det 50. persentilet) for datasettet ditt.

​​

​​25. Persentil (Q1):

Indikerer verdien hvor 25% av observasjonene faller. Dette er "starten" for IQR.

 

Median (Q2):

Midtpunktet i datamengden. Halvparten av observasjonene er mindre enn medianen, og halvparten er større.​

 

75. Persentil (Q3):

Indikerer verdien hvor 75% av observasjonene havner. Dette markerer "sluttpunktet" for IQR.​

 

IQR:

Forskjellen mellom Q3 og Q1. Denne gir et mål på spredningen i de midterste 50% av dataene. En liten IQR indikerer at de midterste 50% av verdiene ligger nær hverandre, mens en stor IQR indikerer større spredning.

 

* Observasjoner som ligger mer enn 1,5 × IQR under Q1 eller over Q3, betraktes ofte som uteliggere eller ekstremverdier. 

 

I tillegg til de numeriske verdiene, vil du også se en visuell fremstilling av IQR sammen med markører for de tre kvartilene. Denne visualiseringen gir en intuitiv forståelse av dataens spredning og sentrale tendenser. I verktøyet under kan du lage en større og mer detaljert box-plot. Dersom du ønsker å beregne interkvartilområdet på dine data manuelt, kan du lese hvordan dette gjøres på denne siden.

Box-plot

Hva viser denne boxploten?

Et boxplot (boksplott) gir en visuell oppsummering av hvordan verdiene i datasettet ditt er fordelt. Det hjelper deg å se spredning, sentraltendens og eventuelle skjevheter i dataene.

 

Her er hva de ulike delene av plotet betyr:

  • Min (Minimum): Den laveste verdien i datasettet (uten å regne med outliers hvis de er fjernet).

  • Q1 (Første kvartil): Verdien som markerer at 25 % av dataene ligger under dette punktet.

  • Median (Andre kvartil): Midtpunktet i datasettet. Halvparten av verdiene er lavere, og halvparten høyere.

  • Q3 (Tredje kvartil): Verdien som markerer at 75 % av dataene ligger under dette punktet.

  • Max (Maksimum): Den høyeste verdien i datasettet.

 

Hva kan du finne ut?

  • Sentraltendens: Medianen gir deg et bilde av hvor "midten" av dataene dine ligger.

  • Spredning: Avstanden mellom minimum og maksimum, og spesielt mellom Q1 og Q3

  • (interkvartilavstand - IQR), viser hvor spredd verdiene er.

  • Symmetri/skjevhet: Hvis boksen er skjev (for eksempel medianen ligger ikke i midten av boksen), kan det tyde på skjevfordeling i dataene. 

 

Når er boxplot nyttig?

Når du vil sammenligne fordelinger i flere grupper eller bare trenger en rask oversikt over variasjonen i dataene dine. Verktøyet er også nyttig når du ser etter ekstreme verdier (uteliggere) eller skjevhet i målinger.

​​

Frekvenstabell og sektordiagram

Dette verktøyet hjelper deg å analysere kategoriske data (f.eks. favorittfag, klassetrinn eller andre grupperinger). Når du limer inn én kategori per linje, lager verktøyet automatisk en frekvenstabell og et sektordiagram (ofte kalt kakediagram) som viser hvordan dataene fordeler seg.

Hva finner du ut?

Hvor mange ganger hver kategori forekommer (frekvens). Hvor stor prosentandel hver kategori utgjør. Hvordan prosentandelene summerer seg opp (kumulativ prosent). Et fargerikt kakediagram som gir en visuell oversikt.

 

Hvordan bruke det?

Lim inn data i tekstboksen (én verdi per linje). Trykk "Analyser". Se tabell og diagram dukke opp automatisk. Last ned diagrammet hvis ønskelig.

 

Typiske bruksområder:

Oppsummere antall og fordeling av for eksempel klassetrinn, alder og andre tallfestede variabler. Sektordiagram og frekvenstabell brukes ofte til å organisere og visuelt fremstille svar fra spørreundersøkelser

Randomisering

Randomisering er et av de viktigste elementene i randomiserte kontrollerte studier. Denne generatoren kan hjelpe deg å plassere dine deltakere helt tilfeldig i et ønsket antall grupper. Andre ganger trenger man bare noen tilfeldige tall. For eksempel hvis man skal tildele deltakernummer eller lage datasett for å øve på statistiske analyser. Verktøyet til høyre gir deg tilfeldige nummer basert på hvor mange nummer du ønsker og alternativt hva det laveste og høyeste tallet skal være.

CV, eller koeffisienten av variasjon, er et mål på relativ variabilitet og uttrykker standardavviket som en prosentandel av gjennomsnittet. CV brukes også ofte for å vurdere hvor nøyaktig en test er dersom man har gjennomført testen flere ganger og forventer lignende resultat. CV beregnes ved å dele standardavviket (σ) på gjennomsnittet (μ) og deretter gange resultatet med 100 for å uttrykke det som en prosent (Reed, Lynn & Meade, 2002).

CV = (σ / μ) × 100

 

I dette verktøyet kan du lime inn kolonner fra ExCel og få utregnet CV. Du kan lime inn to eller tre kolonner for å beregne variasjonen mellom for eksempel måletidspunkt eller instrument. Resultatene kan rapporteres som % variasjon.

Referanser:

Reed, G. F., Lynn, F., & Meade, B. D. (2002). Use of coefficient of variation in assessing variability of quantitative assays. Clinical and diagnostic laboratory immunology, 9(6), 1235–1239. https://doi.org/10.1128/cdli.9.6.1235-1239.2002

Green Background

Odds ratio (OR) er et statistisk mål som brukes for å vurdere styrken av sammenhengen mellom to hendelser i medisinske og epidemiologiske studier​​

​​​​

OR gir et mål på oddsen for at en hendelse vil oppstå i en gruppe sammenlignet med oddsen for at samme hendelse oppstår i en annen gruppe (Szumilas, 2010). Denne typen analyse brukes ofte i case-kontroll design, gjerne i sammenheng med epidemiologiske studier.

For å beregne OR trenger vi å vite antallet "suksesser" (for eksempel antall personer med en sykdom) og "mislykkede" (for eksempel antall personer uten sykdommen) i to forskjellige grupper. Gruppene kan for eksempel være delt inn i de som er utsatt for en spesifikk faktor og de som ikke er det.

Resultatene fra en OR-beregning kan tolkes slik:

​​

  • OR = 1: Det er ingen forskjell i oddsen for hendelsen mellom de to gruppene.

  • OR >1: Oddsen for hendelsen er høyere i en gruppe (A) enn i den andre (B). 

  • OR <1: Oddsen for hendelsen er lavere i gruppe A sammenlignet med gruppe B. 

 

For eksempel vil en odds ratio på 1.23 fortelle oss at gruppe A har 1.23 ganger større odds (ikke sannsynlighet) for å eksempelvis få en sykdom sammenlignet med gruppe B. En annen måte å rapportere det samme på vil være å si at gruppe A har 23% større odds for å få sykdommen. Hadde odds ratioen vært 0.77, ville gruppe A hatt en 23% lavere odds for å få sykdommen.

Det er viktig å merke seg at en OR ikke direkte gir informasjon om risikoen for en hendelse, men snarere forholdet mellom oddsen for hendelser mellom to grupper. Videre bør OR tolkes med forsiktighet, spesielt når det gjelder å trekke årsakssammenhenger fra observasjonsstudier, ettersom det kan være underliggende (konfunderende) faktorer som ikke er tatt hensyn til i analysen.

/relativ-risiko

Relativ risiko, også kjent som risikoratio, er et statistisk mål som brukes til å sammenligne risikoen for et bestemt utfall i to forskjellige grupper.

Relativ risiko (RR) gir et mål på styrken av sammenhengen mellom en eksponering (for eksempel en behandling eller en risikofaktor) og en helseutfall eller sykdom. RR verdien indikerer hvor mye større eller mindre risikoen for utfallet er i den eksponerte gruppen sammenlignet med kontrollgruppen (ikke-eksponerte). Akkurat som for odds ratio, vil en RR på 1 bety at risikoen er lik i begge grupper. En RR større enn 1 indikerer en økt risiko i den eksponerte gruppen, mens en RR mindre enn 1 tyder på en redusert risiko (Feng et al., 2016).

Relativ risiko brukes ofte i epidemiologiske studier for å bedømme effekten av en bestemt intervensjon eller for å vurdere risikoen assosiert med visse atferd eller eksponeringer. For eksempel kan man bruke RR for å vurdere hvor effektiv en ny vaksine er ved å sammenligne forekomsten av sykdommen blant de vaksinerte (eksponerte gruppen) med de ikke-vaksinerte (kontrollgruppen).

​​​

rr.png

​​

Slik bruker du verktøyet for beregning av relativ risiko:

 

Legg inn data:

  1. Antall suksesser i eksponert gruppe: Dette er antallet individer i den gruppen som har blitt eksponert for faktoren du undersøker, og som har hatt det utfallet du ser etter (for eksempel antall syke).

  2. Totalt antall i eksponert gruppe: Totalt antall individer i den eksponerte gruppen.

  3. Antall suksesser i kontrollgruppe: Antallet individer i kontrollgruppen (ikke-eksponerte) som har hatt det aktuelle utfallet (for eksempel sykdommen).

  4. Totalt antall i kontrollgruppe: Totalt antall individer i kontrollgruppen.

Beregn Relativ Risiko:

Når du har lagt inn alle dataene, klikk på "Beregn Relativ Risiko"-knappen for å få resultatet. Verktøyet vil da beregne den relative risikoen basert på dataene du har oppgitt.

Resultat:

Verktøyet vil vise den beregnede relativ risikoen. Dette tallet forteller deg hvor mye større eller mindre sannsynligheten for utfallet er i den eksponerte gruppen sammenlignet med kontrollgruppen. En relativ risiko på 1 antyder at det ikke er noen forskjell i forekomsten av hendelsen om eksponeringen har skjedd eller ikke. Hvis den relative risikoen er større enn 1, er hendelsen mer sannsynlig å inntreffe hvis det var eksponering. Hvis den relative risikoen er mindre enn 1, er hendelsen mindre sannsynlig å inntreffe hvis det var eksponering (Tenny & Hoffman, 2023).

Hva er forskjellen mellom odds ratio (OR) og relativ risiko (RR)?

Disse to målemetodene kan lett forveksles, men de har noen viktige forskjeller som er med på å avgjøre hvilken vi bør bruke og hvordan vi tolker resultatene. Relativ risiko (RR) og odds ratio (OR) er begge mål på assosiasjonsstyrke mellom en eksponering og et utfall i epidemiologiske studier, men de beregnes og tolkes forskjellig (Kraft et al., 2009). Hovedforskjellen mellom RR og OR ligger i beregningen og tolkningen. RR gir et mer intuitivt mål på risikoøkning eller -reduksjon som følge av eksponering, og anses derfor som mer direkte relevant for å forstå det offentlige helseperspektivet. OR gir derimot et mål på oddsene for et utfall gitt en eksponering sammenlignet med ikke-eksponering, og kan noen ganger over- eller undervurdere risikoen, spesielt i situasjoner hvor utfallet er vanlig.

Relativ risiko

Relativ risiko sammenligner sannsynligheten eller risikoen for et spesifikt utfall i en eksponert gruppe med risikoen for det samme utfallet i en ikke-eksponert (kontroll) gruppe. RR er direkte relatert til sannsynlighetene for utfall og angir hvor mange ganger mer (eller mindre) sannsynlig det er at utfallet vil forekomme i den eksponerte gruppen sammenlignet med den ikke-eksponerte gruppen. RR kan bare beregnes i kohortstudier der forskerne følger grupper fremover i tid. RR-verdien varierer fra 0 til uendelig, der 1 indikerer ingen assosiasjon, verdier over 1 indikerer økt risiko, og verdier under 1 indikerer redusert risiko.

Odds ratio

Odds ratio sammenligner oddsene (ikke sannsynligheten) for et utfall i en eksponert gruppe med oddsene for det samme utfallet i en ikke-eksponert gruppe. OR estimerer forholdet mellom sannsynligheten for at et utfall forekommer til sannsynligheten for at det ikke forekommer, og sammenligner dette forholdet mellom to grupper. OR kan brukes i både kohortstudier og kasus-kontrollstudier, og er spesielt nyttig i kasus-kontrollstudier der det ikke er mulig å direkte beregne risiko. OR-verdien varierer også fra 0 til uendelig, med en verdi på 1 som indikerer ingen assosiasjon. Verdier over 1 antyder at eksponeringen er assosiert med en høyere odds for utfallet, mens verdier under 1 indikerer lavere odds.

Referanser:

Feng, C., Wang, H., Wang, B., Lu, X., Sun, H., Tu, X. M. (2016). Relationships among three popular measures of differential risks: relative risk, risk difference, and odds ratio. Shanghai Arch Psychiatry, 28(1), 56–60. https://doi.org/10.11919/j.issn.1002-0829.216031

Kraft, P., Wacholder, S., Cornelis, M. C., Hu, F. Bb, Hayes, R. B., Thomas, G., et al. (2009). Beyond odds ratios-communicating disease risk based on genetic profiles. Nat Rev Genet, 10(4): 264–269. https://doi.org/10.1038/nrg2516

Szumilas M. (2010). Explaining odds ratios. JCACAP, 19(3), 227–229.

Tenny, S., Hoffman, M. R. (2023). Relative Risk. I: StatPearls. StatPearls Publishing. Tilgjengelig fra: https://www.ncbi.nlm.nih.gov/books/NBK430824/

Z-score kan hjelpe oss med å forstå hvor en spesifikk verdi står i forhold til resten av datasettet, noe som kan være nyttig i flere forskjellige statistiske analyser

 

 

Z-score, eller standard score, er en statistisk måling som beskriver en verdi sin posisjon i forhold til gjennomsnittet av et datasett, målt i antall standardavvik (Andrade, 2021). Det gir altså en indikasjon på hvor mange standardavvik en observasjon ligger fra gjennomsnittet. En Z-score på 0 indikerer at verdien er nøyaktig gjennomsnittet, mens en Z-score på 1 betyr at verdien er ett standardavvik over gjennomsnittet. Negative Z-scorer indikerer verdier under gjennomsnittet.

 

For å bruke Z-score verktøyet, limer du inn datasettet ditt i tekstboksen. Datasettet må være linjeseparert, det vil si ett tall per linje (om du limer inn data rett fra ExCel eller SPSS vil dette ordne seg automatisk). Deretter skriver du inn den spesifikke verdien du ønsker å beregne Z-score for i feltet under, før du trykker på "Beregn Z-Score" knappen for å utføre beregningen. Verktøyet vil da gi deg gjennomsnittet og standardavviket for ditt datasett, samt Z-scoren for den spesifikke verdien du har angitt.

Referanser:

Andrade, C. (2021). Z Scores, Standard Scores, and Composite Test Scores Explained. Ind J Psychol Med, 43(6), 555–557. https://doi.org/10.1177/02537176211046525

/poweranalyse

Før man gjennomfører en studie er det gunstig å undersøke hvor mange deltakere man bør prøve å rekruttere. Disse kalkulatorene kan hjelpe deg å estimere hvor mange deltakere du trenger for å være i stand til å identifisere signifikante forskjeller av en gitt styrke. Legg inn relevante data fra tidligere lignende studier eller forventede verdier for å anslå hvor mange deltakere du trenger i ditt prosjekt. Vær oppmerksom på at disse kalkulatorene bruker forenklede modeller for å gi deg et estimat og resultatene bør tolkes med forsiktighet. Vurder gjerne ytterligere faktorer og konsulter en statistisker for en grundigere analyse i planleggingen av forskningsprosjekter. Du kan også laste ned den gratis programvaren G*Power som bruker mer avanserte utregninger og har flere muligheter enn disse enkle kalkulatorene. Om du virkelig er engasjert i poweranalyse kan du lese mer om det i Cohen (1988) sin bok "Statistical Power Analysis for the Behavioral Sciences".

Hvordan bruke kalkulatoren for t-test

 

Legg inn relevante verdier og klikk på "Beregn utvalg". Det vanligste er å benytte signifikansnivå på 0.05 og power på 0.80, så om du ikke har andre preferanser kan du la disse stå.

 

For effektstørrelse kan du legge inn det som er rapportert i en tidligere studie dersom en er tilgjengelig. Dersom ingen lignende forskning finnes kan du bruke den minste effektstørrelsen som kan bli ansett som praktisk betydningsfull, eller bruke Cohen (1988) sine generelle anbefalinger for liten (0.20), medium (0.50) eller stor effekt (0.80). Utvalgsstørrelsen blir da justert til å kunne finne den effektstørrelsen du har plottet inn.

Hvordan bruke kalkulatoren for ANOVA

 

Denne kalkulatoren hjelper deg med å estimere antallet deltakere du trenger i hver gruppe for å oppdage en forventet effektstørrelse når du skal bruke ANOVA.

 

For å bruke verktøyet skriver du inn antall grupper du skal undersøke og forventet effektstørrelse. Dersom du ikke har en tidligere studie å hente forslag til effektstørrelse fra kan du bruke den minste effektstørrelsen som kan bli ansett som praktisk betydningsfull, eller bruke Cohen (1988) sine generelle anbefalinger for liten (0.10), medium (0.25) eller stor effekt (0.40). Som i kalkulatoren over er det også her vanlig å benytte signifikansnivå (alpha) på 0.05 og power på 0.80.

Effektstørrelse er et mål for å vurdere den praktiske betydningen av observerte resultater i forskning og brukes gjerne i tillegg til p-verdi for å oppgi rikere informasjon om endringer og forskjeller. For å hjelpe med å gjøre effektstørrelseberegninger lettere har vi utviklet tre enkle og brukervennlige kalkulatorer basert på Cohen's d og Hedges' g.​​

Coh og Hed

Disse to kalkulatorene lar deg beregne effektstørrelsen for tester med to uavhengige grupper ved å bare angi gjennomsnitt og standardavvik. Cohen's d regnes ut ved å bruke formelen "d = (M1 – M2) / SDpooled " eller enklere forklart som forskjellen i gjennomsnitt delt på det samlede standardavviket (Cohen. 1988). Hedge's regnes ut med en lignende formel, men korrigerer i tillegg for små utvalg eller ulike gruppestørrelser og krever derfor at du legger inn denne informasjonen også (Hedges, 1981). Cohen's d er nyttig i de fleste sammenhenger, men kan resultere i veldig høye verdier hvis man har et lite utvalg. Hedges' g er anbefalt dersom man har et lavere antall deltakere / observasjoner eller ulike gruppestørrelser.

Dersom du skal regne ut effektstørrelsen mellom to avhengige grupper (f.eks. hvis du har benyttet en parret t-test), kan du bruke verktøyet lenger nede hvor du må lime inn datamaterialet du vil analysere. Dette er fordi denne utregningen trenger de individuelle forskjellene og ikke bare gruppens gjennomsnitt. Vær bevisst på at verktøyene noen ganger gir negative effektstørrelser. Undersøk alltid gjennomsnittene for å forsikre deg om at retningen på effektstørrelsen (positiv eller negativ) er riktig med tanke på hva du ønsker å teste for.

Paired t

Effektstørrelser for ikke-parametriske data

Dersom du analyserer data som ikke er normalfordelt og du har brukt ikke-parametriske tester, kan andre utregninger av effektstørrelser passe bedre enn Cohen's og Hedge's. Et eksempel er den følgende formelen

 r = Z / sqrt(N)

 

Dette verktøyet lar deg beregne effektstørrelsen (r) for to grupper eller måletidspunkter ved hjelp av ikke-parametrisk statistikk. For å bruke verktøyet, lim inn datasettene for hver gruppe i de tilsvarende tekstfeltene. Hver verdi skal skilles med ny linje (dette skjer automatisk om du limer inn fra ExCel eller SPSS. I verktøy 1 kan du lime inn dataene dine, mens i nr. 2 skrive inn Z og n dersom du allerede har regnet disse ut. Dette kan du gjøre på denne siden.

Utregningen kan beskrives på følgende måte:

"Effektstørrelser ble regnet ut ved å dele Z-scorene på kvadratroten av antall observasjoner"

Dette gir en normalisert indikator på forskjellen mellom de to gruppene. Effektstørrelsen kan tolkes som hvor betydelig forskjellen mellom gruppene er, og kategoriseres som triviell (<0.1), liten (0.1–0.3), middels (0.3–0.5), og stor (>0.5) (Cohen, 1977).

non-par

Referanser:

Cohen, J. (1977). Statistical power analysis for the behavioral sciences. Academic press.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2.utg). Academic press.

Hedges, L. (1981). Distribution Theory for Glass’s Estimator of Effect Size and Related Estimators. Journal of Educational Statistics, 6(2), 107-128. 

Vi jobber frivillig med dette prosjektet og du kan bruke alle ressursene gratis. Dersom du finner verdi i nettsiden og er interessert i å donere for å hjelpe oss å bli bedre, tar vi imot både små og store donasjoner med enorm takknemlighet!

Nettsiden bruker reklame for å støtte vår virksomhet, men om du ønsker kan du enkelt blokkere disse ved å bruke en AdBlocker som du kan installere ved å trykke på den røde logoen nedenfor.

Adblock_logo.png
bottom of page