#abi käsu kohta ?käsk pikkus=c(10,12,12,13,10,14,13,11,14,16,14,14) laius=c(7,8,9,6,6,7,8,9,5,10,9,8) sugu=c(rep("m",6),rep("n",6)) #kui tahame kõik vektorid ühte panna, siis kasutame data.frame #lutikad=data.frame(pikkus,laius,sugu) #lutikad$pikkus pikkus #histogramm hist(pikkus) hist(pikkus, breaks=3) hist(pikkus,c(seq(10,16,3))) var(pikkus) #dispersioon sd(pikkus) #standardhälve mean(pikkus) #keskmine median(pikkus) #mediaan range(pikkus) #vähim ja suurim element summary(pikkus) #mõningad järkstatistikud ja keskmine sd(pikkus)/sqrt(length(pikkus)) #keskmise standardviga t.test(pikkus)$conf.int #keskmise ligikaudne usaldusvahemik (vaikimisi 95%) , nõuab normaaljaotust või suurt valimimahtu #kui vaja saab ka kogu t-testi #t.test(pikkus) wilcox.test(pikkus) #mediaani mitteparameetriline võrdlus nulliga (eeldatakse jaotuse sümmeetriat) #installeerides (ja laadides käsuga "library(moments)") paketi "moments" on võimalik kasutada ka funktsioone skewness, kurtosis jms #ühes või teises paketis on muidugi kõik funktsioonid olemas, aga sageli on asja sisu tundes lihtsam soovitud valemid sisse toksida nt parandatud ruutude summa on lihtsalt #sum((pikkus-mean(pikkus))**2) #kvantiilid käsuga "quantile" #valimi jaotusega võrdlemine #kolmogorov-smirnovi test ks.test(pikkus,pnorm,mean=0,sd=1) #võrreldakse standardse normaaljaotusega, standardiseerimisparameetrid EI TOHI olla arvutatud valimi põhjal #shapiro-wilksi normaalsuse test shapiro.test(pikkus) #normaalsuse testid paketis "nortest" #gruppide analüüs by(pikkus,sugu,mean) #esimene on tunnus, teine on faktor, kolmas on funktsioon #by(lutikad[,c("pikkus","laius")],sugu,mean) # by(lutikad[,1:2],sugu,mean) #prop.test(430,500) #keskmise ligikaudne usaldusvahemik binoomjaotusel (kasutada saab suure valimimahu korral, kusjuures jaotus ei tohiks olla väga ebavõrdne (nt 1:100)) t.test(rep(c(1,0),(430,70)))$conf.int #keskmise ligikaudne usaldusvahemik (vaikimisi 95%)