# regresszió: # növényt tápoldatoznak # x mennyiségű tápoldatot # megmérik, hogy y növekedett # cél: y = f(x) + véletlen hiba # legegyszerűbb: y = a + bx + hiba x <- rnorm(30) y <- 2*x + 2 + rnorm(30) plot(x,y) x ha elfelejtjük, hogy hogy generáltuk: # becsüljük meg a lineáris paramétereket # ismeretlen a,b paraméterek # legkisebb négyzetek módszere: # hiba = y - a - bx # sum(hiba^2) lehető legkisebb legyen # optimalizálási feladat a,b paraméterekre reg1 <- lm(y ~ x) # y = a + bx +hiba alakú közelítés # lm() : linear model reg1 reg1$coef # reg1$coefficients points(x,reg1$fitted) reg1$fitted # fitted(reg1) : becsült érték: # a + b x_i reg1$resid # reg1$residuals : # hiba: y_i - a -b x_i = h_i # illeszkedés ellenőrzése: # fenti: plot(x,y); abline(reg1$coef) plot(x,reg1$resid) plot(reg1$fitted,reg1$resid) # rendszertelen, véletlenszerű pontfelhőt kéne látni # ha valami függvényt követ, akkor nem jó a lineáris # közelítés, valami komplexebb függvény kéne # plot(reg1) : diagnosztikai ábrák