# regresszió:
# növényt tápoldatoznak
# x mennyiségű tápoldatot
# megmérik, hogy y növekedett
# cél: y = f(x) + véletlen hiba
# legegyszerűbb: y = a + bx + hiba
x <- rnorm(30)
y <- 2*x + 2 + rnorm(30)
plot(x,y)
x ha elfelejtjük, hogy hogy generáltuk:
# becsüljük meg a lineáris paramétereket
# ismeretlen a,b paraméterek
# legkisebb négyzetek módszere:
# hiba = y - a - bx
# sum(hiba^2) lehető legkisebb legyen 
# optimalizálási feladat a,b paraméterekre
reg1 <- lm(y ~ x) 
# y = a + bx +hiba alakú közelítés
# lm() : linear model
reg1
reg1$coef # reg1$coefficients
points(x,reg1$fitted)
reg1$fitted # fitted(reg1) : becsült érték:
# a + b x_i
reg1$resid # reg1$residuals : 
# hiba: y_i - a -b x_i = h_i

# illeszkedés ellenőrzése:
# fenti: plot(x,y); abline(reg1$coef)
plot(x,reg1$resid)
plot(reg1$fitted,reg1$resid)
# rendszertelen, véletlenszerű pontfelhőt kéne látni
# ha valami függvényt követ, akkor nem jó a lineáris
# közelítés, valami komplexebb függvény kéne
# plot(reg1) : diagnosztikai ábrák