glm
正規分布してるという仮定なら、重回帰分析モデルでよい。 では、どういう分布?というと、ポアソン分布とか, ロジスティクス回帰
なら二項分布
説明変数の線形和(予測子)をリンク関数(logとかlogit)を噛ませたものをモデルとする。
オフセット項
モデルとして、密度や割合を求めるのだけど、その分母に当たるものが観測できてる場合、その分母の値を、右辺側の予測子の方にもっていく。モデルの推定に直接はかかわらないので、パラメータは付かない。リンク関数がexp()のポアソン分布だとしたら、log(A)みたいなものを線形子につける形で右辺をつくる。
参考
つまりreasoning目的であれば遜色ない結果が出せたとしても、本来異なる確率分布に基づくGLMを選択すべき場面でOLS線形回帰で代用した場合には、根底にはこういう問題が横たわっているという認識を持っておくべきだと思う