統計&MLワード
変数
量的変数 quantitiative ⇔ 質的変数 qualitative ≒ カテゴリ変数 categorical 観測変数 observable ⇔ 潜在変数 latent
目的変数 objective, 従属変数 dependent ⇔ 説明変数 explanatory 独立変数 idependent
予測 prediction / 生成 generation
内挿 ⇔ 外挿
観測データの範囲内/外の値を推定する
係数 coefficient
自由度, 可動域
誤差 error, 残差 residual
力学系: 時間変化を直接記述したものを物理関係なくても呼ぶ
線形モデル
$ Y = a_1X_1+a_2+X_2+...+a_nX_n+b
多変数の線形モデルを求めることを重回帰 multiple regression
最小二乗法
混合分布モデル: 複数の確率モデルを組み合わせたもの
状態空間モデル: 観測値の背後の潜在的な状態を仮定し、状態の遷移と観測値の生成過程をモデル化する
カーネル密度推定
確率密度が全然わからない確率分布から標本が得られたときに、その標本からできるだけいい感じに元の確率密度を推定する方法
ロジスティック関数
こういう S 字のやつ
https://gyazo.com/dbe08f2dd359243084ef89ece80b9c80
シグモイド
周期性
周期を求めるには?
自己相関関数(ACF)のピークを見る
code:find_peaks.py
from scipy.signal import find_peaks
data = ...
acf = np.correlate(data, data, mode='full')
# data を正規化したほうがよい?
# from sklearn.preprocessing import minmax_scale
# data = minmax_scale(df'y') フーリエ変換, ウェーブレット変換
モデルの評価
PR AUC
ROC AUC
Log loss
F1-score
シャープレイ値
記号
ε: 誤差項
イプシロン