埋め込みベクトルにロジスティック回帰
GPT5.icon
NLP:固定埋め込み+ロジスティック回帰の評価・プロービング
SentEval(評価ツール):文埋め込みを特徴量にしてロジスティック回帰 or MLPで下流分類を一括評価する定番。設定・CV手順が明示。
What you can cram…(Conneau+ 2018):文法情報を測るプロービングタスクを提案。付録にロジスティック回帰結果も。
Probing Classifiers(Belinkov 2022 Survey):プローブ(多くがロジスティック回帰)の長所・限界・改良を概観。 (MIT Press Direct) SBERT(Reimers & Gurevych 2019):文埋め込みを作り、SentEvalのロジスティック回帰で転移性能を報告。 (arXiv) 文書ベクトル:doc2vec系の古典と評価
doc2vec(Le & Mikolov 2014):固定長ベクトルを作り、ロジスティック回帰等に渡す想定を明記した原典。 (Computer Science) 正規化特徴×ソフトマックス=角度的ロジスティック(幾何学的理解)
ArcFace(CVPR 2019):特徴&重みを単位化したsoftmax(=ロジスティック回帰多クラス)に角度マージンを入れ、球面上の境界を解析。 (CVFオープンアクセス) 応用・実務系の補足例
Twitter Author Profiling(PAN’17):単語埋め込み+ロジスティック回帰で著者属性推定のベースライン。 (ceur-ws.org) (近年の実証)Embeddings×ペナルティ付きLRが強い:小型LMの埋め込み+正則化ロジスティック回帰が17分類タスクで健闘という報告。 (papers.ssrn.com)