連合学習でなぜ二種類の評価を実行するか
from 2025/10/6の研究ログ
flowerにて,fed_avg.pyでevaluate()とaggregate_evaluate()の二つが実装されていたことについて
統合後の評価はテストデータでモデル統合による性能を見る
分散評価はクライアントごとに出した評価を集約し,性能を見る
それぞれの結果を観察・比較して,汎化性能をより深く理解する
特にローカルでの評価はデータなどの多様性が反映される
分散学習が上手くいっているかの確認もできる