AIシステムにおけるデータ利用の特性と取扱い上の留意点

public.icon

https://scrapbox.io/files/612f21185536ef0020c4b69f.png

概要

AIの推論過程を人間が理解することが不可能

学習元のデータセットの偏りが原因で、バイアスを持った判定をする可能性がある

どのようにして、AIの学習元となるデータの透明性を担保するかの議論

背景

総務省による利活用のガイドラインを整備したりしてる

究極、どうやってもAIの推論過程を理解することはできんみたいな文脈もあり、「行政機関が利用する際の透明性の確保」というドキュメントで整理されてたりする

アルゴリズムの設計の際には社会的少数派を入れることを推奨する

アルゴリズムの設計の際におこなった政策的判断を説明する...

想定される課題

現状のデータ活用の多くは、意思決定のサポートとして使われる（消費型データ活用）ケースが多く、使用された後は役割を終えるものが主流だった

しかし、深層学習や強化学習で学習に用いられるデータセットは、学習結果（推論モデル）になり、永続化することが特徴

これらのデータがアルゴリズム特許のような、知財的な立ち位置になる可能性が高く、関連する保証や説明責任などが整備されていない状況

機械学習に外部データを用いる場合、学習済みモデルの適用対象、流通先などの考慮したデータ取引が求められます。加えて、政府が保有するデータが民間企業の機械学習モデルに使用され、流通する場合などを想定し保証の範囲、権利関係など十分に配慮することが求められます。

AIサービスに対して保証レベルを定めるなどの取り組みを検討している

https://scrapbox.io/files/612f20c3afb3120023920906.png