Internet Explorer
https://gyazo.com/aed22f529150867e63fa284811a7929c
Project : https://internet-explorer-ssl.github.io/
Paper : https://arxiv.org/abs/2302.14051Internet Explorer: Targeted Representation Learning on the Open Web
GitHub : https://github.com/internet-explorer-ssl/internet-explorer
画像分類/物体検出などのタスクは現在はCLIPベースで作られていることが多い
これの主な問題点として、データセットを作るのに膨大な労力を必要とすることと、静的である点がある
そのバージョンのCLIPでは、そのとき学習に使ったデータベースの知識しか持っていない
追加学習するときに、関連する必要なデータをインターネットを利用して集める
→Internet Explorer
自己教師付きでウェブを探索し、目的のデータセットでパフォーマンスを向上させる関連する事例を徐々に見つけます。インターネット上の画像をテキストクエリで検索し、ダウンロードした画像で自己教師付き学習を行い、どの画像が有用であったかを判断し、次に検索する画像の優先順位を決めるというサイクルを繰り返しています。
もしかして
IE(Internet Explorer)