AIに巨大なデータセット学習させる系サービスに物申す

@mshk: 巷のAIに巨大なデータセット学習させる系サービス、よくよく考えると、それChatGPTじゃなくてベクター検索の話ですよね？ってなりそう

@nishio: 僕は自分の倫理観として「ChatGPTに自分の書籍を *読ませる* 」って表現してるんだけど、勝手に「学習させる」と解釈する人はいるし、類似のシステムを「学習させた」と主張してプレス打っちゃう人もいるんだなぁ、という気持ち。この違いを識別できない「リテラシーのない人」がほとんどということ。

@voluntas: 学習させるってのは違うよなぁたしかに。

@voluntas: @nishio > 「一度書籍を読んで曖昧に覚えている、新しい文章を見ると、似たものを連想して返すことができる」

これの簡単な言い方が欲しいところ。

@showyou: この話、Transformertが重み調整に事前にテキスト読んでおくのも学習だろ？って思ったが、そうじゃなくてプロンプトで自分の本提示した時って話か。それは確かに推論時の話なんで学習ではないな(逆にいうとこれくらいコンテキストが無いと誤解を生む)

https://t.co/mX5Zqflpct

#Transformer

@s2terminal_tech: モデルのパラメータ更新を伴う学習とそれ以外の手法を区別すべきなのは同意だけど。

zero-shot learningやin-context learningなどがlearningと呼ばれている以上、ベクトル検索でプロンプト動的に作るような手法も「学習」と呼ぶのが間違いだと指摘はできない気がしている。

個別のドメインタスクで実用的なモデルを作成するためのファインチューニングは必要

AIを使った検索エンジン