ChatGPTの頭の中 / スティーヴン ウルフラム
https://scrapbox.io/files/6739ff826d401e840d991231.png
ウルグラムレベルの巨人が新書レベル・量で生成AIの解説を行っていることだけで十分貴重だが、肝心の中身が、これ新書レベルの知識で読めるの?
特に前半はもう理工学書の機械学習の入門書を読んだほうがかえって早いのではないかと思った。
個人的には生成部分より、質問を理解してそれに即した応答をどのように行っているのかが疑問だったが、それは監訳者の解説で述べられていた。
結論から言うとただの人間のフィードバックに基づく強化学習(RLHF)ということらしい。なんだ...。