麻雀プロのためのAI牌譜解析ツール
https://scrapbox.io/files/63f0208a32ade6001c65698d.jpeg
クリエータ:
担当PM:首藤一幸(京都大学 学術情報メディアセンター 教授)
成果物
コメント
がんばれえ!!!!阿部優樹.icon
トップバッター頑張って!辻口輝.iconnishio.iconjarakawa.iconkunihirotanaka.iconkekeho.icon
東発 がんばってください!皆川達也(みなたつ).icon 七段到達!!辻口輝.icon
トップ1.2%?!nishio.icon
トランスフォーマーをCPUで動かしてたってことですか?atom.icon
強化学習の対戦相手エージェントはCPUで動かしてましたが,手牌推測など他のモデルの訓練はGPUでやりました
手牌推測の訓練はGPU,アプリケーション本番環境での推論はCPUなのでアプリケーションでまともな速度で動かすのが難しい...大神卓也.icon
強化学習に使ったGPUが,Suphxは42GPUとかだったのに対して,私たちは4GPUくらいだったので,CPUを大量に使って代用した形です大神卓也.icon
なるほどです!シミュレーターがCPUで動くときのあるあるですよね
なるほど、ビリを避けるためにはローリスクローリターン、トップを目指すためにはハイリスクハイリターンが良い、とnishio.icon
麻雀は人生〜 +1阿部優樹.iconsowawa.icon
本当に実直にAIの性質・性能の改善に取り組んでいてすごい、こういうのUIとかに逃げずに頑張るの大変そうだなと思う。akihiro-kiuchi.icon
作り切ったのすごいyuto suzuki.icon
Q: AIを強くする上では順位点の情報が重要だとわかったわけだが、プロもそういうヒューリスティックなのか?
A: プロの間でも,順位点は選択に影響する大きな要因の一つ
Q: このモデルに対して攻撃をするならどういう方法が考えられるか?(フリテンとか?)
A: 攻撃は難しいと思う。麻雀のルールでは、相手を騙すために戦略を変えることのメリットよりもデメリットが上回る
追記: 訓練の際にあまり出会わないような場面を意図的に作ると攻撃できるのでは?と思いましたが,麻雀はAI, 自分に加えて他のプレイヤーが2人いるので,自分とAIが損する展開になり攻撃は難しいと思いました大神卓也.icon
私の環境だと牌譜解析ツールの右側のボタンの文字が見えませんね伊藤謙太朗.icon
.control button { font-size: 1rem!important;} で見えるようになりました伊藤謙太朗.icon
Q: 人間だったらこういう手は打たない、AI独特の手はあったか?
A: 人間だったら打たない手というのは、まあまあ見られる
それは人間より劣っていると見ている。今後も改良を続けていきたい
人間の麻雀界にも影響を与えるかも知れない by yanase-san
AIが人間のあまり打たない手を打った場合に、それが良いものなのか悪いものなのかの人間の判断が信用できるのかどうかは悩ましい気がするな…nishio.icon
Q: 極は皆さんより強い?
(4人共頷く)
これ好きteramotodaiki.iconjarakawa.icon伊藤謙太朗.iconkunihirotanaka.icon阿部優樹.icon皆川達也(みなたつ).icon
Q: 麻雀初心者だけど、これ使って勉強とかサポートはしてくれる?
A: 現時点で有用。このページの上に張ってある配布解析ツール使うといい
これ使いたいから天鳳やろうかな伊藤謙太朗.icon
Q: 高速化の頑張ったところは?
A: 強化学習のための対戦相手のモデルがボトルネックだったので、蒸留などして高速化した
追記:分散学習の実装が一番大変だった天野克敏.icon
next