047 Discordサーバー作りました
Podcast音声はコチラ
2019年08月23日 20時30分開始
放送は、twitterで行います
kerneler.icon質問や感想は以下のマシュマロよりください
regonn&curry.fmにマシュマロを投げる | マシュマロ
いただいた質問はや感想は、放送で紹介します
kerneler.iconお題
このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。
雑談
https://www.ism.ac.jp/shikoin/training/dac/hackathon2019.html
データ分析ハッカソン
Kaggle等とは違いテーマに合った分析を競い合う
クラウドサーバー内にデータや分析ツールが用意されるらしく Julia も入っていた
Julia 1.2 リリース
今までのリリースよりもrc期間が長かった気がする
あんまり基本的な機能でのアップデートは無さそう
また、KaggleのJulia DockerにPR出そうかなと考えてる
Discordでサーバをたてた
kaggle好きな方やこのpodcastを聴いてくれている方とのチャット用
入りたい方は、https://discord.gg/2Jf95W4 から参加ください
regonnさんが毎日9時にコンペの終了までの日数を表示してくれるbotを作ってくれた
https://gyazo.com/d3a81d423d3838f17d0441e12f0a68aa
決めたいこと
ハッシュタグ
候補1:#kaggle_friends
候補2:#かぐるどん
候補3:#kaggledon
候補4:#かぐるぐる
某所のとかぶるが 「ぐる」はこのイメージ
候補5 :#かぐるる
ゴロとしてはこのぐらい短いのがいい
ここの内容を外部に貼ってもいいのか
パブリックな場なので、外に出されるとまずい情報は扱わないように周知する
RAdam
https://github.com/LiyuanLucasLiu/RAdam
https://nykergoto.hatenablog.jp/entry/2019/08/16/Adam_の学習係数の分散を考えた論文_RAdam_を読んだよ!
Adamを改良したoptimizer
import して Adamと書いていたのを、RAdamと書けば使える
warmupが必要なく、学習率に頑健
使ってみたところ、Adamでのスコアを簡単に越えた。お手軽に使えて、学習率の設定に悩まなくて良いので、kagglerに流行りそう
今週のKaggle
ieee: テーブルデータだけどデータ量も大きく、kernel がメモリ不足で落ちてしまうので、ローカルで作業やってるけど、ローカルでの作業がやりにくくなってしまうので、外部の環境を利用するようにした。
最初はGoogle Cloud Build使ってDocker使って学習してくれないか試したけど、これもデータ量が大きすぎると駄目だった。
サンプルで作ってみたiris位だったらいけそう、結果のnotebookをhtmlにして Google Cloud Storage に保存してくれる
https://github.com/regonn/iris-for-gcb
前回話した、GCPの200ドルクーポンもらったので、普通にGCEでインスタンス立ち上げて作業している
そのうち、またDocker使って学習だけできる仕組み構築していきたい
APTOScurrypurin.icon
やっていますが、スコア上がらず
前処理、学習などコードが整備できたし、色々と実験もしてきたので、あとは設定を変えて回してサブミットなどがメイン。
signate新コンペ
Weather Challenge:雲画像予測
データラーニングギルド
https://data-learning.com/guild
今週のtips
kaggle-apiを使ったdiscordのbotの作り方
https://github.com/regonn/kaggle-discord-bot
podcast 生配信 #質問