047 Discordサーバー作りました
2019年08月23日 20時30分開始
kerneler.icon質問や感想は以下のマシュマロよりください
いただいた質問はや感想は、放送で紹介します
kerneler.iconお題
このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。
雑談
データ分析ハッカソン
Kaggle等とは違いテーマに合った分析を競い合う
クラウドサーバー内にデータや分析ツールが用意されるらしく Julia も入っていた
Julia 1.2 リリース
今までのリリースよりもrc期間が長かった気がする
あんまり基本的な機能でのアップデートは無さそう
また、KaggleのJulia DockerにPR出そうかなと考えてる
Discordでサーバをたてた
kaggle好きな方やこのpodcastを聴いてくれている方とのチャット用
regonnさんが毎日9時にコンペの終了までの日数を表示してくれるbotを作ってくれた
https://gyazo.com/d3a81d423d3838f17d0441e12f0a68aa
決めたいこと
ハッシュタグ
候補1:#kaggle_friends
候補2:#かぐるどん
候補3:#kaggledon
候補4:#かぐるぐる
候補5 :#かぐるる
ゴロとしてはこのぐらい短いのがいい
ここの内容を外部に貼ってもいいのか
パブリックな場なので、外に出されるとまずい情報は扱わないように周知する
RAdam
Adamを改良したoptimizer
import して Adamと書いていたのを、RAdamと書けば使える
warmupが必要なく、学習率に頑健
使ってみたところ、Adamでのスコアを簡単に越えた。お手軽に使えて、学習率の設定に悩まなくて良いので、kagglerに流行りそう
今週のKaggle
ieee: テーブルデータだけどデータ量も大きく、kernel がメモリ不足で落ちてしまうので、ローカルで作業やってるけど、ローカルでの作業がやりにくくなってしまうので、外部の環境を利用するようにした。
最初はGoogle Cloud Build使ってDocker使って学習してくれないか試したけど、これもデータ量が大きすぎると駄目だった。
サンプルで作ってみたiris位だったらいけそう、結果のnotebookをhtmlにして Google Cloud Storage に保存してくれる
前回話した、GCPの200ドルクーポンもらったので、普通にGCEでインスタンス立ち上げて作業している
そのうち、またDocker使って学習だけできる仕組み構築していきたい
APTOScurrypurin.icon
やっていますが、スコア上がらず
前処理、学習などコードが整備できたし、色々と実験もしてきたので、あとは設定を変えて回してサブミットなどがメイン。
signate新コンペ
データラーニングギルド
今週のtips
kaggle-apiを使ったdiscordのbotの作り方