kaggleに参加するにあたり心得とか目指すべきところを調べてみた

そんなに調べていない。
なんとなく、取り組み姿勢、取り組み方法、目指すべきところを調べるためにkaggleとググって1ページ目表示されたサイトをみて感覚を掴んだ記事。

取り組み姿勢、取り組み方法

心得的なもの

このコードを自分の環境で書きながら、1ライン1ライン理解をしていくと良い勉強になります。なぜ、このような処理をしたのか?なぜこの項目を特徴量として使ったのか?などなどコードを真似しながら自分の中で噛み砕いていくことで、最先端のデータサイエンティストの考え方が身につけられます。

なるほど、一行ずつ書いていくべしなのか。
頑張らねば。

さて、最後の3つ目のコツですが「ディスカッション」へ参加することです。これは最低限の英語スキルが必要となりますが、英語の自信のない方でもやるべきだと思います。なぜディスカッションに参加すべきなのか?を説明します。

ディスカッションもしっかりみよう。

実際の進め方

データの型を把握して加工する

データの加工方法とか思いつかなかった時は、他の人のkernelを参考にする。
その過程でpythonnumpysklearnなどに慣れていかないと。(読んでてすぐに理解できなかった)

データのトレーニング

最初の壁は0.8を超えられるかです。
0.8を目標に。

大きく決めることは2つある。

  • 学習方法
  • ハイパーパラメーター

そこからの救命ボートはjupyter notebookといえますので、本日も、notebookにしがみついております。

目指すべきところ

「スティーブ・ジョブズは製品に対する直観をもっていましたが、グランドマスターたちはデータに対するそれをもっているのです」

むむむ…
データに対する直感か…

インテルは10月、機械学習研究者を募集する広告を出したが、「Kaggleコンテストでの優勝経験」を要件として挙げている。

優勝…

彼はKaggleで勝利すると、上等なステーキで祝福するのだという。Kaggleにおいては、データ分析はスポーツであるだけではない。アートでもあるのだ。


もうついていけなくなってきた…

DeNA、業務時間内のKaggle参加を推奨

kaggle社内ランク

トップ3とか異次元なんだろうな…
ちなみにメダルの基準は以下の通り。

kaggle_competition

Bronzeはダメなのね…
また、competitionだけではなく、kernelやdiscussionのメダルもある。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です