データサイエンス

【賞金あり】データ分析コンペ比較

データサイエンスの需要が高まると共に、データ分析コンペが様々なところで開かれるようになりました。

データ分析コンペとは、与えられたデータから機械学習や統計手法を使って様々なことの予測を行う大会のことです。

代表的なものでいうと、タイタニック号の乗客の情報(年齢、性別、宿泊ランクなど)から、タイタニック号の事故による生死を予測するというものがあります。

このようなデータ分析コンペは、賞金が出るというだけでなく、ここでの順位が転職や仕事の受注における一つの指標となるため、エンジニアだけでなく、非エンジニアの方にも人気のコンペとなっております。

じゃあ、具体的にどンなデータ分析コンペがあるの?って方のために、今回は、代表的なデータ分析コンペのプラットフォームである、Kaggle、Signate、probspaceなど合計6つのコンペを紹介していこうと思います。

Kaggle

データ分析コンペの中で一番有名なのがこのKaggleです。

Kaggle公式サイト

Kaggleでは過去に350以上のコンペが開催されており、登録者はなんと300万人以上、世界最大規模のデータ分析コンペサイトとなっております。

Kaggleでは、コンペの過去ランキングによってユーザに称号が与えられ、その称号はしばしば就職や転職の際に資格と同等に扱われます。

中でも、最上位ランクのGrandmaster(グランドマスター)は、世界に160人程度しかおらず、日本人に限っては10人程度しかいません。

そのため、このランクを持っていればデータサイエンティストとして、知識と経験を有している証明になります。

なお、ランクはGrandmaster、Master、Expert、Contributor、Noviceとなっています。

このうち、NoviceとContributorは簡単になれるので、初心者は、まずは二回の入賞でなれるExpertを目指してみると良いでしょう。

ちなみにコンペによっては賞金が存在し、総額100万円から多いものでは1億を超えるものもまで存在しています。

Signate

Signateは日本最大級のデータ分析コンペサイトです。

Signateの公式サイト

先ほどのKaggleは、世界的なデータ分析コンペですので、言語は全て英語で統一されていますが、このSignateは日本で開催されているデータ分析コンペのため、言語は日本語となっております。

そのため、英語を読むのは抵抗があると言う方は、Signateから初めてみるのが良いでしょう。

こちらもKaggleと似て、ランクが設定されており、その順序はGrandmaster、Master、Expert、Advanced、Intermediate、Beginnerとなっています。

賞金は先ほどのKaggleからは見劣りますが、それでも総額50~200万円ほどの賞金が用意されています。

ProbSpace

ProbSpaceも日本語版のデータ分析コンペのサイトです。

ProbSpaceの公式サイト

個人的には、Signateと比べてサイトがシンプルかつデータもシンプルであるため、初心者が学ぶにはうってつけのサイトであると感じています。

コンペとして主催されている内容も、給与推定やYouTube動画視聴回数予測など想像しやすい身近なテーマが多いため、領域の専門知識がなくても、取り掛かりやすいものが多いです。

コンペのスパンが短いことも特徴なので、気軽に沢山のコンペに出場してみることをおすすめします。

賞金は、1位の人に10万円が支給されると言うものが多いです。

コンペによっては、学生賞が用意されており、学生の中でトップの人に賞金が渡されると言うものもあるので、学生の方も社会人には勝てないと諦めずやってみると良いと思います。

Nishika

Nishikaも日本版データ分析コンペのサイトです。

Nishikaの公式サイト

コンペの内容としては、レコメンドエンジン開発や株主価格予想など企業色の強いコンペが見られます。

実際の仕事でどのように機械学習を使用していくのかを知りたい人は、こちらを使ってみると良いかもしれません。

賞金は10万円から100万円まであるため、Signateの規模だと入賞は難しそうだけど、賞金が高いコンペを探したいと言う人は、一度サイトを覗いてみると良いと思います。

NRIデータコンペ

こちらはNRIが毎年開催しているデータ分析コンペです。

NRIデータコンペの公式サイト

今まで紹介してきたコンペとは少し違っていて、機械学習がメインというよりかは、データから分析できることは何か、そしてそれをどうビジネスに活用すれば良いのか、と言うことを考えるコンペになっております。

そのため、機械学習とかは知らないけど、ビジネスセンスで勝負していきたいんだ!と言う人は参加してみると面白いと思います。

データサイエンスには、機械学習を使わなくても解ける問題もたくさんあります。

機械学習を知っている人でも、安易に機械学習を使えば全て解決するんでしょ?と言う考えを捨て、データを分析すると言う視点を身につけると言う意味で、参加してみると良いかもしれません。

賞金は、5~20万円ほどが上位に支給されます。

マクロミルデータコンペ

こちらは、大学生/大学院生を対象とした、ビジネスデータ分析コンペです。

マクロミルデータコンペの公式サイト

先ほどのNRIのコンペと似ていますが、参加対象が大学生/大学院生に絞られていることが特徴です。

毎年開催されており(2020年はコロナの影響により開催見送り)、テーマも複数用意されています。

参加している企業が大手ということもあり、就活生は参加してみることで企業との接点が得られるため、貴重な機会になると思います。

賞金はないですが、お題によっては何かしらの景品がもらえたり、もらえなかったり。。。

実際に参加して確かめてみてください。

まとめ

今回は、データ分析コンペについて、Kaggle、Signate、ProbSpace、Nishika、NRIデータコンペ、マクロミルデータコンペの6つを紹介しました。

それぞれに特徴があるため、面白いと思ったものがあればぜひ参加してみてください。

参加したいけど、まずはデータサイエンスを学んでからが良いって人は、以下記事もありますので参考にしてみてください。

データサイエンスを行うにあたって必要なスキル

それでは、良いデータ分析ライフをお過ごしください。


-データサイエンス
-, , ,

© 2020 はやぶさエンジニア Powered by AFFINGER5