データサイエンス

【賞金あり】データ分析コンペ比較

くるまる

くるまる

ベンチャーにてweb制作から機械学習まで幅広い分野を担当、その後、都内IT大企業にてデータサイエンティストとして現在勤務中。 エンジニアリングの知識を持ったビジネスマンになりたく、企画も奮闘中。 TOEIC885点。統計学。機械学習。

★本記事は5分で読み終わることができます。

【記事の信頼性】
何度もハッカソンに参加している京大卒の現役エンジニアの筆者が、データ分析コンペについて書いています。

未経験くん
データ分析コンペに参加したいけど、色々種類があってよく分からない
どのデータ分析コンペに参加したら良いのだろう
未経験ちゃん

本記事は、このような悩みを解決するため以下のデータ分析コンペについてまとめています。

データ分析コンペまとめ

  1. Kaggle
  2. Signate
  3. ProbSpace
  4. Nishika
  5. NRIデータコンペ
  6. マクロミルデータコンペ

データサイエンスの需要が高まると共に、データ分析コンペが様々なところで開かれるようになりました。
データ分析コンペとは、与えられたデータから機械学習や統計手法を使って様々なことの予測を行う大会のことです。

代表的なものでいうと、タイタニック号の乗客の情報(年齢、性別、宿泊ランクなど)から、タイタニック号の事故による生死を予測するというものがあります。

このようなデータ分析コンペは、賞金が出るというだけでなくここでの順位が転職や仕事の受注における一つの指標となるため、エンジニアだけでなく、非エンジニアの方にも人気のコンペとなっております。

じゃあ、具体的にどんなデータ分析コンペがあるの?って方のために、今回は、代表的なデータ分析コンペのプラットフォームである、Kaggle、Signate、probspaceなど合計6つのコンペを紹介していこうと思います。

Kaggle

kaggle

データ分析コンペの中で一番有名なコンペがKaggleです。「Kaggle公式サイト

Kaggleは、これまで350以上のコンペが開催され、登録者はなんと300万人以上、世界最大規模のデータ分析コンペサイトとなっています。

Kaggleでは、コンペの過去ランキングによってユーザに称号が与えられ、「称号」はしばしば就職や転職の際に資格と同等に扱われます

中でも、最上位ランクの「Grandmaster(グランドマスター)」は、世界に160人程度しかおらず、日本人に限っては10人程度しかいません。

そのため、このランクを持っていればデータサイエンティストとして、知識と経験を有している証明になります。

なお、ランクはGrandmaster、Master、Expert、Contributor、Noviceとなっています。

このうち、NoviceとContributorは簡単になれるので、初心者は、まずは二回の入賞でなれるExpertを目指してみると良いでしょう。

ちなみにコンペによっては賞金が存在し、総額100万円から多いものでは1億を超えるものもまで存在しています。

参考となる必読書

Kaggleで勝つデータ分析の技術」という本は、Kaggleに限らず「データ分析に必要な考え方と実践方法」が網羅されている必読書です。
私も何度も読み込んでいておすすめです。

具体的には以下のことを学ぶことができます。

学べるポイント】
 ・分析コンペについて
 ・分析タスクと評価指標
 ・特徴量の作成
 ・モデルの作成や評価
 ・モデルのチューニング
 ・アンサンブル

上記のポイントは、全てのデータ分析の基礎となる重要な知識なので読んでおいて損はないです。

created by Rinker
¥3,428 (2021/06/20 09:00:24時点 Amazon調べ-詳細)

Signate

signate

Signateは日本最大級のデータ分析コンペサイトです。

Signateの公式サイト

先ほどのKaggleは、世界的なデータ分析コンペですので、言語は全て英語で統一されていますが、このSignateは日本で開催されているデータ分析コンペのため、言語は日本語となっております。

そのため、英語を読むのは抵抗があると言う方は、Signateから初めてみるのが良いでしょう。

こちらもKaggleと似て、ランクが設定されており、その順序はGrandmaster、Master、Expert、Advanced、Intermediate、Beginnerとなっています。

賞金は先ほどのKaggleからは見劣りますが、それでも総額50~200万円ほどの賞金が用意されています。

参考になるUdemy講座

筆者がデータ分析を学ぶにあたってとても参考になったUdemy講座を紹介します。

ケーススタディになっていて非常にわかりやすいです。
是非、講座の初めの方は無料で見れるので試しに見てみて下さいね。

セール中に必ず買ってくださいね^ ^

【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門

Pythonで行うデータサイエンスを2つの課題を元に実践的に学べるオススメの講座です。セール中だと1500円で受講できますよ!

受講はこちら

ProbSpace

probspace

ProbSpaceも日本語版のデータ分析コンペのサイトです。

ProbSpaceの公式サイト

個人的には、Signateと比べてサイトがシンプルかつデータもシンプルであるため、初心者が学ぶにはうってつけのサイトであると感じています。

コンペとして主催されている内容も、給与推定やYouTube動画視聴回数予測など想像しやすい身近なテーマが多いため、領域の専門知識がなくても、取り掛かりやすいものが多いです。

コンペのスパンが短いことも特徴なので、気軽に沢山のコンペに出場してみることをおすすめします。

賞金は、1位の人に10万円が支給されると言うものが多いです。

コンペによっては、学生賞が用意されており、学生の中でトップの人に賞金が渡されると言うものもあるので、学生の方も社会人には勝てないと諦めずやってみると良いと思います。

参考になる書籍

「データ分析のための数理モデル入門 本質をとらえた分析のために」という本は、データ分析の勉強を体系的にしたいと思っている人へオススメの書籍があるので載せておきますね。

Nishika

nishika

Nishikaも日本版データ分析コンペのサイトです。

Nishikaの公式サイト

コンペの内容としては、レコメンドエンジン開発や株主価格予想など企業色の強いコンペが見られます。

実際の仕事でどのように機械学習を使用していくのかを知りたい人は、こちらを使ってみると良いかもしれません。

賞金は10万円から100万円まであるため、Signateの規模だと入賞は難しそうだけど、賞金が高いコンペを探したいと言う人は、一度サイトを覗いてみると良いと思います。

NRIデータコンペ

NRI データコンペ

こちらはNRIが毎年開催しているデータ分析コンペです。

NRIデータコンペの公式サイト

今まで紹介してきたコンペとは少し違っていて、機械学習がメインというよりかは、データから分析できることは何か、そしてそれをどうビジネスに活用すれば良いのか、と言うことを考えるコンペになっております。

そのため、機械学習とかは知らないけど、ビジネスセンスで勝負していきたいんだ!と言う人は参加してみると面白いと思います。

データサイエンスには、機械学習を使わなくても解ける問題もたくさんあります。

機械学習を知っている人でも、安易に機械学習を使えば全て解決するんでしょ?と言う考えを捨て、データを分析すると言う視点を身につけると言う意味で、参加してみると良いかもしれません。

賞金は、5~20万円ほどが上位に支給されます。

マクロミルデータコンペ

マクロミルデータコンペ

こちらは、大学生/大学院生を対象とした、ビジネスデータ分析コンペです。

マクロミルデータコンペの公式サイト

先ほどのNRIのコンペと似ていますが、参加対象が大学生/大学院生に絞られていることが特徴です。

毎年開催されており(2020年はコロナの影響により開催見送り)、テーマも複数用意されています。

参加している企業が大手ということもあり、就活生は参加してみることで企業との接点が得られるため、貴重な機会になると思います。

賞金はないですが、お題によっては何かしらの景品がもらえたり、もらえなかったり。。。

実際に参加して確かめてみてください。

まとめ

今回は、データ分析コンペについて、Kaggle、Signate、ProbSpace、Nishika、NRIデータコンペ、マクロミルデータコンペの6つを紹介しました。

それぞれに特徴があるため、面白いと思ったものがあればぜひ参加してみてください。

AIエンジニアに興味がある人は以下の記事で解説しているので是非確認してみてください。

AI エンジニアの年収は?海外の事例も合わせながら具体的に解説!

未経験くんAIエンジニアは年収が高いって聞くけど本当? 上記のような疑問を持った人向けの記事です。 本記事には以下のようなことが書いてあります。 AIエンジニアの国内外の年収を企業別、年代別に紹介。A ...

続きを見る

以下記事も人気です。

【5選】プログラミングスクールを現役エンジニアが本気で厳選してみた

こんにちは、フルスタックエンジニアのぐぅと申します^ ^ プログラミングは一番再現性が高く、誰もが身につけられるスキルです。「コードが正しければ動く」と言う不変の真理があるだけなので、プログラミング方 ...

続きを見る

  • この記事を書いた人
くるまる

くるまる

ベンチャーにてweb制作から機械学習まで幅広い分野を担当、その後、都内IT大企業にてデータサイエンティストとして現在勤務中。 エンジニアリングの知識を持ったビジネスマンになりたく、企画も奮闘中。 TOEIC885点。統計学。機械学習。

-データサイエンス
-, , ,

© 2021 はやぶさエンジニア Powered by AFFINGER5