- データサイエンスや機械学習に興味のある方
- データサイエンスコンペティションに参加してみたいが、方法がわからない方
- 実装力を高めたり、知識を深めたい方
こんにちは、機械学習講師の竹内です。
皆さんはデータサイエンスのコンペティションに参加したことはありますでしょうか。コンペティションでは世界中のデータサイエンティストが精度や実装力を競い合い、好成績を残した方は賞金や実績、名声を得られます。
今回はデータサイエンスコンペティションサイトとして有名な SIGNATE についてご紹介します。世界的に有名な Kaggle との違いも解説。ぜひ御覧ください!
DX を推進する AI ・データサイエンス人材育成コース
プログラミング未経験から、AI やデータサイエンスを学ぶことのできる 6 ヶ月間のコースです。転職実績も豊富で、自走できる AI人材を多く輩出しています。
SIGNATE とは
SIGNATE は、2018年4月にオープンしたAI開発コンペティションサイトです。データ分析に関するコンペティションを開催しており、好成績を残したデータサイエンティストは賞金や実績、データを提供した企業や団体は最適な分析結果が得られます。
コンペティションへの参加は無料ですので、初学者の方からすでにデータ分析に取り組まれている方まで、どなたでも参加可能です。
コンペティションの内容によっては参加者が限定されているものもあります。
SIGNATE の使い方
SIGNATE のヘッダーには上図のような項目があります。各項目に関してご紹介します。
-
- Competition
参加可能なコンペティションを探せます。
-
- Learning
コンペティションに参加するための知識を学習できます。
-
- Career
データサイエンス関連の求人情報を確認できます。
-
- Articles
SIGNATE 社が投稿した記事を確認できます。
Competition
出典:コンペティション一覧
企業や自治体から提供されるコンペティションに挑戦できます。「懸賞付き」に掲載されているお題では好成績の方に賞金が提供されます。株式会社スペースシフトのコンペティションでは 1 位の方に 50 万円が提供されたようです!
懸賞付き以外にも様々なコンペティションがありますので、取り組めそうなお題がないかぜひ探してみてください!
- SOTA (State-of-the-Art)
SIGNATE で過去に開催されたコンペティションの一部が掲載されています。過去のトップランカーの記録を塗り替えられるかに挑戦する内容となります。
出典:SOTA 一覧
- 称号限定
SIGNATE では各参加者に称号が与えられており、称号によって参加者が限定されているコンペティションが掲載されています。同じレベルのデータサイエンティストと精度を競争できます。
出典:称号限定 一覧
- 学生限定
参加者を学生限定としたコンペティションが掲載されています。学生データサイエンティスト No.1 を決める「Student Cup」が年 2 回開催されていますので、実装力を競いたい学生の方はぜひ挑戦してみてください!
出典:SIGNATE Student Cup 2021春: 楽曲のジャンル推定チャレンジ!!
- 練習問題
期限や賞金はありませんが、初学者向けの問題が掲載されています。機械学習のチュートリアルとしてよく扱われるお題(アヤメの分類、手書き文字の認識)もありますので、初めは練習問題から挑戦してみるのもよいかと思います。
出典:【練習問題】アヤメの分類
Learning
出典:Gym 一覧
コンペティションに参加するまでの基礎知識(Python について、ディープラーニングについて等)を学習できます。一部無料になっていますので、コンペティションに参加する実装力がまだ足りないと思われる方は、ぜひ確認してみてください。
Career
データサイエンス関連の求人情報を確認できます。コンペティションの成績によっては求人を出している企業からスカウトが来ることもあります。データサイエンティストへの転職を考えている方はぜひスカウトがもらえるようコンペティションに取り組んでみてください!
Articles
SIGNATE 社が投稿した記事を確認できます。コンペティションで好成績を残した方へのインタビュー記事等が載っておりますので、コンペティションに挑戦している人や工夫していることが気になる方はぜひ覗いてみてください。
コンペ参加 → 投稿までの流れ
それでは SIGNATE のコンペティションに挑戦してみましょう。具体的なステップは以下となります。
1 つずつ見ていきましょう。
STEP 1 : 開催中のコンペティションから参加したいものを選択
こちらのページから参加したいコンペティションを探してみましょう。本記事では初学者でも取り組みやすい練習問題の「アヤメの分類」を選択します。
STEP 2 : 参加規約へ同意
コンペティションのトップページの右側に「投稿」というボタンがありますのでそちらをクリックしましょう。クリックすると参加規約が表示されますので、内容を確認した後「コンペティション参加規約に同意する」を選択してから「参加する」をクリックしましょう。
STEP 3 : データと提出ルールの確認
タブにある「データ」を選択すると上記の画面が表示されますので、「ダウンロード」のアイコンから各データをダウンロードできます。
また「データ」タブには目的変数の説明や提出ファイルの形式も明記されていますのでこちらも合わせて確認しておきましょう。
STEP 4 : 学習モデルの作成、提出用ファイルの作成
STEP 3 でダウンロードしたデータを使用して学習モデルを作成しましょう。モデルを作成する際は Google Colaboratory を使用すると環境構築の手間が不要になったり、無料で GPU を使用できますのでオススメです。
モデルの評価指標に関しては「説明」タブの中にある「評価方法」タブから確認できますのでこちらは必ず確認しておきましょう。(私はこちらを確認するのを忘れ、何度提出しても精度が上がらないことに悩まされた経験があります…)
STEP 5 : 提出用ファイルを投稿
提出用の CSV ファイルが作成できたら投稿してみましょう!トップページの「投稿」ボタンをクリックするとファイルを選択する画面に遷移します。提出用の CSV ファイルを選択し投稿しましょう。(1 日 5 回までしか投稿できませんので注意してください。)
STEP 6 : 評価の確認
投稿が完了すると、トップページの「投稿済みファイル」タブから評価を確認することができます。また「リーダーボード」タブから投稿結果の順位も確認することができますので、今後は評価を見ながら精度を上げていく流れとなります。
Kaggle との違い
ここまで SIGNATE の使い方や投稿方法についてお伝えしてきました。データサイエンスのコンペティションサイトとして SIGNATE ももちろん有名ですが、世界的に有名なサイトとして Kaggle があります。
SIGNATE と Kaggle の違いについてメリット・デメリットという観点でお伝えします。
- 日本語で記載されているのでわかりやすい
- 参加人数が Kaggle よりも少ないため、賞金が狙いやすい
- コーディングの環境が用意されていない
- 他の参加者の実装内容が公開されていない
メリット 1 : 日本語で記載されているのでわかりやすい
SIGNATE と Kaggle の大きな違いは「日本語」で記載されているのか「英語」で記載されているのかです。SIGNATE は日本の企業が運営していますが、Kaggle は Google が運営しているので英語のみにしか対応していません。
そのため英語が苦手な方にとっては SIGNATE の方が取り組みやすいかと思います。
メリット 2 : 参加人数が Kaggle よりも少ないため、賞金が狙いやすい
2 つめの違いは参加人数です。SIGNATE は現在約 5 万人※1 が使用しているプラットフォームですが、Kaggle は約 100 万人以上※2 が使用しています。
そのため、参加人数が少ない SIGNATE の方が競争相手が少ないので賞金が狙いやすいと考えることもできます。
※1 : 国内最大のデータサイエンスプラットフォーム《SIGNATE》が、登録ユーザ数50,000人を突破
※2 : What is Kaggle, Why I Participate, What is the Impact?
デメリット 1 : コーディングの環境が用意されていない
Kaggle では上図のような kernel と呼ばれるコーディング環境が用意されており、環境構築不要で簡単にモデルを作成することができます。
しかし現在は Google Colaboratory と呼ばれるコーディング環境を Google 社が無料で提供してくれていますので、こちらは特に問題ないかと思います。
デメリット 2 : 他の参加者の実装内容が公開されていない
Kaggle では他の方の実装内容と精度が公開されていることがあり、どんな手法を使ったのかを学習できます。
初学者の方にとってはコードの内容を理解するだけでも大変かと思いますが、その分知識を深めることが可能なので、ハイレベルな学習教材として活用できるでしょう。
SIGNATE にも「フォーラム」タブにて実装内容が公開されていることもあるのですが、参加母数が SIGNATE と Kaggle ではかなり違うため、SIGNATE には実装内容が載っていないことが多いです。
最後に : 知識も実装力も実績も獲得しよう!
いかがでしたでしょうか。コンペティションに初めて投稿できるとかなり達成感がありますので興味のある方はぜひ挑戦してみてください!
- 自分の知識を深めたい!
- 自分の実装力を試してみたい!
- 実績を残して転職へのきっかけとしたい!
上記の方は今すぐ参加できそうなコンペティションを探して挑戦してみましょう!
まずは無料で学びたい方・最速で学びたい方へ
まずは無料で学びたい方: Python&機械学習入門コースがおすすめ
AI・機械学習を学び始めるならまずはここから!経産省の Web サイトでも紹介されているわかりやすいと評判の Python&機械学習入門コースが無料で受けられます!
さらにステップアップした脱ブラックボックスコースや、IT パスポートをはじめとした資格取得を目指すコースもなんと無料です!
最速で学びたい方:キカガクの長期コースがおすすめ
続々と転職・キャリアアップに成功中!受講生ファーストのサポートが人気のポイントです!
AI・機械学習・データサイエンスといえばキカガク!
非常に需要が高まっている最先端スキルを「今のうちに」習得しませんか?
無料説明会を週 2 開催しています。毎月受講生の定員がございますので確認はお早めに!
- 国も企業も育成に力を入れている先端 IT 人材とは
- キカガクの研修実績
- 長期コースでの学び方、できるようになること
- 料金・給付金について
- 質疑応答
DX を推進する AI ・データサイエンス人材育成コース
プログラミング未経験から、AI やデータサイエンスを学ぶことのできる 6 ヶ月間のコースです。転職実績も豊富で、自走できる AI人材を多く輩出しています。