データサイエンティストとして活動するためには、データ活用に関するポートフォリオが必要ですが、そのポートフォリオに含めることができるのが、Kaggleでのコンペ結果です。
Kaggleでのコンペを通じて、データサイエンスや機械学習のスキルを実践的に、学びを深めることができるため、Kaggleでのコンペ実績があると、転職活動を有利に進められるため、実施する方が多いのではないでしょうか。
英語のサイトで、とっつきづらいしいきなりコンペで実践的に学習を進めようとかできる気がしない!ハードル高すぎる!と思っていませんか。
Kaggleでいきなり賞金があるコンペに参加するのは確かにハードルたかいですよね!
Kaggleは過去コンペの参加者のコードを見ることができるので、学習のために積極的に活用したいサイトなんですよ!
Kaggleってそんな使い方があるんだ!どうやって活用していけばいいんだろう・・
この記事では、Kaggleをどのように活用していくかを解説し、また、Kaggleコンペが挑戦できるスクールはどういったものがあるのかを解説していきたいと思います。
Kaggleとは
Kaggle(カグル)とは、データサイエンスや機械学習に特化したオンラインプラットフォームで、世界中の機械学習・データサイエンスにかかわっている約40万人が参加しているコミュニティです。特に有名なところでは、データ分析コンペティションを提供しているところでしょう。
2010年に設立され、2017年からGoogle傘下のグループ企業です。
企業や政府が提示する課題に対して、参加者が自らの知識と技術を駆使して解決策を提案し、その精度を競い合う場をオンライン上で開催しています。
Kaggleの始め方
Kaggleはどうやって始めたらいいでしょうか。とりあえず、Kaggleアカウントは簡単に作成することができます。
Kaggle のHPに行くと、右上に「Register」ボタンがあるので、そのボタンを押してアカウントを作成します。
Googleアカウントで登録するか、メールアドレスを入力して登録するかどちらかを選んで登録ができます。
Googleアカウントを持っている場合は、煩わしいログイン情報を入力しないで済むので、「Register with Google」がおすすめです!
アカウント作成はこれでおしまいです!
Kaggleでは何ができるのか
Conpetition(コンペ)
Kaggleの目玉であるコンペでは、初学者むけのコンペや、企業や政府が、賞金を懸けて、精度の高い分析モデルを競争形式で競わせる本格的なコンペがあります。
過去のコンペでは、参加したメンバーの参加した際のNotebookが見られるようになっており、コードを確認することができるためかなり参考になります。
最初のうちは、勉強のために、過去の参加者のデータをもとに写経をおこなって勉強していくこともできますし、
初学者向けのコンペに参加して、自分でデータ分析の手法を試した結果を提出して、経験を積んでいくこともできます。
初学者向けのコンペとして、以下の二つは特に有名なコンペとなっています。
タイタニック号:災害からの機械学習
住宅価格:高度な回帰分析手法
Dataset(データセット)
データセットでは、Kaggleの各メンバーが公開しているデータセットを確認することができます。公開されたデータセットを使って、データ分析や、機械学習モデルに当て込む練習に利用することができるようになっています。
データセットはCovid-19の罹患数のようなものから、ゲームデータからとってきたデータセットなど面白そうなものまで、いろいろなデータが公開されています。
個人的に面白そうなデータををピックアップしてみました。
Spotifyのデータセットを使ったおすすめシステムを作る by VATSAL MAVANI
721種類のポケモンのデータセット by Alberto Barradas ポケモンの名前、タイプ、技、スピードなどの情報を集めたデータセット
あつまれどうぶつの森のアイテムカタログセット By Jessica Li
Code(コード)
また、Kaggleメンバーが機械学習モデルを実装した際の、Python/Rでの実際のCodeを解説しているノートブックを見ることができます。特に、Bronzや、Silver・Goldといったメダルを獲得しているアカウントのコードも見ることができるので、学習の参考になります。
実際にGoldやSilverの方のコードを自分の環境で写経して、実行してみるのも勉強になると思います。
ただ、ノートブックの中身はGoogle翻訳が実行できないため、英語のまま読んでいく必要があります。
Learn(まなぶ)
英語ではありますが、Pythonプログラミングから、機械学習、データビジュアライゼーション、SQLなど、機械学習・データサイエンスに関係する知識を無料で学習することができます。
基本的に英語の学習コンテンツで、Google翻訳をかけても、コンテンツ部分は適用されないため、英語のまま学習する必要があります。各ステップごとに練習問題が用意されているため、実際に手を動かしながら学習することができます。
Kaggleに挑戦できるプログラミングスクール7選
Kaggle上で無料で学習できるとはいえ、細かいニュアンスの意味が理解できないところがありそうで不安な場合は、最終的にKaggle挑戦ができるカリキュラムが組まれている日本のプログラミングスクールを探して、学習していくこともできます。
Kaggle挑戦が学習カリキュラム含まれているプログラミングスクールやMOCCがあるのでそれを利用してKaggleに慣れていきましょ~
え! びっくり!
スクールのカリキュラムでKaggle挑戦できるところもあるんだ!
Kaggleのコンペ挑戦をカリキュラムに取り入れているプログラミングスクールがあります。
各社の違いを調べてみました。
スクール名 | コース名 | スクールの 特徴 | 受講形式 | 価格帯 | Kaggle | コンペレベル | Kaggle 活用レベル | 学習期間 |
---|---|---|---|---|---|---|---|---|
テックジム | AIエンジニア養成コース | Kaggleに挑戦するための基礎知識を習得。自由な参加が可能。 | 通学のみ | 入会金:33,000円 サブスク月額:22,000円 | Kaggleデータセットを使用した教材 | – | 入門 | サブスク 学習期間の制限なし |
Aidemy Premium | データ分析講座 | データの自動取得から機械学習・時系列解析などを学ぶ | オンライン | 528,000円~ | 教材に使用 ・タイタニック号 生存者予測 | 過去コンペ | 入門 | 3~9か月 |
テックアカデミー | データサイエンスコース | 統計と機械学習の概要をつかむカリキュラム | オンライン | 社会人:¥185,900~ 学生: ¥174,900~ | 教材・修了課題に使用 ・タイタニック号 生存者予測 ・住宅価格予測 | 初学者向け コンペ | 入門 | 1~4か月 |
スタビジアカデミー | 株価予測コース | 実務に即したアニメーション動画で理解を促す。Kaggleを利用したプロジェクトも含。 | オンライン | サブスク月額: ¥1280/m プレミアム:¥149,800 | 教材に使用 ・株価予測コンペ | 初学者向け コンペ | 入門 | サブスク 学習期間の制限なし |
データラーニングスクール | データラーニングギルド | データサイエンス全般を網羅。Kaggleコンペへの参加も支援。キャリア面談も実施。 | オンライン | 入会金: ¥110,000 料金 ¥648,000 (給付金利用で¥227,400~) | 卒業後コミュニティ内でkaggleへのチーム参加 | アクティブ コンペまで 挑戦可 | 実践 | 学習期間の制限なし |
MITRAtech | データサイエンスコース | 実践特化型の講座 プロジェクトベースの学習 | オンライン | 社会人:¥480,000 学生: ¥270,000 | 卒業後 コンペ出場 | アクティブ コンペまで 挑戦可 | 実践 | 3か月 |
SAMURAI TERAKOYA | データサイエンスコース | 定額制で学ぶ40種類以上の自習教材 | オンライン | 12ヶ月プラン¥2,980~/m | 教材にKaggleコンペ | 初学者向け コンペ | 入門 | サブスク 学習期間の制限なし |
ここでは、学習者のレベルや指向性も違うと思うので、指向レベルを以下の2つに分けて検討してみます。
・入門から段階を踏んですこしずつステップアップしたい
・最終的にはアクティブコンペにも参加したいから、実践的なコンペもカリキュラムに含まれているスクールがいい
・入門から段階を踏んですこしずつステップアップしたい人には、Kaggleってどんなものか、アカウント開設の方法などの初歩から進められるスタビジアカデミーもしくは、テックアカデミーがいいと思います。挑戦できそうなところを進めるのに受講料を抑えながら進められるため、少しずつ理解を深めていけるのではと思います。
いやいや、最終的には実践的なスキルも身に着けられるようになりたい人には、少し受講料は高いですが、データラーニングスクールやMITRAtechがいいと思います。データラーニングスクールでは、データラーニングギルドというコミュニティを活発化させる施策を定期的に行っており、Kaggleの賞金がかかったコンペへのギルドチームとして参加している実績もあるようです。
Kaggleが学べるプログラミングスクールまとめ
データサイエンスや機械学習・AIプログラミングをまなぶ際に、活用するKaggleとはどういったサイトなのかを解説しました。データサイエンスやAIプログラミングを教えるスクールで、カリキュラムの中にKaggleが含まれているスクールを調べました。多くのスクールは、Kaggleの初学者向けのコンペを活用したコンテンツを展開しているようです。
スクール選びの参考にしていただけると嬉しいです。