何千ものデータポイントに基づいて、インターネット上のすべてのデータサイエンス入門コースをランク付けしました

1年前、私はカナダで最高のコンピュータサイエンスプログラムの1つを中退しました。私はオンラインリソースを使用して独自のデータサイエンス修士プログラムを作成し始めました。代わりに、edX、Coursera、Udacityを通じて必要なすべてを学ぶことができることに気づきました。そして、私はそれをより速く、より効率的に、そしてほんのわずかな費用で学ぶことができました。

もうすぐ終わりです。私は多くのデータサイエンス関連のコースを受講し、さらに多くの部分を監査しました。私はそこにある選択肢と、データアナリストまたはデータサイエンティストの役割の準備をしている学習者に必要なスキルを知っています。数か月前、私はデータサイエンス内の各科目に最適なコースを推奨するレビュー主導のガイドの作成を開始しました。

シリーズの最初のガイドとして、初心者のデータサイエンティストにいくつかのコーディングクラスをお勧めしました。それからそれは統計と確率のクラスでした。

次に、データサイエンスの概要について説明します。

(データサイエンスコースの概要が何を意味するのかわからなくても心配しないでください。すぐに説明します。)

このガイドでは、2017年1月の時点で提供されているデータサイエンスコースのすべてのオンライン入門を特定し、シラバスとレビューから重要な情報を抽出し、評価をまとめるのに10時間以上費やしました。このタスクでは、オープンソースのClass Centralコミュニティと、何千ものコース評価とレビューのデータベースに他なりませんでした。

2011年以来、ClassCentralの創設者であるDhawalShahは、間違いなく世界中の誰よりもオンラインコースに注目してきました。Dhawalは、私がこのリソースのリストを作成するのを個人的に手伝ってくれました。

検討するコースをどのように選んだか

各コースは、次の3つの基準を満たす必要があります。

  1. データサイエンスのプロセスを教える必要があります。それについてはすぐに詳しく説明します。
  2. オンデマンドであるか、数か月ごとに提供される必要があります。
  3. インタラクティブなオンラインコースである必要があるため、本や読み取り専用のチュートリアルはありません。これらは実行可能な学習方法ですが、このガイドではコースに焦点を当てています。

上記の基準を満たすすべての注目すべきコースをカバーしたと信じています。Udemyには何百ものコースがあるように見えるので、最もレビューされ、最も評価の高いコースのみを検討することにしました。ただし、何かを見逃す可能性は常にあります。ですから、良いコースを省略した場合は、コメントセクションでお知らせください。

コースの評価方法

Class Centralおよびその他のレビューサイトからの平均評価とレビュー数をまとめて、各コースの加重平均評価を計算しました。テキストレビューを読み、このフィードバックを使用して数値評価を補足しました。

2つの要因に基づいて主観的なシラバス判断の呼び出しを行いました。

1.データサイエンスプロセスの範囲。コースは特定の科目をブラッシュオーバーまたはスキップしますか?特定の主題を詳細にカバーしすぎていませんか?このプロセスの内容については、次のセクションを参照してください。

2.一般的なデータサイエンスツールの使用。コースはPythonやRなどの一般的なプログラミング言語を使用して教えられていますか?これらは必須ではありませんが、ほとんどの場合に役立つため、これらのコースがわずかに優先されます。

データサイエンスプロセスとは何ですか?

データサイエンスとは何ですか?データサイエンティストは何をしますか?これらは、データサイエンスコースの概要で答える必要のある基本的な質問の種類です。ハーバード大学のJoeBlitzstein教授とHanspeterPfister教授による次のインフォグラフィックは、これらの質問に答えるのに役立つ典型的なデータサイエンスプロセスの概要を示しています。

このデータサイエンス入門コースの目標は、データサイエンスプロセスに精通することです。プロセスの特定の側面についてあまり深く取り上げたくないので、タイトルの「紹介」の部分です。

理想的なコースでは、各側面について、プロセスのフレームワーク内の主要な概念を説明し、一般的なツールを紹介し、いくつかの例を提供します(できれば実践的)。

紹介を探しているだけです。したがって、このガイドには、ジョンズホプキンス大学のCourseraに関するデータサイエンススペシャライゼーションやUdacityのデータアナリストナノディグリーのような完全なスペシャライゼーションやプログラムは含まれていません。これらのコースの編集は、このシリーズの目的を回避します。データサイエンス教育を構成する各科目に最適な個別のコースを見つけることです。このシリーズの記事の最後の3つのガイドでは、データサイエンスプロセスの各側面について詳しく説明します。

基本的なコーディング、統計、および確率の経験が必要です

以下にリストされているいくつかのコースには、基本的なプログラミング、統計、および確率の経験が必要です。新しいコンテンツが適度に進んでおり、これらの科目には多くの場合、それらに特化したいくつかのコースがあることを考えると、この要件は理解できます。

この経験は、このデータサイエンスキャリアガイドの最初の2つの記事(プログラミング、統計)の推奨事項を通じて取得できます。

データサイエンスコースの最良の入門書として私たちが選んだのは…

  • データサイエンスAZ™:実際のデータサイエンス演習が含まれています(Kirill Eremenko / Udemy)

キリルエレメンコのUdemyのデータサイエンスAZ™は、資格を取得した20以上のコースのデータサイエンスプロセスの範囲と範囲の深さの点で明らかに勝者です。3,071件のレビューで4.5つ星の加重平均評価があり、検討対象のコースの中で最も評価が高く、最もレビューされているコースの1つです。

プロセス全体の概要を説明し、実際の例を示します。21時間のコンテンツで、それは良い長さです。レビュー担当者は、インストラクターの配信とコンテンツの構成が大好きです。価格は頻繁に行われるUdemyの割引によって異なるため、わずか10ドルでアクセスを購入できる場合があります。

「一般的なデータサイエンスツールの使用」ボックスはチェックされていませんが Python / R以外のツールの選択肢(gretl、Tableau、Excel)がコンテキストで効果的に使用されています。Eremenkoは、gretlの選択を説明するときに次のように述べています(gretlは統計ソフトウェアパッケージです)が、彼が使用するすべてのツールに適用されます(私の強調):

gretlでは、RやPythonと同じようにモデリングを行うことができますが、コーディングする必要はありません。それはここで大したことです。すでにRをよく知っている人もいれば、まったく知らない人もいます。私の目標は、堅牢なモデルを構築する方法を示し、選択した任意のツールに適用できるフレームワークを提供することです。gretlは、コーディングで行き詰まるのを防ぐのに役立ちます。

ある著名なレビュアーは次のように述べています。

キリルは私がオンラインで見つけた最高の先生です。彼は実際の例を使用し、一般的な問題を説明して、コースワークをより深く理解できるようにします。彼はまた、不十分なデータを扱うことからCクラスの管理者にあなたの仕事を提示することまで、データサイエンティストであることの意味について多くの洞察を提供します。初心者から中級のデータアナリストまで、このコースを強くお勧めします。

Pythonに焦点を当てた素晴らしい紹介

  • データ分析入門(Udacity)

Udacityのデータ分析入門は、Udacityの人気のあるデータアナリストNanodegreeの一部である比較的新しい製品です。モデリングの面では少し欠けていますが、Pythonを使用してデータサイエンスプロセスを明確かつまとまりのある形でカバーしています。私の経験ではもっと短いですが、推定タイムラインは36時間(6週間で週に6時間)です。2件のレビューで5つ星の加重平均評価があります。これは無料。

ビデオはよく制作されており、インストラクター(Caroline Buckey)は明確で人懐っこいです。多くのプログラミングクイズは、ビデオで学んだ概念を強制します。学生は、新しいおよび/または改善されたNumPyおよびPandasスキル(これらは人気のあるPythonライブラリです)に自信を持ってコースを離れます。Nanodegreeで採点およびレビューされますが、無料の個別コースでは評価されない最終プロジェクトは、ポートフォリオに追加するのに最適です。

レビューデータのない印象的な製品

  • データサイエンスの基礎(ビッグデータ大学)

Data Science Fundamentalsは、IBMのビッグデータ大学が提供する4コースのシリーズです。これには、データサイエンス101、データサイエンス方法論、オープンソースツールを使用したデータサイエンスハンズオン、およびR101というタイトルのコースが含まれています。

データサイエンスプロセス全体をカバーし、Python、R、およびその他のいくつかのオープンソースツールを紹介します。コースは途方もない生産価値を持っています。最後に「R101」コースを受講するかどうかによって、13〜18時間の作業が見積もられますが、このガイドの目的には必要ありません。残念ながら、この分析に使用した主要なレビューサイトのレビューデータがないため、上記の2つのオプションよりも推奨することはできません。これは無料。

競争

私たちの#1ピックは、3,068件のレビューで5つ星のうち4.5の加重平均評価を持っていました。評価の降順でソートされた他の選択肢を見てみましょう。その言語での紹介に設定されている場合は、以下にいくつかのRに焦点を当てたコースがあります。

  • Python for Data Science and Machine Learning Bootcamp(Jose Portilla / Udemy):ツールに重点を置いた完全なプロセスカバレッジ(Python)。プロセス主導型ではなく、Pythonの非常に詳細な紹介です。このガイドの範囲には理想的ではありませんが、すばらしいコースです。以下のJoseのRコースのように、Python / Rの紹介とデータサイエンスの紹介の両方を兼ねることができます。21.5時間のコンテンツ。それは持って4.7 1,644件のオーバー-星加重平均格付けを。費用は、頻繁に発生するUdemyの割引によって異なります。
  • Rを使用したデータサイエンスと機械学習のブートキャンプ(Jose Portilla / Udemy):ツールを多用するフォーカス(R)による完全なプロセスカバレッジ。このガイドの範囲には理想的ではありませんが、プロセス主導型ではなく、Rの非常に詳細なイントロです。すばらしいコースです。上記のJoseのPythonコースと同様に、Python / Rの紹介とデータサイエンスの紹介の両方を兼ねることができます。 18時間のコンテンツ。それは持っている4.6 847件のオーバー-星加重平均格付けを。費用は、頻繁に発生するUdemyの割引によって異なります。
  • Pythonを使用したデータサイエンスと機械学習—実践!(Frank Kane / Udemy):部分的なプロセスカバレッジ。統計と機械学習に焦点を当てています。まともな長さ(9時間のコンテンツ)。Pythonを使用します。それは持って4.5 3104件のオーバー-星加重平均格付けを。費用は、頻繁に発生するUdemyの割引によって異なります。
  • データサイエンス入門(Data Hawk Tech / Udemy):完全なプロセスカバレッジですが、カバレッジの深さは限られています。非常に短い(3時間のコンテンツ)。RとPythonの両方について簡単に説明します。それは持っている4.4 62件のオーバー-星加重平均格付けを。費用は、頻繁に発生するUdemyの割引によって異なります。
  • 応用データサイエンス:はじめに(シラキュース大学/黒板によるオープン教育):完全なプロセスカバレッジですが、均等に普及していません。基本的な統計とRに重点を置いています。このガイドの目的には、適用が多すぎてプロセスの焦点が不十分です。オンラインコースの経験はバラバラに感じます。それは持っている4.33 6件のレビューを超える加重平均格付け-星を。自由。
  • データサイエンス入門(Nina Zumel&John Mount / Udemy):部分的なプロセスカバレッジのみですが、データの準備とモデリングの側面については十分な深さがあります。大丈夫長さ(6時間のコンテンツ)。Rを使用します。101件のレビューで4.3つ星の加重平均評価があります。費用は、頻繁に発生するUdemyの割引によって異なります。
  • Pythonを使用した応用データサイエンス(V2 Maestros / Udemy):プロセスの各側面を十分にカバーする完全なプロセスカバレッジ。まともな長さ(8.5時間のコンテンツ)。Pythonを使用します。それは持っている4.3 92件のオーバー-星加重平均格付けを。費用は、頻繁に発生するUdemyの割引によって異なります。
  • データサイエンティストになりたいですか?(V2 Maestros / Udemy):カバレッジの深さは限られていますが、完全なプロセスカバレッジ。非常に短い(3時間のコンテンツ)。限られたツールカバレッジ。それは持っている4.3 790件のオーバー-星加重平均格付けを。費用は、頻繁に発生するUdemyの割引によって異なります。
  • Data to Insight:データ分析の概要(オークランド大学/ FutureLearn):対象範囲の広さは不明です。データの探索、発見、視覚化に焦点を当てていると主張しています。オンデマンドでは提供されません。24時間のコンテンツ(8週間にわたって週に3時間)。それは持っている4 2件のオーバー-星の加重平均格付けを。有料の証明書が利用可能で無料。
  • データサイエンスオリエンテーション(Microsoft / edX):部分的なプロセスカバレッジ(モデリングの側面が欠けています)。Excelを使用します。これは、Microsoftブランドのコースであることを考えると理にかなっています。12〜24時間のコンテンツ(6週間にわたって週に2〜4時間)。それは持っている3.95 40件のレビューを超える加重平均格付け-星を。25ドルで利用可能な検証済み証明書で無料。
  • Data Science Essentials(Microsoft / edX):各側面を十分にカバーする完全なプロセスカバレッジ。 R、Python、およびAzure ML(Microsoft機械学習プラットフォーム)について説明します。ツールの選択(Azure ML)とインストラクターの不十分な配信を引用するいくつかの1つ星のレビュー。 18〜24時間のコンテンツ(6週間にわたって週に3〜4時間)。それは持っている3.81 67件のオーバー加重平均格付け-星を。 49ドルで利用可能な検証済み証明書で無料。
  • Rを使用した応用データサイエンス(V2 Maestros / Udemy):上記のV2MaestrosのPythonコースのRコンパニオン。プロセスの各側面について十分なカバレッジの深さを備えた完全なプロセスカバレッジ。まともな長さ(11時間のコンテンツ)。 Rを使用します。212件のレビューで3.8つ星の加重平均評価があります。費用は、頻繁に発生するUdemyの割引によって異なります。
  • データサイエンス入門(Udacity):部分的なプロセスカバレッジですが、カバーされているトピックについては十分な深さです。 Udacityには探索的データ分析(EDA)に関する優れたフルコースがありますが、探索的側面が欠けています。長さは48時間(8週間で週6時間)と主張していますが、私の経験ではもっと短いです。一部のレビューでは、高度なコンテンツへの設定が不足していると考えています。混乱しているように感じます。 Pythonを使用します。それは持っている3.61 18件のオーバー加重平均格付け-星を。自由。
  • Pythonでのデータサイエンス入門(ミシガン大学/コースセラ):部分的なプロセスカバレッジ。Pythonスペシャライゼーションを使用した応用データサイエンスのコース#2と#3はこれらの側面をカバーしていますが、モデリングと視覚化はありません。このガイドの目的には、3つのコースすべてを受講することは深すぎます。Pythonを使用します。長さは4週間です。それは持っている3.6 15件のオーバー-星加重平均格付けを。無料と有料のオプションをご利用いただけます。
  • データ主導の意思決定(PwC / Coursera):ビジネスに焦点を当てた部分的なカバレッジ(モデリングが不足している)。R、Python、Excel、SAS、Tableauなどの多くのツールを紹介します。長さは4週間です。それは持っている3.5 2件のオーバー-星加重平均格付けを。無料と有料のオプションをご利用いただけます。
  • データサイエンスのクラッシュコース(ジョンズホプキンス大学/コースセラ):プロセス全体の非常に簡単な概要。このシリーズの目的には短すぎます。長さは2時間。それは持っている3.4 19件のオーバー-星加重平均格付けを。無料と有料のオプションをご利用いただけます。
  • データサイエンティストのツールボックス(ジョンズホプキンス大学/コースセラ):プロセス全体の非常に簡単な概要。ジョンズホプキンス大学のデータサイエンススペシャライゼーションのセットアップコースの詳細。4〜16時間のコンテンツ(4週間にわたって週に1〜4時間)があると主張していますが、あるレビューアは2時間で完了する可能性があると述べています。それは持っている3.22 182件のオーバー加重平均格付け-星を。無料と有料のオプションをご利用いただけます。
  • データ管理と視覚化(ウェズリアン大学/コースセラ):部分的なプロセスカバレッジ(モデリングが不足しています)。長さは4週間です。良い生産価値。PythonとSASを使用します。それは持っている2.67 6件のレビューを超える加重平均格付け-星を。無料と有料のオプションをご利用いただけます。

以下のコースは、2017年1月の時点でレビューがありません。

  • CS109データサイエンス(ハーバード大学):完全なプロセスカバレッジを非常に深く(おそらくこのシリーズの目的には深すぎます)。完全な12週間の学部コース。コースはオンラインで利用できるように設計されていないため、コースのナビゲーションは困難です。実際のハーバード大学の講義が撮影されています。上記のデータサイエンスプロセスのインフォグラフィックは、このコースに由来しています。Pythonを使用します。レビューデータはありません。自由。
  • ビジネス向けデータ分析の概要(コロラド大学ボルダー校/コースセラ校):ビジネスに焦点を当てた部分的なプロセスカバレッジ(モデリングと視覚化の側面が欠けている)。データサイエンスのプロセスは、講義では「情報とアクションのバリューチェーン」に偽装されています。長さは4週間です。いくつかのツールについて説明しますが、SQLについては詳細にしか説明していません。レビューデータはありません。無料と有料のオプションをご利用いただけます。
  • データサイエンス入門(Lynda):完全なプロセスカバレッジですが、カバレッジの深さは限られています。非常に短い(3時間のコンテンツ)。RとPythonの両方を紹介します。レビューデータはありません。費用はLyndaのサブスクリプションによって異なります。

まとめ

これは、データサイエンス分野に参入するための最高のオンラインコースをカバーする6部構成のシリーズの3番目です。最初の記事ではプログラミングについて、2番目の記事では統計と確率について説明しました。シリーズの残りの部分では、データの視覚化と機械学習など、他のデータサイエンスのコアコンピタンスについて説明します。

データサイエンスを学びたい場合は、これらのプログラミングクラスのいずれかから始めてください

データサイエンスを学びたい場合は、これらの統計クラスのいくつかを受講してください

最後の部分は、これらの記事の要約に加えて、データラングリング、データベース、さらにはソフトウェアエンジニアリングなどの他の重要なトピックに関する最高のオンラインコースです。

データサイエンスのオンラインコースの完全なリストをお探しの場合は、ClassCentralのデータサイエンスとビッグデータの件名ページで見つけることができます。

これを読んで楽しんだら、ClassCentralの他の部分をチェックしてください。

今すぐオンラインで無料で受講できる250のアイビーリーグコースをご紹介します

ブラウン、コロンビア、コーネル、ダートマス、ハーバード、ペン、プリンストン、エールからの250のMOOC。

データによると50の最高の無料オンライン大学コース

2011年11月にClassCentralを立ち上げたとき、約18の無料オンラインコースがあり、ほとんどすべてが…

見逃したコースの提案があれば、回答で知らせてください!

これが役に立った場合は、?をクリックしてください。だからもっと多くの人がここミディアムでそれを見るでしょう。

これは、Class Centralで公開された元の記事の要約版であり、コースの説明、シラバス、および複数のレビューが含まれています。