リストの平均を計算する方法—統計とPythonの平均関数の詳細な説明

数学とプログラミングは密接に関係しています。あなたがプログラマーなら、ある時点で数学を使わなければならないでしょう。

データサイエンス、機械学習、人工知能、および暗号通貨はすべて、複雑な基礎となる数学的原理に基づいています。

ただし、数学関数の使用は複雑である必要はありません。Pythonはすべてを抽象化するため、概念を理解したら、実装の詳細を完全に理解する必要はありません。

数学は怖い必要はありません

あなたが出くわす数学関数はたくさんあります。データまたは分析を使用している場合は、いくつかの数学的原理と関数を理解することが重要です。

あなたが理解しなければならないそのような関数の1つはmean関数です。

名前に惑わされないでください。Pythonのmean関数については何の意味もありません(しゃれを意図したものではありません)。

この投稿は自己完結型ですが、Pythonの使用経験があり、Pythonリストとは何かを知っていることを期待しています。そうでない場合は、先に進む前にこの記事を確認してください。

終了したら、戻ってきて私と一緒にmean機能を深く掘り下げてください。

統計学

だからあなたはそのmean機能について学びたいのです。それは素晴らしいことです!しかし、この関数を見る前に、それが由来する分野である統計を見ることが重要です。

上の画像では、グラフが表示されています。グラフは、ある変数と別の変数の関係を示す画像表現です。

グラフを使用すると、データを整理して、データ間の傾向や関係をすばやく確認できるため、便利です。グラフは、データの視覚化と分析に使用できるツールの1つにすぎません。

統計は、データを分類、分析、解釈する体系的な方法を可能にする数学の一分野です。これは重要です。なぜなら、統計では、これらの各ことを実行するための既製のツールのコレクションがあるからです。

木片を切る必要があるたびにのこぎりを作り直す必要があると想像してみてください。同じことをしていても、多くの人が別の名前でのこぎりを呼んでいます。この問題を回避するために、誰もが参照できる名前を鋸に付けました。

統計でも同じことが起こります—誰もがよく知っているツールとしてよく知られているツールがあります。そのようなツールの1つが平均です。

モード、中央値、平均

平均値は完全に独立することができますが、通常、最頻値、中央値、平均値を含むトリオの一部として教えられます。

ここで何が起こっているのかを理解できるように、数字のグループを見てみましょう。以下の番号があると想像してください。

1、2、3、3、4、6、9

どの番号が最も頻繁に発生するかを表現したいとします。これは3になり、このプロパティに付ける名前はmodeです。モードは、調査しているセットの中で最も頻繁な数です。

順序集合の中央にある数値は中央値と呼ばれます。数値セットの中央値を見つけるには、数値を最小から最大の順に並べてから、中央の数値を確認します。上記の数字のセットはすでに最小から最大に配置されているため、中央値も3です。

最後に、平均は、セットの平均を参照する別の方法です。平均を見つけるには、すべての数値を合計し、それをセット内の要素の総数で割るだけです。上記の数値の場合、それらをすべて合計すると、28になります。セット内のアイテムの総数は7であるため、平均は4になります。

なぜ平均が必要なのですか?

したがって、この時点で、とにかく数値の平均を見つける必要があるのはなぜか疑問に思われるかもしれません。

重要なのは、統計自体でさえいくつかのグループに細分されているということです。木材を扱うために使用されるツールや金属を扱うために使用されるツールがあるのと同じように、統計の一部のツールは、同様の目的で使用されるため、クラスにグループ化されます。

統計におけるそのようなグループの1つは、要約統計と呼ばれます。統計が使用されるものの1つはデータを記述することであり、要約統計はその目的で使用されるツールのコレクションです。そのクラスのツールの項目の1つは平均です。

分布と呼ばれるものを分析するのに役立つため、平均は重要です。統計では、分布は、情報が必要な変数を調べるために使用する方法です。分布を使用して、この変数の値とその発生頻度を確認します。

データを収集する場合、よく見られる分布のタイプは、ベルカーブの形をとる正規分布です。

つまり、変数には、開始点と終了点だけでなく、傾向がある共通の値があります。

What the mean does is that it allows us to take a distribution like this and look at the central tendency of the variable, which is the point at which the values of the variable tend to cluster.

Thus we can say the mean describes the central tendency of the distribution.

Calculating the Mean in Python

We can manually calculate the mean if we have a small numerical data set it we have a few values to work with. However, when we have hundreds or thousands of values in a data set it becomes impossible to calculate it by hand.

Since Python is a "batteries included" language, the way we can do this is to use the mean function of the statistics module within Python.

Let's use the mean function to calculate the mean of the numerical data set we had earlier in the post:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Our code consists of a 4 step sequence that we can use to calculate the mean:

  1. We import the statistics module that contains our mean function
  2. We create a Python list containing the numerical data set of which we would like to calculate the mean
  3. We calculate the mean and store the result in a variable, calc_mean
  4. We output our calculated mean so that we can get visual feedback

When we run the code, we will get the following output:

The program outputs the same value as our manual calculations. When we are working with large data sets, this function will be able to scale to handle whatever we can throw at it.

Wrapping Up

In this post we looked at the mean function in Python. We began by discussing statistics as a whole, then took a deep dive into mean.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

コードレスデータ構造とアルゴリズム-1行のコードを記述せずにDSAを学ぶ|アームストロングスベロ| Apressこの本は、完全にコードフリーで、アルゴリズムとデータ構造に関する新しい視点をもたらします。コードエディタを開いたり、コンパイラを使用したり、統合開発環境(IDE)を調べたりすることなく、データ構造アルゴリズム(DSA)について学習します。...ArmstrongSubero検索メニューカートVカートは現在空です。ログインAccountBookshelfログインApressアクセス