そのため、 Excel(Excel)を使用して分散を計算するように求められましたが、それが何を意味するのか、またはそれをどのように行うのかがわかりません。心配しないでください。これは簡単な概念であり、さらに簡単なプロセスです。あなたはすぐに分散プロになります!
分散とは何ですか?
「分散(Variance)」は、平均からの平均距離を測定する方法です。「平均」は、データセット内のすべての値の合計を値の数で割ったものです。分散(Variance)は、そのデータセットの値が平均して平均に均一に固執する傾向があるのか、それともあちこちに散らばる傾向があるのかを示します。
数学的には、分散はそれほど複雑ではありません。
- 一連の値の平均を計算します。平均を計算するには、すべての値の合計を値の数で割った値を取ります。
- セット内のすべての値を取得し、平均から減算します。
- 結果(Square)の値を2乗します(負の数をキャンセルするため)。
- すべての2乗値を(Add)合計します。
- 分散を取得するには、2乗値の平均を計算します。
ご覧のとおり、計算するのは難しい値ではありません。ただし、数百または数千の値がある場合、手動で行うには永遠に時間がかかります。したがって、 Excel(Excel)がプロセスを自動化できるのは良いことです。
差異は何に使用しますか?
分散自体には多くの用途があります。純粋に統計的な観点からは、データセットがどの程度広がっているかを表すのに適した簡単な方法です。投資家は分散を使用して、特定の投資のリスクを推定します。
たとえば、ある期間にわたる株式の価値を取得し、その分散を計算することにより、過去のボラティリティについての良いアイデアを得ることができます。(stock’s value)過去が未来を予測するという仮定の下では、分散の小さいものがより安全で予測可能であることを意味します。
また、さまざまな期間にわたる何かの分散を比較することもできます。これは、別の隠れた要因が何かに影響を及ぼし、その分散を変化させていることを検出するのに役立ちます。
分散は、標準偏差と呼ばれる別の統計にも強く関連しています。分散の計算に使用される値は2乗されていることに注意してください。(Remember)これは、分散が元の値の同じ単位で表されていないことを意味します。標準偏差では、値を元の単位に戻すために分散の平方根を取る必要があります。したがって、データがキログラムであった場合、標準偏差も同様です。
母集団(Between Population)と標本分散(Sample Variance)のどちらかを選択する
Excelには、数式がわずかに異なる2つのサブタイプの分散があります。どちら(Which one)を選択するかは、データによって異なります。データに「母集団」全体が含まれている場合は、母分散を使用する必要があります。この場合、「母集団」とは、ターゲット母集団グループのすべてのメンバーにすべての値があることを意味します。
たとえば、左利きの人の体重を見ると、人口には左利きの地球上のすべての個人が含まれます。それらすべてを比較検討した場合は、母分散を使用します。
もちろん、実際の生活では、私たちは通常、より大きな母集団からのより小さなサンプルに落ち着きます。この場合、標本分散を使用します。母集団(Population)の分散は、母集団が小さい場合でも実用的です。たとえば、会社には、各従業員に関するデータを持つ数百または数千人の従業員がいる場合があります。それらは、統計的な意味での「母集団」を表します。
適切な分散式の選択
Excelには、3つのサンプル分散式と3つの母分散式があります。
- (VAR)サンプル分散のVAR、VAR.S、VARA 。
- 母分散のVARP(VARP)、VAR.P、およびVARPA。
VARとVARPは無視してかまいません。これらは時代遅れであり、レガシースプレッドシートとの互換性のためだけに存在します。
これにより、一連の数値の分散を計算するためのVAR.SとVAR.P 、およびテキスト文字列を含む(VAR.P)VARAとVARPAが残ります。
VARAとVARPAは、「TRUE」と「FALSE」を除いて、任意のテキスト文字列を数値0に変換します。これらはそれぞれ1と0に変換されます。
最大の違いは、VAR.SとVAR.Pが数値以外の値をスキップすることです。これにより、これらのケースが値の総数から除外されます。つまり、平均を取得するために少数のケースで除算するため、平均値は異なります。
Excelで分散を計算する方法
Excelで分散を計算するために必要なのは、値のセットだけです。以下の例ではVAR.S(VAR.S)を使用しますが、使用する分散式に関係なく、式とメソッドはまったく同じです。
- 範囲または離散値のセットの準備ができていると仮定して、選択した空のセル(empty cell)を選択します。
- 数式フィールドに「=VAR.S(XX:YY)と入力します。ここで、X値とY値は、範囲の最初と最後のセル番号に置き換えられます。
- Enterキー(Enter)を押して、計算を完了します。
または、特定の値を指定することもできます。その場合、式は=VAR.S(1,2,3,4)のようになります。数値を、の分散を計算するために必要なものに置き換えます。このように手動で最大254個の値を入力できますが、値が少数でない限り、ほとんどの場合、データをセル範囲に入力してから、上記の数式のセル範囲バージョンを使用することをお勧めします。
あなたは、Er、ExcelでExcelをすることができます
分散の計算は、 Excel(Excel)で統計作業を行う必要がある人にとって知っておくと便利なトリックです。ただし、この記事で使用したExcelの用語のいずれかがわかりにくい場合は、 Microsoft Excelの基本チュートリアル–Excelの使用方法の学習(Microsoft Excel Basics Tutorial – Learning How to Use Excel)を確認することを検討してください。
一方、さらに準備ができている場合は、[線形回帰トレンドラインをExcel散布図に追加]を(Add a Linear Regression Trendline to an Excel Scatter Plot)チェックして、算術平均に関連するデータセットの分散またはその他の側面を視覚化できるようにします。
How to Calculate Variance in Excel
So you’νe been asked to calculate variance using Excel, but yоu aren’t sure what that means or how to do it. Don’t worry, it’ѕ an easy concept and even easіer procesѕ. You’ll be a variance pro in no time!
What Is Variance?
“Variance” is a way to measure the average distance from the mean. The “mean” is the sum of all values in a dataset divided by the number of values. Variance gives us an idea of whether the values in that data set tend, on average, to stick uniformly to the mean or scatter all over the place.
Mathematically, variance isn’t that complex:
- Calculate the mean of a set of values. To calculate the mean, take the sum of all the values divided by the number of values.
- Take every value in your set and subtract it from the mean.
- Square the resulting values (to cancel out negative numbers).
- Add all the squared values together.
- Calculate the mean of the squared values to get the variance.
So as you can see, it’s not a hard value to calculate. However, if you have hundreds or thousands of values, it would take forever to do manually. So it’s a good thing that Excel can automate the process!
What Do You Use Variance For?
Variance by itself has a number of uses. From a purely statistical perspective, it’s a good shorthand way to express how spread out a set of data is. Investors use variance to estimate the risk of a given investment.
For example, by taking a stock’s value over a period of time and calculating its variance, you’ll get a good idea of its volatility in the past. Under the assumption that the past predicts the future, it would mean that something with low variance is safer and more predictable.
You can also compare the variances of something across different time periods. This can help detect when another hidden factor is influencing something, changing its variance.
Variance is also strongly-related to another statistic known as the standard deviation. Remember that the values used to calculate variance are squared. This means that variance is not expressed in the same unit of the original value. The standard deviation requires taking the square root of variance to return the value to its original unit. So if the data was in kilograms then the standard deviation is as well.
Choosing Between Population and Sample Variance
There are two subtypes of variance with slightly different formulas in Excel. Which one you should choose depends on your data. If your data includes the entire “population” then you should use population variance. In this case “population” means that you have every value for every member of the target population group.
For example, if you’re looking at the weight of left-handed people, then the population includes every individual on Earth who’s left-handed. If you’ve weighed them all, you’d use population variance.
Of course, in real life we usually settle for a smaller sample from a larger population. In which case you’d use sample variance. Population variance is still practical with smaller populations. For example, a company may have a few hundred or few thousand employees with data on each employee. They represent a “population” in the statistical sense.
Choosing the Right Variance Formula
There are three sample variance formulas and three population variance formulas in Excel:
- VAR, VAR.S and VARA for sample variance.
- VARP, VAR.P and VARPA for population variance.
You can ignore VAR and VARP. These are outdated and are only around for compatibility with legacy spreadsheets.
That leaves VAR.S and VAR.P, which are for calculating the variance of a set of numerical values and VARA and VARPA, which include text strings.
VARA and VARPA will convert any text string to the numerical value 0, with the exception of “TRUE” and “FALSE”. These are converted to 1 and 0 respectively.
The biggest difference is that VAR.S and VAR.P skip over any non-numerical values. This excludes those cases from the total number of values, which means the mean value will be different, because you’re dividing by a smaller number of cases to get the mean.
How to Calculate Variance in Excel
All you need to calculate variance in Excel is a set of values. We’re going to use VAR.S in the example below, but the formula and methods are exactly the same regardless of which variance formula you use:
- Assuming you have a range or discrete set of values ready, select the empty cell of your choice.
- In the formula field, type =VAR.S(XX:YY) where the X and Y values are replaced by the first and last cell numbers of the range.
- Press Enter to complete the calculation.
Alternatively, you can specify specific values, in which case the formula looks like =VAR.S(1,2,3,4). With the numbers replaced with whatever you need to calculate the variance of. You can enter up to 254 values manually like this, but unless you only have a handful of values it’s almost always better to enter your data in a cell range and then use the cell range version of the formula discussed above.
You Can Excel at, Er, Excel
Calculating variance is a useful trick to know for anyone who needs to do some statistical work in Excel. But if any of the Excel terminology we used in this article was confusing, consider checking out Microsoft Excel Basics Tutorial – Learning How to Use Excel.
If, on the other hand, you’re ready for more, check out Add a Linear Regression Trendline to an Excel Scatter Plot so you can visualize variance or any other aspect of your data set in relation to the arithmetic mean.