Excelでは関数を使って乱数を生成できます。乱数の範囲を指定したり、発生した乱数を固定することも可能です。また重複しないランダムな数字も関数を組み合わせることでできます。他にもランダムに並び替えたいときに役立つ方法を解説します。 ・1000→1.0E+3(1.0×10の3乗)→×1000倍 因みに外部リンクで、sumifやvlookupなどを使用しています。 また、列の非表示や、ソートでの行の非表示などはよく多用しています。 [管理] ボックスの一覧の [Excel アドイン] をクリックし、[設定] をクリックします。 乱数の生成 : Random Number Generation. エクセルの randbetween 関数の使い方を紹介します。randbetween 関数は指定した整数の範囲で乱数を発生させます。乱数を発生させランダムに並べ替えたいときに使用します。固定もできます。 データ分析ツールを用いて乱数を生成します [データ分析ツール] を用いて各種の分布に従う確率変数を簡単に生成することができます(メニューにない場合はアドインが必要です)。ここでは平均 170, 標準偏差 6 の正規分布を作成してみます。 [データ分析] コマンドが表示されない場合は、分析ツール アドイン プログラムを読み込む必要があります。 Excelでアドインの機能の中にある、 回帰分析でR2(決定係数)しかみていないのですが 友達にアドインを押して、分析ツールをエクセルに入れるといわれたのですが、アドインがどこにあるのかわからなく…。 =INDEX(B1:B5,RANDBETWEEN(1,5)), 症状としては、時々ある事なのですが、エクセル(2003)でファイルのリンクを ・100→1.0E+2(1.0×10の2乗)→×100倍 1. 教えてください。 それでは、エクセルの出現頻度を計算する方法を実際のデータ(架空)を用いて解説していきます。 このようにデータ数が多いと出現回数をカウントするのに時間がかかってしまいます。 エクセル2003は使っていないので、エクセル2000の場合を説明します。 ・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10 ・よって、『2.43E-19』とは? ・100→1.0E+2(1.0×10の2乗)→×100倍 ※イメージ 3.        : Excel ヘルプで検索。 参考URL:http://makotowatana.ld.infoseek.co.jp/vba_probability.html#RandomNumbers, エクセル2010を使ってデータ分析をしたいのですがどこにあるのかわかりません。 挿入のところでしょうか?データのところでしょうか? 分散分析~分析ツール編~ エクセルの分析ツールを用いて、2水準を持つ2要素で構成されたデータに対して分散分析を行う方法を紹介します。 データが下図のように並んでいる場合を考えましょう。 乱数生成分析ツールは、複数の分布のいずれかから描画される独立した乱数を範囲に入力します。 母集団の件名は、確率分布を使って特徴付けることができます。 たとえば、正規分布を使って個人の高さを特徴付けることができます。または、2 よろしくお願いいたします。, 「Excel アドイン」に関するQ&A: Excel 2003 アドインを消してしまいました, 「抽選 エクセル」に関するQ&A: 何かEXCELで『抽選』ができるみたいですが・・・, 「Excel 分析」に関するQ&A: Excel 分析ツールの回帰分析の分散分析表に関して, 「Excel アドイン」に関するQ&A: エクセルでメモリ不足のエラーが出ます, 「Excel 分析」に関するQ&A: エクセル2010を使ってデータ分析をしたいのですがどこにあるのかわかり, 「正規分布 エクセル」に関するQ&A: ±4σに入る確率について教えてください. 皆さんは独学されましたか?それとも講座などをうけたのでしょうか? 0からaまでの整数値が出力されます。パラメーターaとパラメーターbの指定が必要です。, 負の無限大から正の無限大までの実数値が出力されます。パラメーターの指定は必要ありません。, 負の無限大から正の無限大までの実数値が出力されます。パラメーターaとパラメーターbの指定が必要です。, ダイアログ上で設定した内容(確率分布の種類やパラメーター、出力する乱数の行数と列数、シード)が出力されます。, ダイアログ上で指定した「生成する乱数の数」×「生成する列数」個の乱数が出力されます。. 「抽選 エクセル」に関するQ&A: 応募ハガキはどうやって当選とかを選ぶんですか? 分析ツールだけでなくExcel関数を使用しても、正規分布に従う乱数を発生させることが出来ます。 第1部 中級 4 データ分析の基礎知識 ます。 が小さいときは手書きでも簡単に書くことができますが、が大きくなると複雑にな り過ぎるため、が小さいときに適した表現です。また、幹葉図を左に90度回転すると、 ヒストグラムと対応します。 Tweet; 関連記事. ・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100 分析例ファイル; 処理対象データ; 出力内容; 概要. ・E+数値は 10、100、1000 という大きい数を表します。 ・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。 よろしくお願いします。, 0~99 の範囲で乱数を出します 有名な分析ツールでは、SASやSPSSなどの有料なもの、RやPythonなどの無料なもの、色々あります。残念なことに、多くのビジネスパーソンにとって、あまり馴染みが深くありません。, 最近、誰でも使える分析ツールとして、BI(ビジネス・インテリジェンス)ツールと称したQV(クリック・ビュー)やTableau、PowerBIなどが浸透してきて来ます。しかし、分析といえるほど高度なことはできず、正直集計どまりです。比較的使い勝手の良いQVやTableauは、それなりの導入コストがかかります。, もっと身近で、使い慣れていて、これからそれほど導入コストもかからず、そこそこの分析のできるツールはないものでしょうか。, 多くのビジネス・パーソンは、Excelであれば使えることでしょう。このExcelが、それなりの分析ツールになれば非常にうれしいことでしょう。, ということで、Excelを最強の分析ツールに変えるべき諸設定と、その使い方について、何回かに分けて説明します。, RExcelとは、無料で使える分析ツールであるRを、Excelをユーザ・インターフェースにして使う仕組みのことです。要するに、Excel上からRを使うことができます。Rには、高度な分析機能がたくさんあります。最先端を分析アルゴリズムがあります。, 最近だと、PyhtonとExcelの連携のほうに興味のある方も多いかもしれません。, Excel分析ツールを使おうとしても、何も設定をしなければ、Excelのメニューに表示されません。Excel分析ツールの出し方、つまりExcel分析ツールのアドインを有効にする方法を、先ず説明します。, 最新のExcel 2016(Windows10)のケースで説明します。アドインを有効にする設定は、「Excelのオプション」でします。, 【管理】 の中からの【Excel アドイン】 を選択し【設定】ボタンを押します。そうすると、「アドイン」 ボックスが表示されます。, 「アドイン」ボックスで【分析ツール】をチェックし、【OK】ボタンを押します。これで「Excel 分析ツール」が使えるようになります。, メニューに、【データ分析】が表示されるようになります。利用するときは、この【データ分析】をクリックすればよいです。以下のように、色々な分析ができます。, 次回以降は、例としてExcel 分析ツールを使った「基本統計量」と「回帰分析」などの使い方について説明いたします。どちらも、営業データ分析やマーケティングのデータ分析をするとき、利用頻度が高いものです。, Excelを最強の分析ツールに変える(Excel 分析ツール編その2|基本統計量). 「挿入」→「名前」→「定義」の「参照範囲」を確認して、リンクが含まれていれば削除して見て下さい。 2. どういったふうに使用するかと事例を 読み込みが完了しExcelを再起動すると「データ」タブ内に「分析」の項目ができて「データ分析ボタン」が表示され使用可となります。   Worksheets("シートA").Activate 90~99 なら 2 を返します ・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては? 乱数を発生させたいのですがどうすればいいでしょうか? Eとは何でしょうか? ※通常このような重回帰分析を行うときは多重共線性に注意しなければなりません。今回のデータでは「分析ツール」機能の「相関」で予め多重共線性のチェックを行っています。, 実際に私のPC(メモリは8GB)を用いて、たった1列しかないデータで「分析ツール」機能を試したところ、15万行までは処理できましたが、, 「分析ツール」機能を使わず、関数を使用して指標の計算をしている場合、参照元のデータを入れ替えてあげるだけで指標も自動で再計算されます。しかし「分析ツール」, 機能を使用した場合、自動で出力結果が更新されないため、再度「分析ツール」機能を開いて計算する必要があります。, 本稿ではWindows版の導入方法を解説していきます。WindowsとMacでは導入方法が若干異なるので、Macの方は, カフェを経営していると、最近の売上が上昇傾向にあるのか下降傾向にあるのか知りたいと思います。しかし4月~6月の3ヶ月間の毎日の売上をグラフに起こすと、, ヒストグラムは、度数分布表を棒グラフのように表した図です。横軸に階級を置き、縦軸に度数を置き、, t検定は「母平均に対する検定」と呼ばれます。「今年の桃は例年より重いか」、「AとBのクラスで数学の平均点数に差はあるのか」など、, F検定は、比較するデータ間のばらつき(=分散)が等しいかどうかを検定する手法です。, 「入力範囲」で分析する2つデータ列をそれぞれ指定し、必要個所に入力をして「OK」を選択します。, )は分散が等しいかどうか判定するための閾値になります。通例0.05や0.001が選択されることが多いです。, 今回は「分散が等しくないと仮定した2標本による検定」用いて平均の差の検定を行います。, 3種類以上のデータに対してその平均に差があるかを確かめるときは、分散分析を用います。, 0.05より小さな値なため、3種類の商品間の売上平均に差があるといえそうです。同じ表の「平均」の欄を見ると、コーヒーCの売上金額がずば抜けて高いです。そのためこのコーヒーCの突出具合が今回の結果の要因になったと考えられます。, 2要因に関して関係性があるのかどうかを見たいとき、二元配置の分散分析を用いることができます。, 「繰り返しのない2元配置」は各要因の組み合わせに対して値が1つしかないのに対して、, クロス集計表全体を「入力範囲」に指定して、必要個所に記入し「OK」を選択します。今回もα(, 今回の出力先でも注目すべきは「P値」です。行(曜日)と列(商品)についてそれぞれこの「P値」が先ほど設定したα(, (<0.05)なため、売上の差に影響している要因といえます。この結果はケース⑥と一致していることが分かります。, 1.  0.000000000000000000243という数値を意味します。   シートAの値取得  2.43×1/10000000000000000000となり、 ・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。 エクセルのアニメーション処理の参考資料を探していた時に偶然見つけたサイトです。おすすめ。 [ファイル] タブをクリックし、[オプション] をクリックして、[アドイン] カテゴリをクリックします。 ・『指数』って分かりますか? ・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。 ご存知の方いらっしゃいましたら、是非ご教授お願いします。, 名前の定義の中の参照範囲にリンク先が含まれていませんか。 補足: [データ分析] コマンドが表示されない場合は、分析ツール アドイン プログラムを読み込む必要があります。 エクセルには「分析ツール」というアドインが存在します。このアドインを利用することで、誰でも簡単にデータ分析を始めることができます。8つのケースを通じて「分析ツール」について徹底 … Copyright (c)since 2016 Social Survey Research Information Co., Ltd. All rights reserved. 1の出現率は20%です。 70~89 なら 1 を返します Excel関数(NORM.INV関数、NORMINV関数)を使用して、正規分布に従う乱数を発生させてみよう . 収集したデータを分析するためにはいろいろな方法がありますが、中でもおすすめなのがエクセルの使用です。 しかし、エクセルをあまり使った経験がない人からすると、なかなか手が出しづらいかもしれません。 そこで今回は、エクセルを使った統計処理につい どうすれば回帰分析が分かるようになるのでしょうか? 2. 2の出現率は10%です。 できれば、それらともとの分布関数とをヒストグラムで比較して意図した乱数が発生できているかを検討したいのですが・・・。, こんにちは。 ・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。 Excelでアドインの機能の中にある、乱数発生の使い方がわかりません。どういったふうに使用するかと事例を教えていただけないでしょうか?よろしくお願いいたします。#2です。randbetween関数は正規分布した乱数を返しません。設定  2.43×0.0000000000000000001だから、 EXCELにて指数分布や正規分布、ポアソン分布などに従う   Worksheets("シートB").Activate また、回帰分析の数字の意味が良く分からないのですが、 この処理を行うと指定したシートへ強制的にとんでしまいます。。。 読み込みが完了しExcelを再起動すると「データ」タブ内に「分析」の項目ができて「データ分析ボタン」が表示され使用可となります。 編集→リンクの設定→リンクの編集→リンクの解除 このイメージ処理を行うとものすごい勢いで画面がチカチカします。。。 Excelでアドインの機能の中にある、乱数発生の使い方がわかりません。どういったふうに使用するかと事例を教えていただけないでしょうか?よろしくお願いいたします。#2です。randbetween関数は正規分布した乱数を返しません。設定 上記が起因しているかどうかは不明です。 ・10→1.0E+1(1.0×10の1乗)→×10倍 ・E-数値は 0.1、0.01、0.001 という小さい数を表します。 教えてください!, Worksheets("シートA").Range("A1") Next 参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90, ★回答 みたいな感じでできませんか?, エクセルの関数についての質問なのですが、 予定、計画、予算の管理 - Microsoft 365 では簡単に行うことができます, 複雑な統計学的分析や工学的分析を行わなければならない場合も、分析ツールを使用すれば、すばやく簡単に結果を得ることができます。 分析に必要なデータとパラメーターを指定すると、各ツールが統計用または工学用の適切なマクロ関数を使ってデータを分析し、計算結果を出力テーブルに表示します。 出力テーブルだけでなく、グラフを出力するツールもあります。, データ分析関数は、一度に 1 つのワークシートでのみ使用できます。 グループ化されたワークシートでデータ分析を実行すると、分析結果は 1 枚目のワークシートに表示され、残りのワークシートには空のテーブルが表示されます。 残りのワークシートでデータ分析を実行するには、ワークシートごとに分析ツールで再計算します。, 分析ツールには、以降のセクションで説明するツールが含まれます。 これらのツールにアクセスするには、[データ] タブの [分析] グループで [データ分析] をクリックします。 [データ分析] が表示されない場合は、分析ツール アドイン プログラムを読み込む必要があります。, [ファイル] タブをクリックします。[オプション] をクリックし、[アドイン] カテゴリをクリックします。, Excel 2007 を使用している場合は、[ Microsoft Office ボタン 多くの人は、エクセルでのデータ分析はなかなか難しいと思っているかもしれません。しかし、専門の分析ツールを使わなくとも、できることは意外に多いんです。, 「分析ツール」とはエクセルのアドインの一つで、クリックや簡単なパラメータの入力のみでデータ分析を可能にしてくれる機能です。, 「分析ツール」機能を使用すれば、特別な関数やコードを書く必要が一切ありません。導入も簡単ですので、初心者でも気軽にデータ分析を行うことができます。, 本記事では、エクセルにある「分析ツール」機能を使って、「エクセルのデータ分析でどこまでいけるのか」を8つのケースを通じて解説します。, この記事を読み終えたころには、「分析ツール」機能でデータ分析ができるようになっているはずです!, 「データ分析は難しいうえに時間がかかりそう」と考えられている方も少なくないと思います。しかし「分析ツール」機能を用いれば様々な分析を、1つ約30秒ほどで分析できてしまいます。, 「分析ツール」機能を使用したデータ分析は、マウスでポチポチするだけで行うことができます。具体的には、以下の3stepで分析を行います。, このように関数や追加列の作成などを行わずとも、かなり直感的な操作で簡単に分析することができます。, この「分析ツール」機能は、ヒストグラムの作成から回帰分析まで19種類もの分析を可能にしてくれます。以下は「分析ツール」機能で行える分析です。, 相関分析から統計的検定、回帰分析までサポートされているので、分析手法の基本どころは「分析ツール」でカバーできます。, ただ筆者が実際に分析を行っていて最も感銘を受けた点は、出力される値が一つだけではなく、その分析に関係する複数の指標を表やグラフの形式で出力してくれたことです。, 以下は、「分析ツール」機能を利用して回帰分析と移動平均の分析を行ったときの出力です。, 表やグラフの形にレイアウトを整える部分に時間がかかる場合もあるので、このようにすべて整えて出力されるのは大幅な時短につながります。, 「分析ツール」機能は大変便利な機能ですが、大きく3つの欠点があります。この欠点を抑えておくことで、効果的に「分析ツール」機能を使用できるようになります。, 「分析ツール」機能には19種類の分析手法が用意されていることは先ほど紹介いたしました。当たり前ですが、「分析ツール」機能ではこれ以外の分析手法はサポートもされていなければ、カスタムで追加することもできません。, もしサポートされていない分析を「分析ツール」機能のような手軽さで行いたい場合は、エクセルVBAというプログラミング言語を利用するか、ほかのツールを使用する必要があります。, 実際に私のPC(メモリは8GB)を用いて、たった1列しかないデータで「分析ツール」機能を試したところ、15万行までは処理できましたが、20万行になるとエクセルが応答しなくなりました。, もともとエクセルには約100万行までしかデータを格納することができず、数十万行のデータに関数を使用したりするとパフォーマンスが落ちます。, 「分析ツール」機能を使わず、関数を使用して指標の計算をしている場合、参照元のデータを入れ替えてあげるだけで指標も自動で再計算されます。しかし「分析ツール」機能を使用した場合、自動で出力結果が更新されないため、再度「分析ツール」機能を開いて計算する必要があります。, 短期間でデータが更新され、そのデータを逐一分析したい場合、「分析ツール」機能に依存していると毎回同じ作業を一から行う必要が出てきます。, 以上のように「分析ツール」機能にもその価値を発揮できないシーンがあります。そのため、以下が「分析ツール」を効果的に使用するときの3条件になります。, これらの条件をクリアしたら、それは分析ツールの使い所、とも言えます。それでは早速、「分析ツール」機能を導入して分析を行ってみたいと思います!, エクセルの「分析ツール」機能は初期設定ではオフになっているため、使用できる状態に設定してあげる必要があります。ただし特にダウンロードもしないので、とても簡単に導入して使用することができます。, 本稿ではWindows版の導入方法を解説していきます。WindowsとMacでは導入方法が若干異なるので、Macの方はこちらで導入方法を参照してみてください。(キャプチャではExcel2016を使用したものを掲載しています。), 分析ツールが導入できたら、さっそく架空のカフェのデータを利用して分析を行ってみたいと思います。今回の分析では、実務でよく見かける分析手法を用いて8つのケースを分析してみたいと思います。, 全ての操作のキャプチャを掲載しているので、手元にあるデータですぐに実践できると思います。, また初めて聞くような分析手法があるかもしれませんが、各手法に関して解説もしていますので、どのケースに対しても気軽に取り組むことができます。, データ分析の定石は「大まかな指標から細かい指標を見ていく」です。データに関するすべての事項を見ていたらきりがないため、おおざっぱにデータを眺めてから、絞り込むように深堀りをしていきます。, この「大まかな指標」の出発点は、平均値や中央値など基本統計量と呼ばれるものにあたります。この基本統計量から分析したいデータの基礎的な情報を得てから、データ分析を行うのが一般的です。, 基本統計量とは、データの特徴・性質をあらわす代表的な値で、代表値、要約統計量とも呼ばれたりします。, エクセルの「分析ツール」機能では、以下の基本統計量を一括で出力することができます。, それでは基本統計量を求めてみます。今回は2つの商品の日別売上に関する基本統計量を見てみます。, 「入力範囲」で分析するデータを指定し、以下のように設定して「OK」を選択すると結果が出力されます。(出力結果は見やすいように最小限の編集をしています), 出力を見ると、コーヒーAの方が売上平均は高いものの、最高売上はコーヒーBの方が高いことが分かります。実際にコーヒーBの方が分散が大きいことからも、コーヒーBはコーヒーAよりも売上の変動が大きいことが分かります。, カフェを経営していると、最近の売上が上昇傾向にあるのか下降傾向にあるのか知りたいと思います。しかし4月~6月の3ヶ月間の毎日の売上をグラフに起こすと、グラフがギザギザしてしまってイマイチ傾向を見つけることが難しいことが分かります。, 移動平均を利用して、このギザギザを滑らかにし、値の推移の傾向を見やすくしたいと思います。, 移動平均とは、日にちや月を一定区間ずらして平均を求める方法です。例えば3日間移動平均の場合は、算出する日付から前3日分の平均値を当該日付の値とします。, 「入力範囲」で分析するデータ(1行もしくは1列のみ)を指定し、以下のように設定して「OK」を選択すると結果が出力されます。なお今回は7日間移動平均を見るために「区間」の項目を7と設定しています。, 出力の図から、各日付の移動平均が算出され、滑らかな移動平均線が描かれていることが分かります。, オレンジ色の移動平均線が徐々に右肩に上がっていることから、このカフェのコーヒーAの売上は増加傾向にあるといえそうです。, 値がどの層に密集しているかを把握するために、ヒストグラムは非常に有効な手段になります。, 売上を増やすにあたって、客単価を上げることは一つの課題です。今回分析するカフェでも客単価を上げるために、「700円くじ」を導入したいと考えます。この「700円くじ」は、700円以上の購買をした顧客にくじを引いてもらい、くじに記載された賞名に沿って景品を渡すというものです。コンビニでよく行われている手法です。, さて、この700円という価格設定は果たして適切なのでしょうか?もし購買額のメイン層が300円付近ならば、700円は高めの価格設定です。反対に1000円付近の購買が一般的ならばこの施策が平均購買単価を高めるとは考えにくいです。, ヒストグラムは、度数分布表を棒グラフのように表した図です。横軸に階級を置き、縦軸に度数を置き、データがどのように分布しているかを把握することができます。, それでは、このカフェの一回当たりの購買金額の分布を求めて700円くじの是非を確かめたいと思います。, 「入力範囲」で分析するデータ(1行もしくは1列のみ)を指定し、「データ区間」にあらかじめ設定した区間(今回は100刻み)を指定します。残りを以下のように設定して「OK」を選択すると結果が出力されます。, 出力の結果、各データ区間に対応するデータの個数と、その個数に対応するヒストグラムが描画されました。, まず1点目が、600円から700円に移る段階で頻度が大きく落ちている点です。このことから600円以下の購買金額で済ませている顧客が多く、700円くじを行うことで平均購買単価を上げることが期待できそうです。, 2点目が、1500円付近で再び盛り上がり、1800円から1900円に移る段階でまた頻度が落ちる点です。つまりこのカフェでは600円付近の低額購買層と、1500円付近の高額購買層に分かれることが分かります。この結果から、700円のほかに、「2000円の購買で3回くじが引ける」といったキャンペーンを打つことが有効なのではないかと考えられます。, 夏にホットコーヒーを飲む人はあまり見かけませんが、冬場でもアイスコーヒーはちらほら見かけます。もし気温が下がっても売上が落ちないのであれば、ある程度アイスコーヒーは用意しておかなければなりません。, 2つのデータAとBに関して、Aが増えたときにBも増える傾向にあれば「正の相関」、反対にAが増えたときにBは減少する傾向にあることを「負の相関」があるといいます。各データの動き方の共通性を見たいときに用いる手法です。, それでは、気温とアイスコーヒーの売上に相関があるかを求めていきます。今回はお店で取り扱っているコーヒーA、B、Cの3種類を見ていきます。, 「入力範囲」で分析するデータを指定し、必要個所に入力をして「OK」を選択します。この時、列名(先頭行)を含めておくと結果が見やすくなります。(見やすさのために最小限の編集を行っています), 出力は表の左下が埋まった形で出てきます。各セルに表示されている値は、その節の行と列それぞれの項目間の相関係数を表しています。, 相関係数は、1に近いほど「正の相関」がある、-1に近いほど「負の相関」がある、0に近いほど「相関関係がない」と読み解きます。, 出力の表の最後の行を見ると、気温はどのコーヒーに対しても「負の相関」にあると分かります。このことから、どのコーヒーも気温が下がると概ね売上が落ちるということが分かりました。特にコーヒーCは相関係数が-0.88と大きいことから、気温の影響を激しく受ける商品だということが分かります。, 2つの対象に関してそれぞれの平均値に「偶然とは言えない差」があるのかどうかを調べるのに、t検定を用います。, ここのカフェには、コーヒーAとコーヒーBの2つのレギュラーメニューがあります。そしてここ最近業績が振るわず、この2商品のうち片方をメニューから取り除く決断をしました。, しかしどちらを除くべきかが少し悩んでいます。ケース①の分析で、平均売上高はAの方が高いのですが、最高売上はBの方が高いのです。平均売上が高い方を選びたいのですが、もしかしたら①で出た平均の差はたまたまなのかもしれないという不安が残ります。なので「Aの方が売上平均が高い!」と断言できる材料が欲しいと考えています。, そこで、t検定を用いて「Aのほうが売上平均が高い!」かどうかを確かめます。またこのt検定を行う前段階としてF検定というものも行われます。, t検定は「母平均に対する検定」と呼ばれます。「今年の桃は例年より重いか」、「AとBのクラスで数学の平均点数に差はあるのか」など、平均値の差に関する問いに答えてくれる手法です。, F検定は、比較するデータ間のばらつき(=分散)が等しいかどうかを検定する手法です。このF検定の結果次第でt検定で用いる手法が変わります。, まず初めにF検定を行い、コーヒーAとコーヒーBの売上のばらつきが同じかどうかを確認します。, 「入力範囲」で分析する2つデータ列をそれぞれ指定し、必要個所に入力をして「OK」を選択します。先頭行に商品名があるのでラベルにはチェックを付けます。, また、α(A)は分散が等しいかどうか判定するための閾値になります。通例0.05や0.001が選択されることが多いです。出力のP値がこのα(A)を下回れば2つのデータの分散は等しいとされ、反対にP値がα(A)を上回れば2つのデータの分散は等しくないと結論付けます。, 出力結果を見ると、P値は0.215(>0.05)となっています。このことから、コーヒーAとコーヒーBの売上のばらつき(=分散)は等しくないことが分かります。, そのため、今回は「分散が等しくないと仮定した2標本による検定」用いて平均の差の検定を行います。, それではt検定を用いて、コーヒーAとコーヒーBの売上に差があるのかを確かめてみます。, 先ほどと同じデータを用意して、「分析ツール」を開き、「t検定:分散が等しくないと仮定した2標本による検定」を選択します。, 「入力範囲」で分析する2つデータ列をそれぞれ指定し、必要個所に入力をして「OK」を選択します。基本的にF検定の時と同じ設定で問題ありません。, 「二標本の平均値の差」の項目には、今回は0を入力します。2つの平均値の差が「0か否か」を確認したいので0が選択されます。, 出力結果には10個ほどの指標が並んでいます。今回注目する値は「P(T<=t)片側」です。今回の目的が「コーヒーAの方がコーヒーBより売上平均が高い」という片方の値の大小に注目したものなので、「片側」の指標を見ることになります。, 出力された「P(T<=t)片側」の値は0.167(>=0.05)なため、2つの売上平均に差があるとは必ずしも言えないようです。そのためどちらの製品を切り捨てるかの選択は、別の軸をもって決めた方が良そうだと結論付けられます。, しかしこのカフェにはコーヒーA、コーヒーB、コーヒーC合計3種類のコーヒーがあります。この3種類を並べて差があるかも確かめたいです。, しかしt検定では一回に2種類までしか見ることができないため、3種類すべてを見るにはt検定を3回行わなければなりません。これでは面倒ですね。, このように、3種類以上のデータに対してその平均に差があるかを確かめるときは、分散分析を用います。, まず分散分析は、分散の大きさを用いて各平均に違いがあるのかを調べる手法です。比べたいデータが3種類以上あるときに用いられます。, 分散分析には大きく分けて、一元配置と多元配置(主に二元配置)と呼ばれるものがあります。「〇元」というのは、要因の数のことを指します。, 今回の例であれば、売上平均の差を見る要因は商品の種類という一要因のみなので、一元配置となります。これに地域や店舗規模などの要因が加わると多元配置になります。多元配置に関しては次のケース⑦で扱います。, それでは、コーヒーA、コーヒーB、コーヒーCの3種類のコーヒーの売上に関して差があるのかを調べてみます。, コーヒーのデータを用意して、「分析ツール」を開き、「分散分析:一元配置」を選択します。, 「入力範囲」で分析する2つデータ列をそれぞれ指定し、必要個所に入力をして「OK」を選択します。t検定とは異なり対象データを一括で範囲に指定します。, 今回の出力で注目するのは「P値」です。この値が先ほど設定したα(A)より小さければ、3種類の商品の売上平均に差があるということができます。, 出力された「P値」は2.5E-13です。これは0.05より小さな値なため、3種類の商品間の売上平均に差があるといえそうです。同じ表の「平均」の欄を見ると、コーヒーCの売上金額がずば抜けて高いです。そのためこのコーヒーCの突出具合が今回の結果の要因になったと考えられます。, 商品や曜日などの2要因に関して関係性があるのかどうかを見たいとき、二元配置の分散分析を用いることができます。, 商品を買いたいお客さんがいるのに、在庫がないことは大変な機会損失です。しかし持てる在庫は限られているため、よく売れる曜日があれば、その曜日には多く在庫を用意し、そうでない日は他の商品の在庫を優先したいと考えています。, ケース⑥で説明した通り、2元配置の時は値の差に影響する要因が2つの時を言います。今回のケースであれば、「商品の違い」と「曜日」の2種類の要因に注目しているので2元配置になります。, またこの2元配置にも、「繰り返しがある二元配置」と「繰り返しのない2元配置」があります。, 「繰り返しのない2元配置」は各要因の組み合わせに対して値が1つしかないのに対して、「繰り返しのある2元配置」は複数の値があるものをいいます。, 今回の分析では「繰り返しのない」データを使用するので、「繰り返しのない二元配置」の分散分析を行って差を確認していきます。, コーヒーA、コーヒーB、コーヒーCの3種類のコーヒーの売上平均に関して、曜日という要因を加味して差があるのかを調べてみます。, 曜日×商品のクロス集計データを用意して、「分析ツール」を開き、「分散分析:繰り返しのない二元配置」を選択します。, クロス集計表全体を「入力範囲」に指定して、必要個所に記入し「OK」を選択します。今回もα(A)は0.05としています。, 今回の出力先でも注目すべきは「P値」です。行(曜日)と列(商品)についてそれぞれこの「P値」が先ほど設定したα(A)より小さければ、その要因によって売上平均に差が出ていると言うことができます。, まず行(曜日)の「P値」は0.103 (>0.05)なため、売上に影響を及ぼしているとは言えなさそうです。, 次に列(商品)の「P値」は1.2E-05 (<0.05)なため、売上の差に影響している要因といえます。この結果はケース⑥と一致していることが分かります。, 「どの要因が売上に結び付いているのか」を推定する手法の一つに、回帰分析というものがあります。, チラシやメールやツイッターなど、お店のプロモーションを行う手段はたくさんあります。それら手段を組み合わせて認知を浸透させるとともに、最終的に来客数を増やしたいと考えています。, 今現在、このカフェではLINE・Facebook・ツイッター・チラシの4つを利用して告知を行っています。しかしこの4つのうち、どれが直接的に来店に影響するかが分かっていないのが現状です。もし最も影響のある媒体が分かればもっと積極的にその媒体を利用し、反対にあまり影響のない媒体があれば面倒なので取りやめることも考えられます。, 回帰分析は、「他方のデータを用いて、一方のデータを予測する数式を推定する」分析です。例えば家賃を予測したいときに回帰分析を行うことで、家賃以外の情報を利用して家賃を予測する事ができます。この時、下のような回帰式が算出されます。, 今回、売上は月次のデータを用います。そして媒体の情報は各媒体の月間の投稿数を使用します。, それでは、2年分の月次の売上と各媒体の投稿数のデータを用意し、「分析ツール」を開き、「回帰分析」を選択します。, 「入力Y範囲」に「売上」の列を指定し、「入力X範囲」に各媒体の列をまとめて指定します。必要個所に記入し「OK」を選択します。, たくさん数字と難しそうな単語が出てきたので、いくつか解説いたします。ここにあるすべての指標を見なくても、分析内容は理解できます。, まず➀決定係数(出力の表の重決定R2)を確認すると、0.87とわかります。これは得られた回帰式が売上の変動の87%を説明していることを表すので、まずまずの精度の回帰式が得られたといえます。, 次に②有意Fを確認すると、3.5E-08 (<0.05)より、得られた回帰式が有用なものであると分かります。, 次に➃P値を確認すると、LINEとチラシは0.05を下回り、そのほかは0.05を上回っています。そのため、LINEとチラシ以外を売上の要因として考えるのは危険という判断ができます。, 最後に、LINEとチラシの➂t値を比較します。ラインのt値が7.8なのに対し、チラシのt値は2.3です。このことから、売上に最も貢献しているプロモーション媒体はLINEであると結論付けることができます, 「分析ツール」を用いれば、基本的な分析を行うことは可能です。しかし因子分析や主成分分析、クラスター分析などの手法は「分析ツール」機能で実行することができません。, このような分析を行いたい場合、可能ならばプログラミング言語やBIツールといった他のツールの使用を検討することをお勧めします。例えば、無償であればRやPython、有償であればSPSSやSASというツールが代表的です。, 他のツールを使用する一番の理由として、エクセル上で手作業での分析は手間がかなりかかってしまうからです。とあるエクセルの解説書には主成分分析を行うのに、10種類以上の式をセルに打ち込み、「ソルバー」という新たな機能を用いて、10ページ近くかけて結果を算出していました。(かなり丁寧な説明だったのでページがかさむのは仕方ないですが、筆者が実際に試したところ1回10分程度かかってしまいました…。), その一方で世の中には先述したツールのように、数十万行以上あるデータでもコードを数行書くかボタンをポチポチするだけで分析を行える環境がたくさん存在します。, 以下の画像はSAS Ondemand for Academicsという統計解析ソフトウェアの操作画面です。各種設定をクリックするだけで高度な統計解析を行うことができます。, エクセルにはVBAというプログラムを書いて分析を実行できる機能もあります。しかしデータ分析においてはExcel VBAよりPythonのほうがExcel以外でも活用できるという点で、やはりほかのツールに任せるべきです。, 新しいツールを学習するには、ある程度の時間のやる気が必要ですが、その投資に見合った分のリターンは得られるはずです。, 「分析ツール」機能を活用して、平均値や中央値といった指標を超えた一歩踏み込んだ分析を行い、新たな示唆の発見や素早い意思決定につなげましょう!, 当社では、データ分析/視覚化/データ基盤コンサルティング・PoC支援に加え、ビジュアルアナリティクス、ダッシュボードレビュー研修、役員・管理職向け研修などのトレーニングを提供しています。組織に根付くデータ活用戦略立案の伴走をしています。, 一橋大学大学院経営分析プログラム2年生。 同大学で平成30年度学業優秀学生表彰を受賞。 2020年3月、同大学商学部を3番目の席次で卒業。 学部ではデジタルマーケティングを専攻。現在通うMBAでは傾向スコアを用いた広告の効果検証を研究している。 データビズラボ株式会社インターンとしてダッシュボード構築を担当。 好きなツールはTableauとPython。, 『データ視覚化のデザイン』著者 Tableau ZEN MASTER 2019 & 2020 Tableau Ambassador 日本Tableau ユーザー会会長 データビズラボ株式会社 代表取締役 CEO/CVO データのオウンドメディア「Data Viz Lab(データビズラボ)」主宰 アクセンチュア、楽天、KPMGなどを経て独立。データにかかわるコンサルティング、データ分析&データ視覚化(ビジュアライゼーション )のトレーニング講師を手がけている。「ビジネスとデータをつなぐ」「ビジュアルアナリティクス」「データ視覚化のデザイン」などのテーマで講演、登壇、メディアや新聞への寄稿多数。 早稲田大学トランスナショナルHRM研究所招聘研究員 早稲田大学政経学部卒, サービスに関するご質問や講演依頼など、お気軽にお問い合わせください。2営業日以内にお返事いたします。.