ビジネスの因果関係を知る 回帰分析とコンジョイント分析とは?

ビジネスの因果関係を知る 回帰分析とコンジョイント分析とは?

本のまとめ

▼読んだ本は?

■Excel対応 90分でわかる! 日本で一番やさしい「データ分析」超入門
■内田 学さん,兼子 良久さん
http://amzn.asia/d/iTN1eeg

▼相関ってなに?

■正の相関
└片方の値が大きくなると、もう1方の値が大きくなる関係

■負の相関
└片方の値が大きくなると、もう1方の値が小さくなる関係

■相関がない
└2つの値に、そもそも関係性がない

▼データの関連を調べる散布図って?

【1】例えば「縦軸=販売個数」「横軸=価格」としてグラフ化する
【2】各データをグラフの中にプロットする
【3】グラフが右肩下がりになる
【4】ということは、価格があがるほど、販売個数はさがる
【5】2つの物事には、負の相関があるといえる

▼図じゃなく数値で相関を表すには?

■相関係数をつかう
└相関係数の符号がマイナスなら、負の相関
└相関係数の符号がプラスなら、正の相関
└相関係数の値が大きいほど、2つの値の関連性は強いということ

▼相関係数はビジネスでどんなときに使う?

■「販売量」と「値引き額」の関係を調べたいとき
■「製品認知率」と「広告費」の関係を調べたいとき
■「来場者数」と「イベント開催日数」の関係を調べたいとき
■「来場者数」と「駅からの距離」の関係を調べたいとき
■「営業成績」と「残業時間」の関係を調べたいとき

▼EXCELで相関係数を出すには?

【1】対象のデータ範囲を選択
【2】「データ」タブから、「データ分析」を選択
【3】「相関」を選択

▼ものごとの因果関係を知るには?

■「回帰分析」をつかう
└グラフ化した「散布図」上に散らばる点にそって、直線をひく
└その直線にそって、予測をしようという考え方
└厳密には、直線と各値の「差分の2乗」の合計が、もっとも小さくなるように直線をひく
└2乗するのは、そのままだとプラスの値とマイナスの値で打ち消し合うのを防ぐため

▼回帰分析をおこなう順番は?

【1】調べたい原因と結果の関係を決める
【2】例えば「店舗面積」という原因から「売上高」という結果を調べるとか
【3】「原因となるデータ=独立変数」「結果となるデータ=従属変数」という
【4】回帰分析を行い、その関数を「y=a+bx」の形で表す
【5】「y=売上高」「a=切片の係数」「b=店舗面積」「x=店舗面積の係数」の値を表す

▼回帰分析の信頼性はどうやってわかる?

【1】回帰分析の信頼性をあらわすのは「重決定R2」という数値
【2】「重決定R2」は直線と各数値の誤差の「無さ」を表す
【3】誤差が小さければ小さいほど「重決定R2」の値は大きくなる
【4】一般的に「重決定R2」が0.4以上なら大丈夫といわれる

▼回帰分析はビジネスでどんなときに使う?

■「気温(原因)」と「製品の販売量(結果)」の因果関係を調べたいとき
■「折込チラシの枚数(原因)」と「来店客数(結果)」の因果関係を調べたいとき
■「駐車場の面積(原因)」と「売上高(結果)」の因果関係を調べたいとき
■「広告費(原因)」と「製品の販売量(結果)」の因果関係を調べたいとき
■「値引き額(原因)」と「製品の販売量(結果)」の因果関係を調べたいとき

▼EXCELで回帰分析を行うには?

【1】「データ」タブから、「データ分析」を選択
【2】「回帰分析」を選択
【3】「入力Y範囲」に「売上高(結果データ)」範囲を選択
【4】「入力X範囲」に「店舗面積(原因データ)」範囲を選択

▼原因データが複数あるときにはどうする?

■「重回帰分析」を使う
└3次元、立体型の「散布図」になる
└例えば「縦軸(原因1)=店舗面積」「横軸(原因2)=駐車場面積」「高さ軸(結果)=売上高」のような形
└3次元の立体の中に散らばった点を「面」として表現する感じ

▼重回帰分析をおこなう順番は?

【1】調べたい複数の原因と結果の関係を決める
【2】例えば「店舗面積」と「駐車場面積」という複数の原因から「売上高」という結果を調べるとか
【3】回帰分析の関数は「y=a+bx+cz+…..」の形で表せる
【4】「y=売上高」「a=切片の係数」「b=店舗面積」「x=店舗面積の係数」「c=駐車場面積」「z=駐車場面積の係数」の値を表す

▼重回帰分析の信頼性はどうやってわかる?

【1】重回帰分析の信頼性をあらわすのは「補正R2」という数値
【2】「補正R2」は直線と各数値の誤差の「無さ」を表す
【3】誤差が小さければ小さいほど「補正R2」の値は大きくなる
【4】一般的に「補正R2」が0.4以上なら大丈夫といわれる
【5】「補正」するのは、原因データが増えるほど、値が大きくなってしまうから

▼重回帰分析を行うときの注意点は?

【1】原因データと結果データの関連性があること
└「P値」がその関連性を表す
└「P=Possibility(可能性)」のこと
└P値は関連性の「無さ」を表す
└P値が大きいほど、2つの値の関連性は薄い
└P値が0.05を上回る場合には、2つの値には関連性がないので、分析の正確性にかける

【2】複数の原因データの間の関連性が強すぎないこと
└相関係数が0.7を上回る場合には、2つの値の関連性が強すぎるといえる
└この相関係数が大きくて、結果予測に不具合が生じることを「マルチコ現象」という

▼重回帰分析はビジネスでどんなときに使う?

■「気温と降水確率(原因)」と「観光客数(結果)」の因果関係を調べたいとき
■「店舗面積と駐車場面積(原因)」と「売上高(結果)」の因果関係を調べたいとき
■「店舗面積と駅からの距離(原因)」と「売上高(結果)」の因果関係を調べたいとき
■「気温と降水確率(原因)」と「販売量(結果)」の因果関係を調べたいとき

▼EXCELで回帰分析を行うには?

【1】「データ」タブから、「データ分析」を選択
【2】「回帰分析」を選択
【3】「入力Y範囲」に「売上高(結果データ)」範囲を選択
【4】「入力X範囲」に「店舗面積と駐車場面積(複数の原因データ)」範囲を選択

▼2つのデータタイプって?

【1】量的データ
└数値の大きさに意味があるデータ
└たとえば「売上高」「販売量」とか

【2】質的データ
└「晴れ」「雨」など数値ではないデータ
└分析するときは「晴れ=1」「雨=0」など数値に変える

▼質的データを使って重回帰分析するには?

【1】たとえば「テレビCM」「新聞広告」「インターネット広告」
【2】「テレビCMあり=1」「テレビCMなし=0」など数値に置き換える
【3】あとは量的データの重回帰分析とおなじ流れ

▼質的データの重回帰分析はビジネスでどんなときに使う?

■「出店地域と駐車場の有無(原因)」と「来店客数(結果)」の因果関係を調べたいとき
■「天気と曜日(原因)」と「来場者数(結果)」の因果関係を調べたいとき
■「曜日とチラシ配布の有無(原因)」と「来店客数(結果)」の因果関係を調べたいとき

▼消費者意識を調べるには?

■「コンジョイント分析」を使う
└機能がちがう複数の商品案を見せて、商品案への満足度を調べるような時に使う

▼コンジョイント分析を行う流れは?

【1】たとえばメモリや色のちがうタブレットPCの満足度を調べたい
【2】メモリや色(原因)、満足度(結果)という因果関係になる
【3】コンジョイント分析では「属性」と「水準」にわける
【4】たとえばタブレットPCの「属性=メモリ/液晶サイズ/色」
【5】たとえばタブレットPCの「水準=1G/2G/黒/白」
【6】ここで「各属性の水準がバランスよく含まれている」ことが大事
【7】このバランスよく含まれていることを確認するために、商品を横軸に表で表す「直交表」が使われる
【8】「メモリ1G=0」「メモリ2G=1」など質的データを量的データに変える
【9】量的データに置き換えたら、重回帰分析をおこなう

▼コンジョイント分析はビジネスでどんなときに使う?

■工業製品/旅行商品/保険商品などの満足度調査
■宿泊施設/ショッピングモールなどの満足度調査

思ったこと

ビジネスにおいて、割引率と売上の関係性を調べたりする相関係数、そして、店舗面積を広げると売上高がどのくらい変わるかの因果関係を調べたりする重回帰分析について、やさしく、まとめられた本でした。

ほんとは、分析をしっかりやるためには数学的な知識がいるのだけど、あえてこの本では奥深いところにはふれず、相関係数や重回帰分析のビジネスでの使い方に集中して、書いてくれています。

ものごとの関連性や因果関係って、ビジネスだとなんとなく経験則で決めてしまうことが多いけど、それを誰にでも客観的にみえる数値におきかえられるって、すげーっすね。

ありがとうございました!

関連する記事