1日10分!1年後に差がつくExcel教養

ちょっとした事なのに、意外と知らない便利なExcelの技を10分でお届け!

エクセルで散布図を作成する具体的手順(分析方法も解説)

「散布図の作り方がわからない、、、。」

「散布図の分析方法が知りたい、、、。」

「データを分析したいが散布図を使った分析結果があっているのか知りたい、、、。」

 

こういった疑問に答えます。

  

散布図とは、

2つの変数間の関係をグラフ上にプロットしたものです。

これにより、

散布図を見れば、変数間の関係を大まかに掴むことができます。

そのため、

データ解析の第一歩として散布図を作成してみる機会はよくあります。

しかし、

統計解析はとても難しいイメージがあります。

更に、正しい知識がなければ使ってはいけない的なイメージもあります。

これは厄介なことに「作成者側」も「報告を読む側」にもあります。

実際私の体験談ですが、

散布図を使って分析した資料を提出したことがありました。

自分なりには分かりやすく解説したつもりですが、

・「この図が何を示しているかわからない。」

・「逆にわかりづらい。」と多くの方に言われました。

終いには、「君、統計分析できるの?」と言われる始末。

確かに、私は統計のプロではありません。しかし、営業職として最低限の知識を習得しつつ実務に活かそうとしてきました。

私がここで問題だと感じたのは、読み手側が「難しくてわからない」イメージを持っていることだと思いました。

しかし、散布図を用いた分析は大まかに傾向を掴むためのあくまでも初歩。

トライして見るのに難しいものではありません。

そうはいっても、

・「やってみたいけど、どうやって作るの?」

・「作ったはいいけど分析方法がわからない」

・「そもそもどんな時に使うの?」

って、思いますよね。

 

✔︎そこで今回は↓

エクセルで散布図を作成し分析する方法について解説していきます。

(こんな時に使いましょう!って言う具体例もつけます)  

 

✔︎本記事で分かること↓

□散布図の作成方法

□散布図の分析方法手順(注意点付き)

 ・「相関関係」と「因果関係」に気をつけよう

 

 

□散布図の作成方法(集計データは使わない。必ず集計前のデータを使う。)

散布図を使用すれば、

2変数間の関係を視覚的に捉えることができます。

変数間に相関関係があるかどうか、回帰曲線で表現するとどうなるかなどがわかります。

何度も記載しますが、散布図はデータ分析の基礎(入口)となる部分です。

 

✔︎具体的な作成手順について解説します↓

手順①:対象範囲を選択

f:id:Djiro:20210120231805p:plain

手順②:「挿入」タブ→「グラフ」→「散布図」を選択

f:id:Djiro:20210120231818p:plain

手順③:「軸ラベル」を追加

f:id:Djiro:20210120232216p:plain

f:id:Djiro:20210120232226p:plain

手順④:完成

f:id:Djiro:20210120232320p:plain

 

 

□ 散布図の分析方法の手順を解説(とりあえずここを抑えよう基礎部分)

例題を上げるとわかりやすいので、例題をあげます↓

✔︎例えば、

学生のテストの結果について考えてみます。

①「数学の点数と理科の点数」の関係

②「数学の点数と社会の点数」の関係

この2つの関係を考えた場合、どういった関係がありそうでしょうか?

✔︎仮説を立てます↓

①数学と理科は同じ理系の分類なので、一方が高い人はもう一方も高いかもしれない。

②数学と社会は分野が違うので、あまり関係ないかもしれない。

 しかし、

 勉強している人は、どっちも力を入れているはずなので両方とも高いかもしれない。

✔︎検証

①と②を散布図を使って検証していきます。

※注意

ここではあくまでも例題ですので、データの信憑性はありません。

作者がわかりやすいように数字をいじっています。    

①を散布図にした場合↓

f:id:Djiro:20210120233954p:plain

②を散布図にした場合↓

f:id:Djiro:20210120234005p:plain

✔︎結果

①の画像は点がなんとなく上に向いてプロットされています。

それに比べて、

②の画像は点がなんとなく下に向いてプロットされています。

このことから、

この2つの画像はどちらも共に、変数の関係が強いことを示しています。

①からは「変数の間に正の関係」(一方が増加すればもう一方も増加する)がみられます。

②からは「変数の間に負の関係」(一方が増加すればもう一方が減少する)がみられます。

この関係のことを、

統計学では「相関関係」と呼び、お互いの要相(数学と理科・数学と社会)が強い関係にあることを示しています。

因みに、

変数間に関係がない場合だとこんな感じになります↓

f:id:Djiro:20210120234113p:plain

散布図は、この相関関係を分析すしやすくすることが一番の役割です。

✔︎まとめ

「数学と理科」・「数学と社会」には強い関係性がある。

数学の点数が高ければ、理科の点数も高くなるかな?

数学の点数が高ければ、社会の点数は低くなるかな?

、、、。?

 

相関関係と因果関係に気をつけよう

上記の手順で散布図を使って、相関関係について考える方法がわかりました。

しかし、

結論(まとめの部分)では、「?」がついてはっきりしない答えになっています。

「どう言うこと?」っと、思いますよね。

これは、別に間違っているわけではありません。

ここで押さえておきたいポイントは、「相関関係」と「因果関係」は違うと言うことです。

・相関関係

2つの事柄になんらかの関係性があるもの

・因果関係

一つの事柄が原因で、もう一つの事柄に影響を与えているもの

 このことを例題に当てはめると↓

数学の点が良いからといって、理科の点が良いとは言えないと言うことです。

もしかしたら、

勉強が得意な人で全部の点数がいいのかもしれないし、実は習い事で算盤をしているみたいな違う要因があるかもしれません。

つまり、

関係性はあるが直接的な要因は散布図から不明であると言うことです。

このことは実際のビジネス現場ではよく起こります。

因果関係がないにも関わらず、相関関係が見られることから間違った判断を下してしまうパターンがよくあります。

予算が動くような場合に間違った判断を下すと、大きな損失になりますので注意しましょう。

 

 

□まとめ

※散布図の作成方法

必ず集計前のデータをつかう。(元データ)

※相関関係と因果関係に注意 

・相関関係

2つの事柄になんらかの関係性があるもの

・因果関係

一つの事柄が原因で、もう一つの事柄に影響を与えているもの