INDEX
Introduction
Excel(エクセル)での散布図の作り方です。散布図は、2項目の分布や相関関係を分かり易く表示したい場合に使用します。
例えば、「睡眠時間と体重には関連性があるのかな?」とか「猫の年齢と食事量には関連があるかな?」など、2つのデータの傾向を読み取る場合に使用します。
点の散らばり具合で、全体の傾向を読み取ることができます。
散布図の作り方
散布図の特徴
散布図は、二変数を縦軸・横軸にして、収集したデータを区分化しないで座標に置きます。
簡単に言うと、2つの項目を縦と横に配置して、各データを点として置くということ。
データの種類は2種類しか使用できません。
他のグラフと違い、直接データを点として表示するため、ある程度のデータ量が存在すると、全体の傾向を掴むこともできます。
下のようにデータが多いと、点の密度によって傾向が読み取り易いですよね。
表の選択と散布図の作成
では、作成してみます。
今回使用するデータは下の表です。
各国の人口1人あたりのGNPと平均寿命のデータです。GNPの単位はドル。
世界の全ての国だとデータが多すぎるので、名前の長い国などを省き適当に絞ったものです。
「GNPが高い国だと、平均寿命も長いのかな?関連性があるのかな?」というのを調べたかったとします。
※データは「WHO」のデータを参照しました。
まず選択です。
通常、グラフ作成の際には項目を含めて選択します。今回の場合でいうと、1行目の項目名とA列の国名を含めた全体を選択する感じ。
しかし、散布図では、数値データのみを選択します。縦軸と横軸になる2種類のデータです。
選択ができたら、[挿入]タブ → [散布図]をクリックして、
左上の[散布図(マーカーのみ)]を選びます。
完成です。
縦軸に「平均寿命」、横軸に「GNP」がきましたね。つまり、普通に選択して作成すると、左側にある列が横軸に来ると覚えておきましょう。
逆にする方法は最後に紹介します。最初から列の位置を変更しておいても良いですね。
あっさり完成したのは良いのですが、これでは自分以外の人が見ると何が何だか分かりません。見た目の設定を変更していきます。
凡例を消す
各系列の説明を「凡例」とよびます。
今回グラフの右に「系列1」と凡例が表示されていますが、必要ありませんね。
その場所をクリックして、
「Delete」キーで簡単に消すことができます。
タイトルや軸ラベルを付ける方法
タイトルや軸にラベルを付けましょう。単位などのラベルを付けるだけで分かり易くなります。
タイトルからいきましょう。
グラフをクリックしたら表示される[グラフツール]の[レイアウト]タブ → [グラフタイトル]をクリックして、
[グラフの上]を選びます。
タイトルを入力する場所があらわれるので、適切なタイトルを入力します。今回は、「GNPと平均寿命の関係」にしてみました。
次に軸ラベルです。先ほどの[グラフタイトル]右隣、[軸ラベル]をクリックして、
[主横軸ラベル] → [軸ラベルを軸の下に配置]をクリックすると、グラフの下に横軸ラベルが表示されます。
今回は「GNP」と入力します。
また、同じ手順で、[主縦軸ラベル] → [軸ラベルを垂直に配置]をクリックして、
表示された縦軸ラベルに「平均寿命」と入力。
これでグラフが分かり易くなりました。
マーカー(点)の大きさを変更する方法
散布図は点でデータを表示しますが、その点の大きさを変更したい場合があるかもしれません。
そんな時は、[レイアウト]タブの左の方にある[グラフの要素]の▼をクリックして、
一覧から、「系列1」を選びます。
グラフのマーカー(点)が選択されるので、すぐ下の[選択対象の書式設定]をクリック。
[データ系列の書式設定]画面が表示されるので、左側から[マーカーのオプション]を選び、右側の[組み込み]にチェックを入れて[サイズ]を変更しましょう。すぐ上でマーカーの種類も変更できます。
サイズを「2」にしてみたのが下のグラフです。
ちょっと小さすぎましたね。
データラベルを付ける方法
それぞれのマーカーに数値を付けることができます。
[レイアウト]タブ → [データラベル]をクリック。
一覧から、1番下にある[その他のデータラベル オプション]を選びます。
[ラベルの内容]の[X値][Y値]にチェックを入れると、それぞれの数値データがグラフに表示されます。
しかし、データが多い場合は見難くなるだけなので、あまり使用しないかもしれません。
下は[Y値]のみチェックを入れたのですが、それでも厳しいですね。
これらのラベルは、それぞれを選択して移動したり、
文字サイズを小さくすることもできます。
では、数字ではなくそれぞれの国名を表示したい場合はどうしましょう。
残念ながらバージョン2010まではエクセルの通常機能ではできません。バージョン2013からは機能が拡張されて表示できるようになっています。
参考にバージョン2016の場合を説明すると、下の図のように進み、
右側に表示される[ラベルオプション]の場所で[セルの値]にチェックを入れ、
表示された画面で、ラベルにしたいセル範囲を指定すればできます。
しかし、データ量が多い場合は、やはり見難いですね。
ということで、エクセルのバージョンに関わらず、図形の吹き出しを使用して、ポイントになる場所だけ作成するのがお勧めです。
[挿入]タブ → [図形] → [吹き出し]の好きなものを選びます。
後はサイズなどを調整して配置。
どうでしょうか。
縦軸と横軸を入れ替える方法
最後に、縦軸と横軸を入れ替える方法です。今回の例では、縦軸が「平均寿命」、横軸が「GNP」になっています。これを反対にするやり方です。
※ちなみに1番簡単なのは、元の表の列を入れ替えて作成することかもしれません。
グラフ上で変更したい場合は、[デザイン]タブ → [データの選択]をクリック。
表示された[データ ソースの選択]画面で、[編集]をクリック。
[系列の編集]画面が表示されます。赤枠で囲んだ場所をクリックして、X軸、Y軸の範囲を逆に変更します。
まず、[系列Xの値]の方をクリックして、元の表の「平均寿命」の範囲を選択。
選択が終わったら、右側のボタンを押せば、前の表示に戻ります。
同じように[系列Yの値]は「GNP」の範囲を選択。
設定が終わったのが下のグラフです。
縦軸、横軸が逆になりました。
しかし、軸のラベルは自動で変更されません。それぞれ入力し直す必要がありますね。
まとめ
グラフには、棒グラフ、円グラフ、折れ線グラフなど様々なものがあります。
その中で散布図を使用する意味は、
- 2項目の関係を明らかにする
- 2項目の分布(散らばり具合)を確認する
こと。
「2項目の関係を知りたい」というのがポイントですよ。
ちょっと個性的なグラフだにゃー