Excelが使えれば大丈夫!『ゼロから始める 統計入門』|Tech Book Zone Manatee

マナティ

Excelが使えれば大丈夫!『ゼロから始める 統計入門』



Excelでゼロから統計を学べる! 数学が苦手な方や一度チャレンジしてみて挫折してしまった方にもオススメ

はじめに

「学生のうちにもっと勉強しておけば…」仕事中にそんなことを考えることは何度もあります。
数学、その中でもとりわけ統計は最近流行りのデータサイエンスや仕事で使う機会も多く、勉強し直したいという方も多いでしょう。
でも、学生時代は数学が苦手で、文系に進学したからいまさら勉強し直すのも大変だ…。そんな方のために、ふだんお仕事で使っているExcelでデータを操作しながら統計を学べる入門書を紹介します!  
 

こんな人におすすめ

  • 数学が苦手で統計にちょっと手を出しづらい方
  • ビジネスに統計を活用したいと考えている方
  • Excelを応用してみたい方
  • 統計検定の受験を考えている方

目次

1章 クラスの傾向は?
 1-1 データの傾向の可視化
 1-2 基本統計量とは
 1-3 さまざまな基本統計量
 1-4 エクセルで実践
2章 最終的な試験の成績は?
 2-1 平均値の応用的な特徴①
 2-2 平均値の応用的な特徴②
 2-3 分散の応用的な特徴
 2-4 その他の統計量やグラフ
 2-5 エクセルで実践
3章 勉強時間と試験得点の関係①
 3-1 共分散
 3-2 相関係数
 3-3 単回帰分析
 3-4 エクセルで実践
4章 勉強時間と試験得点の関係②
 4-1 重回帰分析の概要
 4-2 応用的な重回帰分析の利用
 4-3 エクセルで実践
5章 推薦入試の合否を予測する
 5-1 ロジスティック回帰の概要
 5-2 エクセルで実践
6章 学校内平均から全国平均を予測する
 6-1 推定とは
 6-2 点推定
 6-3 データの分布
 6-4 区間推定
 6-5 エクセルで実践
7章 夏期講習に意味はあったのか?
 7-1 検定の概要
 7-2 母平均の検定
 7-3 2標本の平均値の比較
 7-4 対応のあるt検定
 7-5 エクセルで実践
8章 2クラスの平均値には差があるのか?
 8-1 等分散の検定
 8-2 対応のないt検定
 8-3 検定時の注意点
 8-4 エクセルで実践
9章 3つのクラスの比較 ~分散分析~
 9-1 平均の検定の落とし穴 ~3標本以上の比較~
 9-2 一元配置の分散分析
 9-3 エクセルで実践
10章 塾の種類と勉強法の組み合わせを分析
 10-1 二元配置の分散分析の概要
 10-2 エクセルで実践

ストーリー仕立てで統計がわかる

統計というとなんだかお堅い印象がありませんか? 勉強してみようと教科書を開いてみたら、なんだか難しい記号や数式が並んでいて頭が痛くなって本を閉じてしまった…。そんな経験がある方もいるかと思います。
いきなり数式を見てもそもそもどういうときに使うのかわからないとあまりやってみようという気にならないですよね。
そこで、本書では数学が苦手な”ザ・文系”の佐藤先生(カバー左)が数学の青池先生(カバー右)に教わって統計を生徒指導に活かしていくというストーリーになっています。
クラスのテストの点数から生徒の傾向を把握するところから始まり、そこからさらに生徒の勉強時間や夏期講習前後のテストの点数などのデータを使って統計への理解をゼロから深めていく内容になっています。
【画像はクリックすると拡大できます】

わかりやすく、馴染みのあるデータを使うので、読んでいくことで佐藤先生と一緒に統計を理解していくことができるでしょう。
読みながら自分がいま持っているデータでどんなことができそうか考えてみるのがオススメです。

理論→Excelで実践の2段階でしっかり理解できる

統計を実際に使うにはもちろん数式の理解が必要です。でも、これがなかなか難しく見えてしまうんですよね…。
なんでそんなに難しく感じてしまうのかというと、教科書などで学ぶ数式はn, x, y, Σなどの記号を使って一般化されているからイメージがしにくいのではないかと思います。
そこで、本書ではテストの点数などの数字を使って、数式にあてはめて実際に計算しながら学んでいきます。実際に答えとなる数値を見ることでイメージがつきやすくなるのではないでしょうか。
【画像はクリックすると拡大できます】

また、各章の終わりでは実際にExcelで学んだ内容を表現する実習パートがあります。これにより実務でもどうやればいいのかイメージがつきやすいでしょう。
たとえば、本書で扱っている重回帰分析は複数の独立したデータを使って1つの目的変数を導く手法なので、実際のデータ分析の現場でもよくつかわれています。
下記のような売り上げデータがあったと仮定して実際にやってみると、こんなことがわかります。



例として商品Aから商品Eまでの5商品だけ示しましたが、実際には商品F、商品G…と、たくさん並んでいるデータを想像してください。
これだけだと、商品Aが商品Bよりも売り上げ数が少ないのは値段のせいなのか? それとも大きさや重さが関係しているのだろうか…でもAとBだけで関係を考えても商品C, D, Eとの関係もあるし…と、読み取るのが難しいと思います。
そこで、このデータを使って初年度の販売数を重回帰分析を使って予測してみます。実際のExcelの操作方法は本書を読んでみてください。次のような結果が得られます。



係数の項目から、重回帰分析によって初年度の販売数について次のような方程式が得られます。

(初年度の販売数)= -0.68(値段)-1.18(大きさ)+3.20(重さ)+262

この式からは、たとえば以下のようなことを読み取れます。
  • 値段が高いほど販売数が少なくなる(係数が負の値であることから推測)
  • 商品が大きいほど販売数が少なくなる(係数が負の値であることから推測)
  • 商品が重いほど売れやすくなる(係数が正の値であることから推測)
この結果から、「新しい商品はちょっと重い素材を使ってサイズを小さくしてみようかな」とか、「もうちょっと安くできれば目標の売り上げ数に届きそうだな」とか、勘ではなく数値を根拠に予測を立てることができます。
今回は簡易的に3つの変数でやってみましたが現実の変数がもっとたくさんある複雑な課題でもExcelに任せれば簡単に分析ができるので、ぜひ身に着けてみてください。  
【画像はクリックすると拡大できます】

本書を通して統計の理解が深まったら、途中で放り投げた統計学の本などをもう一度開いてみてください。
具体的な数字を使って学んだ理論と実際にExcelで表現してみた経験によりきっと、書いてある内容を理解しやすくなっていることでしょう。

まとめ

統計学はビジネスでも利用頻度が高いのに高校では必修科目ではないので学んだことがない、という方も多いのではないでしょうか。 必要になったけどまた数学やるのはなかなか大変だからなるべく楽に勉強したい…本書はそんな忙しい社会人のニーズに応えることができる一冊だと思います。

本書で統計学がどんなものなのか理解して、より深く応用する方法を知りたい方には『統計学の基礎から学ぶExcelデータ分析の全知識(できるビジネス)』がオススメです。こちらはより実践的な内容になっていて、表記ゆれや欠損値など、統計において邪魔になるような値に対する前処理についても学べます。
数学が面白いと感じて、もっと勉強したいと思った方には『Excelで学び直す数学』がオススメです。こちらはもうちょっと深く、大学で学ぶ内容にも触れています。扱う数学はビジネスに活用できるものに絞って、Excelで勉強することができます。

ビジネスでも使われ始めている機械学習やディープラーニングという技術も、実は統計学が重要です。こちらを理解したいなら『やさしく学ぶ ディープラーニングがわかる数学のきほん』が一番分かりやすいでしょう。ディープラーニングについて簡単な数式で学ぶことができます。本書の内容を身に着けていればより理解度が深まることでしょう。  

関連書籍

著者プロフィール