統計のド素人が統計学を学んでみた
コロナ禍で、自宅での時間が増えたこともあり、2021年は放送大学の選科履修生として一年間を過ごしてみた。放送大学の授業については、『初歩からの数学』について、先日ご紹介させていただいた。引き続いて、本日は放送大学における統計学のエントリー科目『身近な統計』をご紹介したい。
放送大学には「身近な~」とか「初歩からの~」といった、初学者向け(に見える)の講座がいくつかある。これがけっこうなクセもので、序盤では簡単に思わせておいて、中盤以降急激にレベルが上がり、脱落者続出なんてことになる。
『身近な統計』もそのクセもの科目の一つであることは間違いない。統計は数学的知識が相応に必要な科目だ。数学を高校二年までしか学んでいないわたしにとって、統計は未知の分野だった。全くの未経験からのスタートだったので、正直非常にシンドイ科目だった。
幸いにも『初歩からの数学』を同時履修していたので、数学的な素養の無さをある程度補えたことはせめてもの救いだった。数学の知識、特に確率と、シグマ記号の扱いは、知っていることが当たり前のように進んでいくので、注意が必要だと思う。数学スキルが不安な方は、『初歩からの数学』を事前に履修するか、同時に履修しておくことを強くお勧めしたい。
印刷教材『身近な統計』
『身近な統計』のテキスト(教科書、放送大学用語では印刷教材)はこちら。市販されているものなので、大きな書店であれば取り扱いがあるはずだ。もちろんAmazonなどでの購入も可能。税込で4,180円と、放送大学の教材としてはややお高め。これは、DVDがセットでついてくるためだろう(DVDの内容は後述)。
本講座の講師は石崎克也(いしざきかつや)と渡辺美智子(わたなべみちこ)の両名。石崎克也は放送大学の教授。渡辺美智子は慶応大学大学院健康マネジメント研究科の教授。授業の中では、前者が理論面を、後者が実践面を解説することが多い。
放送大学の良いところは動画による授業がテレビで公開されている点にある。2022年度一学期の放映日は以下の通り。BSが映ることが前提となるが、無料で誰でも見られるので、気になる方はチェックしてみていただきたい。
BS232ch:毎週火曜日12:00~12:45 ※初回放映は4/5
この授業で得られること
- 統計学の基本について学ぶことが出来る
- 社会で統計がどのように活用されているか知ることが出来る
目次
『身近な統計』のテキスト構成は以下の通り
- 論より数字、勘より統計―私たちの身近で活躍する統計情報
- データのばらつきの記述(質的データ)―度数分布表とパレート図
- データのばらつきの記述(量的データ)―度数分布表とヒストグラム
- データのばらつきを数字でまとめる―平均値・中央値と箱ひげ図
- ばらつきの大きさを測る―シグマ(標準偏差)の活用
- 格差を測る―ローレンツ曲線とジニ係数
- 不確実な出来事を確率で考える―2項分布
- 不確実な出来事を確率で考える―正規分布
- 統計を作る一部分から全体を知る―標本調査
- 調査結果の誤差を知る―推定値と標本誤差
- 標本から仮説の真偽を判断する―統計的仮説検定の考え方
- データから関係を探る―クロス集計表の読み方
- 関係のパターンを読む―相関関係と傾向線
- 時系列データの分析―変化の記述と将来の予測
- 知識創造社会を支える統計―全体のまとめ
わたし的には4章まではなんとかついていけた。しかし、5章で計算の要素(標準偏差)が登場し、雲行きがあやしくなり、7章の2項分布で完全に行き詰った。ひたすら動画をリピート視聴して、テキストを読み込むことでなんとかクリアできたけど、一時は「これは無理かも」とあきらめかけたのはナイショ。
エクセルでの統計手法が学べる
『身近な統計』の特徴として、表計算ソフトのエクセルを使った統計手法が学べる点がある。各授業の終盤には、当該章で学んだ内容を、エクセルを使ってどう表現するかが示される。付属のDVDにはこの際に使うエクセルファイルが収録されている。
具体的なデータも収録されており(なぜか『身近な統計』は大谷翔平が大好きで彼の球種のデータが頻出する)。どのような数式を使って計算をするのか。どのような関数を使えばいいのかが実践的に学べるようになっている。LN関数(自然対数を返す)、SQRT関数(平方根を返す)、NORM.DIST関数(正規分布)、CORREL(相関係数を返す)など、恥ずかしながら知らないエクセル関数をいくつも学ぶことが出来た。これらは、現在では日常的に仕事でもよく使う関数となっている。
社会のどんな場所で統計が使われているのか
『身近な統計』のもう一つの特徴として、実際の社会現場で、統計がどのように用いられているのかを教えてくれる点が挙げられる。各回の後半に収録されている「統計と社会との接点」コーナーでは、官庁や企業での統計活用例を知ることが出来る。『身近な統計』が『身近な統計』である所以とも言えるコーナーだ。
各回の内容はこんな感じ。
- 「統計と柔道」筑波大学・全日本柔道連盟
- 「地域経済分析システム(RESAS)」内閣官房
- 「健康保険組合の取り組み」内田洋行
- 「国勢調査」総務省統計局
- 「JISマーク」日本規格協会
- 「品質管理」トヨタ自動車
- 「気象予報」気象庁
- 「保険」ニッセイ基礎研究所
- 「放送調査」NHK放送文化研究所
- 「世論調査」読売新聞
- 「臭気判定士」におい・かおり環境協会
- 「アナリティクス」SAS
- 「相関分析」韓国放送大学
- 「ビッグデータ」Yahoo!Japan
- なし
「統計と社会との接点」のコーナーに入ると、その回の授業はひとまずそこまでとなる。毎回ついていくのがやっとだったわたしとしては、「統計と社会との接点」は癒しの時間だった。
学習時間の目安、学習法
今回わたしが『身近な統計』に費やした学習時間は以下の通り。
- 身近な統計 45.2時間
『初歩からの数学』が47.1時間だったので、ほぼ同程度の時間をかけたことになる。他の文系科目は20時間台だったので、およそ倍の時間がかかっている。
わたしが行った学習方法は以下の通り。
- 過去の試験問題に挑戦
- 判らないところを確認
- テキストを読む
- 放送授業を見る
- エクセルでのやり方を学ぶ
- わかるまで繰り返す
半年間統計を学んでみてわかったこととして、統計は実際に手を動かしてみないと身につかないという点にある。実践あるのみ。問題をひたすら解いて、どうしてその回答に至るのかをきちんと理解する。エクセルで数式を作っていて、どうすればその内容が図示できるのか考えてみる。初学者はひたすら場数を踏むのがとにかく重要だと思う。
過去の試験の平均点と試験対策
放送大学で『身近な統計』を履修すると、学期末に単位認定試験に臨むことになる。直近二回分の平均点はこちら。
- 2021年度1学期(74.9点)
- 2020年度2学期(71.4点)
2021年度の二学期、放送大学はコロナ体制下にあったので、通常とは異なり、自宅での制限時間なし、持ち込み自由と、きわめて優しい条件での試験が実施された。
しかし、これだけの緩い条件でこの平均点なので、比較的難易度は高めと言えるかも。
ちなみに、わたしは全24問中23問正解で95.8点。評価は〇Aを頂くことが出来た(かなり頑張った!)。
おわりに(統計学を学んでみよう)
データサイエンスという言葉がもてはやされて久しい。データサイエンスの分野の中で、統計学は重要な要素を占める。しかし文系人間にとって統計はとっつきにくく、興味はありながらも長年手を出せないで分野でもあった。ただ、それだけに、理解が進んでくると発見も多く。日々の仕事に生かせる部分が、非常に多い科目でもあった。
とはいえ、今回『身近な統計』は、統計学においての入門的な科目であり、まだまだその先は長い。統計について、放送大学では複数の科目を用意しているので、引き続き学習を続ける予定。
先日は『身近な統計』での学びを定着させる意味で、「統計検定」の3級を受験してみた。ぎりぎりではあるが合格することが出来た(65点以上が合格の試験で67点だったけど)。『身近な統計』と内容がかなり被るので、実践の場を増やす意味でも、取り組んでみるといいかもしれない。