MENU

文系出身者が統計検定データサイエンス基礎に2週間で合格した勉強法【暗記すべき式、当日の注意点】

この記事は、普段とは毛色の異なる記事となりますが、個人的に統計検定データサイエンス基礎のCBT方式試験を受けてきましたので、記録の意味も含めて作成するものです。

勉強法や、特に暗記すべき式や関数、当日の注意点を記しておりますので、受験される方のご参考になれば幸いです。

目次

勉強開始時の状況と受験結果

勉強開始時の状況

勉強開始時の状況としては、以下のとおりです。

勉強開始時の状況
  • 文系出身者
  • 大学で統計学に少し触れた程度
  • 高校数学で統計の履修は無かった時代
  • センター試験の数学はどちらかというと苦手
  • 統計検定は未受験
  • 「標準偏差」「検定」「正規分布」「回帰分析」と聞くと何となくの意味が分かる
  • 「変動係数」「ベイズの定理」「季節調整」「ギロー指数」は全くの初耳

この状況から勉強を開始して、2週間後に受験しました。

勉強した総時間数でいうと、50時間程度だったかと思います。

受験結果

結果は、以下のとおり90点を獲得して合格でした。

最も出来が悪かったのは「確率・確率分布・推測のアナリティクス」の分野で70%の正答率でした。一方、「質的データのアナリティクス」及び「量的データのアナリティクス」では満点を獲得できました。

ちなみに、上の写真に「202107版」とありますが、統計検定データサイエンス基礎は長い間出題形式が行われていないためこのような表示になっているものであり、実際に受験したのは令和7年です。

最初は「資格がとれればいいか」くらいのスタンスでしたが、振り返ってみると、回帰分析、検定、確率分布といった統計の基礎について、幅広く、実務に即して学習できる素晴らしい資格試験だと感じます。

勉強法

勉強法については、至ってシンプルです。

まずは公式のテキストを買う

とにかく、第一に公式のテキストを購入することです。統計検定2級の取得者であっても、この公式のテキストを全く見ない状態で受験した場合、合格は難しいように思えます。

統計検定データサイエンスの対策方法は、日本統計学会による公式のテキストを購入して、その1冊を学習・演習するだけです。

【3980円以上送料無料】データアナリティクス基礎 日本統計学会公式認定統計検定データサイエンス基礎対応/日本統計学会/編

これ以上も以下も無いと思います。同じ統計検定の試験である統計調査士や専門統計調査士と比して、統計検定データサイエンスは、公式のテキストと極めて近しい問題が当日に出題される印象があります。

例題・演習問題・模擬試験を解ける状態に

具体的には、まずテキストの各章の説明部分を読んだ後、各章の頭についている例題と、各章末についている演習問題を自宅のパソコン等で実際に解いてみます。

これを10章まで1周したら、あとは、とにかく演習を繰り返します。各章の例題と演習問題、さらに本の一番最後に掲載されている模擬問題を解きます。

例題・演習問題・模擬問題を3回ずつくらい解けば、十分だと考えられます。

実際に公式のテキストで学習を開始されればお気づきになるかと思うのですが、公式のテキストは分厚いものの、そのうち例題・演習問題・模擬問題に関わる部分は一部です。実際の試験においても例題・演習問題・模擬問題と近しい問題が出題されるため、とにかく、これらをクリアするために必要な知識だけを押さえておけば、試験合格は達せられると感じました。

たとえば、公式のテキストの随所に散りばめられている「Tips」は、統計の読み物として知的好奇心を刺激されますが、試験とはあまり関係のないことが多いように感じたので、試験合格のみを目指すのであれば基本的に飛ばしてよいと思います。

パソコン環境が無いと厳しい

公式がアナウンスしているとおり、統計検定データサイエンス基礎はデータの利活用に主眼を置いた試験です。当日は、試験会場のパソコンに備えられたExcelで計算をすることになります。

ちなみに、試験会場ではメモ用紙と筆記用具が手渡されましたが、統計検定のように地力での計算は基本的に行いませんので、不要に感じました。

ひるがっていうと、試験勉強もExcelを用いた演習がメインになりますので、基本的には自分で使えるエクセルのインストールされたパソコンが無ければ厳しいように思います。

必ず押さえておきたい公式

続いて、必ず押さえておきたい公式についてです。

公式のテキストの例題・演習問題・模擬試験において度々出現するほか、本試験でも頻出と思われます。

押さえておきたい公式
  • 変動係数:(標準偏差)/(平均値)
  • 標準得点:(データの値-平均値)/(標準偏差)
  • 偏差値:標準得点×10+50
  • χ検定統計量:(観測度数-期待度数) / (期待度数)
  • 二項分布の平均:試行回数n×確率p
  • 二項分布の分散:(n×p)×(1-p)
  • 標本誤差:標本標準偏差 /(nの平方根)
  • 増加率・減少率・成長率:(後の値-元の値)/(元の値)
  • 部分系列Aの全体の変動に対する寄与度:(Aの後の値-Aの元の値)/ (全体の元の値)
  • 値Xの季節調整値:X /(季節指数)×100
  • ギロー指数:(語彙の種類数)/(語彙の総数の平方根)

なお、以上はおおむね公式のテキストで出てくる順番と同じにしています。式はウェブ上では読みづらいかと思いますので、実際の公式のテキストを参照していただければ幸いです。

必ず押さえておきたいExcelの関数

続いて、特に頻出と思われるエクセルの関数を以下にまとめましたので、ご覧ください。こちらも公式のテキストで出てくる順番と同じ順番です。

押さえておきたいExcel関数
  • CHISQ.TEST:観測度数と期待度数を参照するとχ2検定のP値を返す
  • QUATILE.INC:四分位数を返す
  • VAR.P:分散を返す
  • STDEV.P:標準偏差を返す
  • BINOM.DIST:二項分布に従う時の確率を返す
  • NORM.DIST:正規分布に従う時の確率を返す
  • STDEV.S:母標準偏差の推定値を普遍分散に基づき点推定する
  • CONFIDENCE.T:t分布で母平均の信頼区間を求める際に用いる
  • CONFIDENCE.NORM:正規分布で母平均の信頼区間を求める際に用いる

こちらも、ここで見ただけでは何のことか全く分からないと思います…。ので、実際には公式のテキストで確認を推奨いたします。

受験当日の注意点

最後に受験当日の注意点です。

ブルーライトが眩しかった

私の受験会場の環境に依存するものなのか分かりませんが、とにかく受験会場のパソコンのブルーライトが目に痛かったです。

普段はスマホもパソコンも常時夜間モードで使用しているためでしょうか…。

受験開始後に、「ブルーライトカットメガネを持っていけばよかった」と少し後悔しました。

参照セルのミスに注意

よくあるミスとして、参照するセルを間違えがちになると感じました。

90分の試験とそこそこ長いため、広範になると注意力が削がれます。そうすると、単純に、クリックする場所を一つ間違えてしまうというような誤りも起きえます。

作業したExcelのシートはページを移動すると消える

私が受験した際には、8つの大問について、大問ごとに受験画面でページが用意されているところ、このページを跨ぐと作業したExcelが初期化されるという仕様のようでした。

受験会場でもアナウンスが無かったため、注意が必要だと感じました。

この仕様から、統計検定データサイエンス基礎のCBT試験では、一つの大問のうちいくつかの小問を残して後で解くという手段をとりづらいため、一度大問に手をつけたら、その大問中の小問を全部解ききってから次の大問へ進んだ方が効率がよいと感じました。

指数や確率について、「1%」か、「0.01」か

指数や確率については、「1%」と%表示で回答を求められる小問と、「0.01」と%なしの表示で回答を求められる小問が混在しています。

問題文をよく読んで、問題文の表記に合わせる必要があるため、注意が必要だと感じました。

「以上」「以下」「超える」「未満」に注意

同じようなお話ですが、「以上」「以下」「~を超える」「~未満」が問題文に混在していることも要注意です。

例えば信頼区間や二項分布の確率の問題では、これらの記述が異なることに合わせて、微妙にExcelで作らなければならない式が異なってきますので、注意深く読むことが必要だと思いました。

Excelでカッコを式にする際に注意

統計検定データサイエンス基礎では、分母と分子から成る公式が多くありますが、Excelの仕様上、注意が必要だと感じました。

たとえば、増加率の公式は【(後の値-元の値)/(元の値)】ですが、Excel上で式にする際、この(後の値-元の値)に括弧を付さなければ、「/」部分が先に計算されてしまうため、注意が必要です。

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
目次