アンケートの平均値を比較する。
前年差を検定する。
有意差を確認する。
分析としては、正しい手順です。
しかし、
その前にひとつ確認すべきことがあります。
そのデータは、何を代表していますか?

平均値は「集め方」に強く依存する

平均値は、数値の集まりの中心を示します。

しかし、

  • 誰が回答したのか
  • 誰が回答していないのか
  • どのタイミングで回収したのか
  • どんな文脈で答えられたのか

によって、大きく変わります。

つまり、
平均値は「母集団の姿」ではなく、
「その集め方の結果」です。

有意差があっても、意味があるとは限らない

例えば、

  • 今年:4.12
  • 昨年:3.98
  • 有意差あり(p<0.05)

これで、
「改善した」と言い切れるでしょうか?

もし、

  • 回答者層が変わっていたら?
  • 回収方法が変わっていたら?
  • 不満層が回答しなくなっていたら?

統計的な差はあっても、
実質的な意味があるとは限りません。

サンプリング設計のないデータの限界

本来、データから一般化するには、

  • 母集団を定義し
  • 抽出方法を設計し
  • 偏りを統制する

という前提が必要です。

しかし、実務では、多くの場合、

  • 任意回答
  • 自己選択型
  • 特定層に偏った回収

になっています。

それ自体が悪いわけではありません。

ただ、そのデータは「全体」を語るためのものではない、
という自覚が必要です。

では、どう扱うべきか

サンプリング設計のないデータは、
「正解を導くための根拠」ではなく、
「仮説を立てるための手がかり」
として扱うべきです。

平均値は、

  • 状況の断面
  • 変化のヒント

にはなります。

しかし、

  • 原因
  • 構造
  • 意味

までは教えてくれません。

私たちが大切にしていること

データは、強い説得力を持ちます。

だからこそ、

  • 集め方
  • 偏り
  • 前提

を確認せずに解釈することは、
誤った確信を生む危険があります。

私たちは、
データを「結論」にするのではなく、
「問いを深めるための材料」
として扱うことを大切にしています。