アンケートの平均値を比較する。
前年差を検定する。
有意差を確認する。
分析としては、正しい手順です。
しかし、その前にひとつ確認すべきことがあります。
そのデータは、何を代表していますか?

平均値は「集め方」に強く依存する

平均値は、数値の集まりの中心を示します。
しかし、

  • 誰が回答したのか
  • 誰が回答していないのか
  • どのタイミングで回収したのか
  • どんな文脈で答えられたのか

によって、大きく変わります。
つまり、平均値は「母集団の姿」ではなく、「その集め方の結果」です。

有意差があっても、意味があるとは限らない

例えば、

  • 今年:4.12
  • 昨年:3.98
  • 有意差あり(p<0.05)

これで、「改善した」と言い切れるでしょうか?
もし、

  • 回答者層が変わっていたら?
  • 回収方法が変わっていたら?
  • 不満層が回答しなくなっていたら?

統計的な差はあっても、実質的な意味があるとは限りません。

サンプリング設計のないデータの限界

本来、データから一般化するには、

  • 母集団を定義し
  • 抽出方法を設計し
  • 偏りを統制する

という前提が必要です。
しかし、実務では、多くの場合、

  • 任意回答
  • 自己選択型
  • 特定層に偏った回収

になっています。
それ自体が決して悪いわけではありません。
ただ、そのデータは「全体」を語るためのものではない、という自覚が必要です。

では、どう扱うべきか

サンプリング設計のないデータは、「正解を導くための根拠」ではなく、
「仮説を立てるための手がかり」として扱うべきです。
平均値は、

  • 状況の断面
  • 変化のヒント

にはなります。
しかし、

  • 原因
  • 構造
  • 意味

までは教えてくれません。

私たちが大切にしていること

データは、強い説得力を持ちます。
だからこそ、

  • 集め方
  • 偏り
  • 前提

を確認せずに解釈することは、誤った確信を生む危険があります。
私たちは、データを「結論」にするのではなく、
「問いを深めるための材料」として扱うことを大切にしています。