データと分析ソフトさえあれば、簡単に結果を出すことはできます。
しかし、特に、データ分析を始める前に、明確な目的とアウトカム(期待する効果)を設定することは
成功の鍵です。目的が曖昧なままでは、分析方法の選定や結果の解釈が不安定になります。
例えば、売上改善を目的とする場合、KPIや具体的な達成目標を数値で定義すると、データ分析の方向性が
定まりやすくなります。注意すべき点を以下にまとめました。
① 目的とアウトカムを明確にする(データ分析の第一歩)
・ 「なんとなく分析」ではなく、何を明らかにしたいのかを明確にしましょう。
・ 高度な手法が不要な場合もあります。分布を可視化するだけで十分なこともあります。
・ 分析結果は、必ず政策や施策に活かし、目標達成(アウトカム)につなげることが重要です。
・ 分析は「GO」の判断だけでなく、「NOT GO」の判断にも価値があります。
② 「 Garbage in, Garbage out 」 ー データ品質の重要性
・ 質の悪いデータからは、どんなに高度な手法を使っても有用な結果は得られません。
・ 間違った結論や時間・コストの無駄を防ぐためにも、正確で適切なデータを入手することが第一歩です。
③ データ分析の誠実性を保つ
・ 欲しい結論ありきでデータを選んだり、都合のよい手法だけを繰り返すのは危険です。
・ 恣意的な加工は「事実」を歪め、誤った結論を導きます。
・ バイアス(誤差)を最小化し、目的に対して正しい結論を導く姿勢が求められます。
④ 原データを正しく使う(集計済みデータの落とし穴)
・ データ分析の基本は平均値とばらつきの確認です。
・ 集計済みデータで散布図や相関を求めても意味がない場合があります。
・ 必ず原データから分析を始めましょう。
⑤ 順位尺度の評価と注意点(アンケート分析の例)
・ 5段階評価などは順序があっても、数値間の等間隔性は保証されません。
・ 平均値の差(例:3.5と3.7)がそのまま意味を持つとは限らないことを理解しましょう。
⑥ 共変量を考慮した正しい評価(事例:広告費と売上)
・ 例:広告費とアイスクリーム売上の関係を考えるとき、「気温」という条件を無視できません。
・ 冷夏では広告費を増やしても売上が伸びないこともあります。
・ このように、影響を及ぼす第三の要素(共変量)を正しく評価する必要があります。