top of page

レポート数値がずれる「サンプリング」「しきい値」とは?

GA4

レポート数値がずれる「サンプリング」「しきい値」とは?

概要

Googleアナリティクス(GA)のレポート上で大規模なデータを扱う際、数値が設定によってずれてしまう、正確でないと感じることがあるかもしれません。
これは計測エラーではなく、Googleのデータ処理方法やプライバシー保護機能によるものです。

GAのレポートの仕組みである「データサンプリング」と「しきい値の適用」を把握して、適切にデータを利用していきましょう。

Googleアナリティクス(GA)のレポート上で大規模なデータを扱う際、数値が設定によってずれてしまう、正確でないと感じることがあるかもしれません。

これは計測エラーではなく、Googleのデータ処理方法やプライバシー保護機能によるものです。


GAのレポートの仕組みである「データサンプリング」と「しきい値の適用」を把握して、適切にデータを利用していきましょう。


データサンプリングとは

処理するデータ量が膨大な場合(特にトラフィックの多いサイト、イベント数が膨大なサイトで、分析期間の長いレポートを作成した場合など) GAではデータを一部抽出して処理するため、ずれが発生する場合があります。これを「データサンプリング」といいます。



より厳密には、レポート、データ探索、リクエストの作成に使用されたイベントの数がプロパティの割り当て上限を超えた場合にサンプリングが発生する場合があります。


イベントの割り当て上限は、標準のプロパティでイベント 1,000 万件、360 プロパティで最大 10 億件です。


360 プロパティでは、デフォルトで 1 億件のイベントが上限として設定されており、迅速にデータを取得できる設定になっています。精度を上げる必要がある場合は、データ探索にあるデータ品質アイコンから [精度の高い結果] を選択すると、サンプリングの上限を緩和できます。



サンプリングのチェック方法

サンプリングの発生有無は、レポートの見出し横のアイコンをクリックすることで詳細を確認できます。


サンプリングが発生している状態
サンプリングが発生している状態
サンプリングが発生していない状態
サンプリングが発生していない状態

サンプリングを回避するための対策

データサンプリングを回避するための対策は二つ挙げられます。


1.360プロパティの探索レポートで[精度の高い結果]を選択する

前述したとおり、デフォルトでは[迅速な結果]が設定されているため、[精度の高い結果]を選択することでサンプリングのイベント上限を緩和できます。デメリットとして、レポートにデータが出力されるまでの時間が長くなってしまうことが挙げられます。


また、標準のプロパティでサンプリングが発生している場合は、上限のイベント数が大幅に増える360プロパティへの変更をご検討ください。

2.BigQuery にGAデータを出力して利用する

GAのRAWデータ(未加工のデータ)を抽出し、サンプリングの影響を完全に排除した正確なデータ集計をおこなう方法です。


最新のデータを定期的に出力し、継続してデータを蓄積して分析やダッシュボードでのデータ可視化に使うことができます。デメリットとして、Googleの統計情報をもとに出されている一部のユーザー属性や興味関心データは利用できないことが挙げられます。


しきい値の適用とは

年齢や性別など、ユーザー数が少ない特定のセグメントをデータに含んでいる場合、ユーザーのプライバシー保護のため、数値が非表示になる(レポートから除外される)ことがあります。これを「しきい値の適用」といいます。


レポートから一部データが除外されるため、しきい値が適用されていない状態と比べて少ない数値が表示されます。



しきい値の適用の確認方法

レポートまたはデータ探索のデータがしきい値によって制限されている場合、レポート上部に [このレポート内の一つ以上のカードにしきい値が設定されているため、データ集計の最小しきい値を満たした場合にのみ、データが表示されます] というメッセージが表示されます。


しきい値を回避するための対策

しきい値の適用を回避するための対策は二つ挙げられます。


1. ユーザー属性や検索語句を含むレポートは対象ユーザー数が多い場合のみに利用する

しきい値が適用されやすいディメンションである「年齢」「性別」のようなユーザー属性や「検索語句」を利用したい場合、対象ユーザー数が十分に担保されていることを確認してから利用します。


2. レポートの期間を延長する

レポートの集計期間を広げ、イベントを発生させた合計ユーザー数を増やすことで、しきい値の適用を回避します。


まとめ

GAにおける数値のずれは、ツールの集計負荷を軽減する機能やプライバシー保護の機能により、360プロパティであっても発生することがあります。


「データサンプリング」や「しきい値の適用」というGAの仕様を把握し、それを回避するよう対策することで、正確なデータを使ったレポーティングと分析ができます。


また、GAの管理画面で取得できる数値はサンプリングやしきい値の影響を受けることがありますが、BigQueryにエクスポートしたRAWデータを活用することで、それらの機能による数値ずれのリスクを無くすことができます。


計測データやレポート数値に不安がある場合や、BigQueryを用いたGAデータの活用に興味がある場合は、お気軽に営業担当者までお問合せください。


参考

データのサンプリングについて - アナリティクス ヘルプ

[GA4] データのしきい値について - アナリティクス ヘルプ


問題が解決しませんでしたか?

さらにサポートが必要な場合は、担当者までお問い合わせください。

関連記事

GA

レポート数値がずれる「サンプリング」「しきい値」とは?

GA

「総ユーザー数」と「アクティブユーザー数」の使い分け方は?

GA

Looker Studioのダッシュボード上の数値がGA4のレポートの数値からずれるのはなぜ?

すべて見る
bottom of page