【GA4】データ集計の仕様変更によりデータサンプリングと(other)行の発生も仕様変更になりました

こんにちは。CCIのアナリティクス担当の谷井です。

今回は、2023年11月にGoogleよりリリースされたデータの仕様変更について解説したいと思います。

 

(other)行やサンプリングの詳細についてはこの記事では割愛しますので、Googleヘルプをご確認ください。

※Googleヘルプ:(other)行について 、データサンプリングについて

 

 

 

■リリース前の仕様について

まずはリリース前の仕様についておさらいしましょう。

 

GA4は、データ処理を行う際に「未集計データ(ローデータ)」「集計済みデータ(加工済みデータ)」の2種類のデータソースを使用しています。

また以下の通りレポートによってどちらのデータソースを使用するか決まっていました。

 

 

未集計データ⇒探索レポート

 

集計済データ⇒標準レポート、API 

 

 

さらに使用するデータの種類によって、サンプリングや(other)行の発生有無が変わる仕様になっていました。

 

 

探索レポート⇒サンプリング/発生あり (other)行/発生なし

 

標準レポート、API⇒サンプリング/発生なし (other)行/発生あり

 

 

標準レポートはディメンションを掛け合わせるなど複雑なデータ処理を行う場合、(other)行が発生してしまう場合もあり、正しい数値の取得が難しい状況でした。

ただ探索レポートでは(other)行が発生しないため、サンプリングの有無だけ気を付ければ全数値の確認が可能でした。

 

それが今回の仕様により変わってしまいます。

 

 

 

■今回の変更点

冒頭でも案内したとおり、Googleからは次のようなリリースがありました。

 

 

データサンプリングと(その他の)行の改善

Google Analytics は、ウェブサイトまたはアプリからのデータを、パフォーマンスまたは柔軟性のいずれかに最適化された 2 種類のテーブルに保存します。今回の更新により、Google Analytics は各クエリに対して最も正確な結果を提供するテーブルを選択するようになり、レポートや探索で (other) 行やデータ サンプリングが表示される可能性が減りました。

その結果、Analytics は最も正確な結果を提供し、データ サンプリングとカーディナリティ制限の影響を軽減するためにクエリに基づいてテーブルを選択するため、レポートの探索またはデータ サンプリングに (other) 行が表示される場合があります。

 

 

少し分かりづらい表現となっていますが、

 

 

探索、標準レポート、APIのレポート種別に関わらず、「未集計データ(ローデータ)」と「集計済みデータ(加工済みデータ)」の2つのなかでより適したデータを使用する

 

 

という仕様変更になりました。

今まではレポートメニューによって使用するデータが固定されていましたが、集計したい内容によって使用するデータが変わります。

その結果、全てのレポートにおいてサンプリングも(other)行も発生する可能性が出てきました。

 

 

探索レポート、標準レポート、API⇒サンプリング/発生あり (other)行/発生あり

 

 

 

筆者の方でも実際に(other)行が発生している探索を既に確認しています。

今回のリリースはGA4のみで分析をしている場合はなかなか厳しい仕様変更かと感じています。

これを機にBigQueryへのエクスポート対応を検討する方もいるのではないでしょうか。

 

CCIではGA4の導入や計測カスタマイズをはじめ、BigQueryの環境構築、蓄積されたGA4のデータ活用についてもご支援可能です。

ご興味がありましたら是非お問い合わせください。

 

GA4