BigQuery는 대규모 데이터 세트에 대해 매우 신속하게 쿼리할 수 있는 클라우드 데이터 웨어하우스입니다.
모든 원시 이벤트를 Google 애널리틱스 4 속성(하위 속성 및 롤업 속성 포함)에서 BigQuery로 내보낸 다음 SQL과 유사한 구문을 사용하여 해당 데이터를 쿼리할 수 있습니다. BigQuery에서 데이터를 외부 저장소로 내보내거나 외부 데이터를 가져와서 애널리틱스 데이터와 결합할 수 있습니다.
BigQuery로 데이터를 내보내면 해당 데이터를 소유하면서 BigQuery ACL을 이용해 프로젝트 및 데이터 세트에 대한 권한을 관리할 수 있습니다.
전체 데이터 내보내기는 하루에 한 번 진행되며, 데이터는 종일 지속적으로 내보내지기도 합니다(아래의 스트리밍 내보내기 참고).
무료 BigQuery 인스턴스(BigQuery 샌드박스)로 데이터를 내보낼 수 있지만 샌드박스 한도를 초과하여 내보내면 비용이 청구됩니다.
표준 속성의 일일 BigQuery Export 한도는 이벤트 100만 개입니다. 다른 BigQuery Export 한도에 대해 자세히 알아보기
Google 애널리틱스 인터페이스와 BigQuery Export의 차이점
BigQuery 이벤트 내보내기를 사용하면 원시 이벤트 및 사용자 수준 데이터에 대한 액세스를 제공할 수 있습니다. 단, Google 애널리틱스에서 표준 보고서 및 탐색 분석의 데이터에 추가한 값은 제외됩니다. 따라서 BigQuery 이벤트 내보내기의 데이터는 Google 애널리틱스 인터페이스의 데이터와 다를 수 있습니다.
BigQuery 이벤트 내보내기와 Google 애널리틱스 인터페이스의 차이점을 이해하고 가능한 경우 이러한 차이를 줄이는 방법을 알아보려면 Google 애널리틱스 UI와 BigQuery 내보내기 간의 차이 줄이기를 참고하세요.
스트리밍 내보내기
Google 애널리틱스 4 속성을 BigQuery에 연결할 때 스트리밍 내보내기 옵션을 선택할 수 있습니다.
BigQuery 스트리밍 내보내기를 사용하면 BigQuery Export를 통해 몇 분 이내에 당일 데이터를 사용할 수 있습니다.
이 내보내기 옵션을 사용하면 속성의 사용자 및 트래픽을 분석할 수 있는 최신 정보가 BigQuery에 전달됩니다.
스트리밍 내보내기를 통해 매일 다음과 같은 하나의 테이블이 새로 만들어집니다.
events_intraday_YYYYMMDD
: 하루 동안 발생한 세션 활동 레코드가 포함된 내부 스테이징 테이블입니다. 스트리밍 내보내기는 베스트 에포트(best-effort) 방식으로 실행되는 작업으로, 실패한 업로드, 지연된 이벤트 처리 등과 같은 이유로 일부 데이터를 포함하지 않을 수 있습니다. 데이터는 하루 종일 지속적으로 내보내집니다. 하나의 세션이 여러 내보내기 작업에 걸쳐 있는 경우 해당 세션에 대한 레코드가 이 테이블에 포함될 수 있습니다. 이 테이블은events_YYYYMMDD
가 완료되면 삭제됩니다.
BigQuery Export 설정 시 일일 옵션을 선택하면 다음 테이블도 매일 생성됩니다.
events_YYYYMMDD
: 매일 진행되는 전체 이벤트 내보내기입니다.
events_intraday_YYYYMMDD
가 아닌 events_YYYYMMDD
를 쿼리하여 해당 날짜의 안정적인 데이터 세트를 쿼리해야 합니다.
events_YYYYMMDD
및 events_intraday_YYYYMMDD
테이블에 대한 자세한 내용은 BigQuery Export 스키마에서 확인하세요.
BigQuery 스트리밍 내보내기에는 신규 사용자에 대한 다음 사용자 기여 분석 데이터가 포함되지 않습니다.
- traffic_source.name(보고 측정기준: 사용자 캠페인)
- traffic_source.source(보고 측정기준: 사용자 소스)
- traffic_source.medium(보고 측정기준: 사용자 매체)
기존 사용자에 대한 사용자 기여 분석 데이터는 포함되지만, 이 데이터를 완전히 처리하려면 약 24시간이 걸리므로 스트리밍 내보내기 대신 전체 일일 내보내기에서 사용자 기여 분석 데이터를 가져오는 것이 좋습니다.
스트리밍 내보내기를 사용하면 BigQuery 이용료에서 데이터 1GB당 $0.05의 비용이 추가로 발생합니다. 1GB는 약 60만 건의 Google 애널리틱스 이벤트에 해당합니다(건수는 이벤트 크기에 따라 달라질 수 있음). BigQuery 가격 책정에 대해 자세히 알아보기
테이블 업데이트 일정
BigQuery Export의 일부로 생성되는 테이블의 업데이트에는 데이터를 내보내는 애널리틱스 속성의 시간대가 적용됩니다.
스트리밍 내보내기 테이블(events_intraday_YYYYMMDD)은 하루 종일 지속적으로 업데이트됩니다(예: 속성 시간대를 기준으로 오전 12:00:00부터 오후 11:59:59까지). 속성의 시간대에서 새 날짜가 시작되면 이벤트가 바뀐 새 날짜의 테이블에 기록됩니다.
애널리틱스에서 그날의 모든 이벤트를 수집한 후 일일 내보내기 테이블이 생성됩니다(events_YYYYMMDD). 애널리틱스에서는 테이블 날짜로 타임스탬프된 이벤트(예: 측정 프로토콜 또는 Firebase SDK에서 늦게 넘어온 여러 이벤트)로 일일 테이블을 업데이트하며, 테이블 날짜 이후 최대 72시간까지 반영합니다. 가령 테이블 날짜가 20220101이면 애널리틱스에서는 20220101로 타임스탬프된 이벤트를 20220104까지 반영하여 표에 업데이트하게 됩니다.
필요에 따라 애널리틱스에서는 이전 데이터를 다시 처리해야 하는 경우 72시간 후라도 언제든지 일일 테이블을 업데이트할 수 있습니다(예: 처리 오류를 해결하는 버그 수정).
쿠키가 없는 핑과 고객 제공 데이터
동의 모드가 구현되면 애널리틱스에서 수집한 쿠키가 없는 핑이 user_id, 맞춤 측정기준처럼 고객이 제공한 데이터와 함께 BigQuery Export에 표시됩니다.
'사용할 수 없음' 트래픽 소스 측정기준 백필
다음 리소스를 사용하여 특정 GCLID에 대해 기여도가 부여된 트래픽 소스 측정기준을 조회할 수 있습니다. wBRAID 및 gBRAID 식별자는 BigQuery Export에 포함되지 않습니다.
- Google Ads API
- Google Ads 스크립트
- Google Ads용 BigQuery Data Transfer Service
'traffic_source' 열에서 '사용할 수 없음' 레코드의 GCLID를 찾으려면 'collected_traffic_source' 열에서 GCLID 필드를 쿼리합니다. 특정 GCLID에서 Google Ads의 캠페인 정보를 조회하는 방법에 관한 자세한 내용은 BigQuery Export 서비스수준계약을 참고하세요.
GA4 - Firebase 통합 및 BigQuery
GA4 속성과 Firebase 프로젝트가 통합된 경우에는 별도의 BigQuery 프로젝트에 연결할 수 없습니다.
Google 애널리틱스 4와 유니버설 애널리틱스의 BigQuery Export 기능 비교
Google 애널리틱스 4 | 유니버설 애널리틱스 |
---|---|
표준(무료) 및 360(유료)에서 사용 가능 표준 한도: 일일 이벤트 100만 개 360 한도: 일일 이벤트 수십억 개 |
360에서 사용 가능(유료) |
비용 샌드박스 한도 내에서 BigQuery 샌드박스로 무료 내보내기 샌드박스 한도를 초과하여 내보낸 데이터에는 계약 약관에 따라 요금이 청구됨 |
비용 샌드박스 한도 내에서 BigQuery 샌드박스로 무료 내보내기 샌드박스 한도를 초과하여 내보낸 데이터에는 계약 약관에 따라 요금이 청구됨 |
설정 특정 데이터 스트림을 포함하고 각 속성의 특정 이벤트를 제외할 수 있음 (내보내기 볼륨과 비용을 관리할 수 있음) |
설정 속성당 하나의 뷰만 연결할 수 있음 (해당 보기의 모든 데이터를 내보냄) |
스트리밍 내보내기 1GB당 0.05달러(BigQuery 가격 책정에 대해 자세히 알아보기) 테이블 생성됨: events_intraday_YYYYMMDD 테이블이 매일 삭제됨:
신규 사용자의 사용자 캠페인, 사용자 소스 또는 사용자 매체 데이터는 포함하지 않음 |
스트리밍 내보내기 1GB당 0.05달러(BigQuery 가격 책정에 대해 자세히 알아보기) 테이블 생성됨: ga_realtime_sessions_YYYYMMDD BigQuery 뷰 생성됨: ga_realtime_sessions_view_YYYYMMDD |
일일 내보내기 테이블 생성됨: events_YYYYMMDD |
일일 내보내기 테이블 생성됨 ga_sessions_intraday_YYYYMMDD
ga_sessions_YYYYMMDD
|
일일 업데이트 내보내기 '일반' 및 '대규모' 360도 속성에서 사용할 수 있음 관찰된 사용자 기여 분석 및 광고 노출 데이터를 비롯하여 일일 내보내기에 포함되는 것으로 간주되는 모든 데이터 필드와 열이 포함됩니다. |
해당 사항 없음 |
내보내기, 일반 백필: 백필 없음 데이터 세트: 연결된 속성마다 데이터 세트 1개의 이름이 analytics_<속성 ID>로 지정됨 동의 모드를 구현한 경우 내보내기에 다음이 포함됩니다.
|
내보내기, 일반 백필: 연결 시 13개월 분량 데이터의 백필 또는 100억 건의 조회 중 더 작은 값 (BigQuery 샌드박스로 백필하지 못할 수 있음) 데이터 세트: 연결된 뷰마다 데이터 세트 1개에 뷰와 같은 이름이 지정됨 |
스키마 내보내기 GA4에서는 사용자를 처음 획득한 트래픽 소스만 내보냄 BigQuery로 내보낸 UA 데이터를 지원하지 않음 BigQuery 테이블의 각 행이 이벤트를 나타냄 Google 애널리틱스 4 고유의 이벤트 데이터 유니버설 애널리틱스 필드와 본질적으로 동일한 일부 Google 애널리틱스 4 필드가 있지만(예: |
스키마 내보내기 여러 터치 포인트에서 세션 수준 기여 분석 BigQuery 테이블의 각 행이 세션을 나타냄 유니버설 애널리틱스 고유의 조회 데이터 Google 애널리틱스 4 필드와 본질적으로 동일한 일부 유니버설 애널리틱스 필드가 있지만(예: |
관련 리소스
BigQuery 개발자 가이드에서 아래 내용에 대해 자세히 알아볼 수 있습니다.