Metodologi CrUX

Bagian ini mendokumentasikan cara CrUX mengumpulkan dan mengatur data pengalaman pengguna.

Kelayakan

Inti set data CrUX adalah pengalaman pengguna individual, yang digabungkan ke dalam distribusi tingkat halaman dan tingkat asal. Bagian ini mendokumentasikan kelayakan pengguna dan persyaratan halaman dan origin yang akan disertakan dalam set data. Semua kriteria kelayakan harus dipenuhi agar pengalaman disertakan dalam data tingkat halaman yang tersedia di PageSpeed Insights dan CrUX API: Pengguna, Asal, dan Halaman. Pengalaman yang memenuhi kriteria Pengguna dan Asal, tetapi tidak dengan Halaman, tidak disertakan dalam data tingkat asal yang tersedia di semua sumber data CrUX.

Halaman dan origin otomatis disertakan atau dihapus dari set data jika kelayakannya berubah dari waktu ke waktu. Saat ini, Anda tidak dapat mengirimkan halaman atau origin secara manual untuk disertakan.

Dapat ditemukan secara publik

Halaman harus dapat ditemukan secara publik agar dipertimbangkan untuk disertakan dalam set data CrUX.

Sebuah halaman ditentukan dapat ditemukan secara publik menggunakan kriteria keterindeksan yang sama dengan mesin telusur.

Halaman tidak dapat memenuhi persyaratan visibilitas jika salah satu kondisi berikut terpenuhi, termasuk halaman root untuk set data asal:

  • Halaman ditayangkan dengan kode status HTTP selain 200 (setelah pengalihan).
  • Halaman ditayangkan dengan header X-Robots-Tag: noindex HTTP atau yang setara.
  • Dokumen ini menyertakan tag meta <meta name="robots" content="noindex"> atau yang setara.

Lihat Google Search Console untuk melihat ringkasan status pengindeksan situs Anda.

Cukup populer

Sebuah halaman dianggap cukup populer jika memiliki jumlah pengunjung minimum. Tempat asal dianggap cukup populer jika memiliki jumlah pengunjung minimum di semua halamannya. Jumlah pastinya tidak diungkapkan, tetapi telah dipilih untuk memastikan bahwa kami memiliki cukup sampel agar yakin dengan distribusi statistik untuk halaman yang disertakan. Jumlah minimum untuk halaman dan originnya sama.

Halaman dan origin yang tidak memenuhi batas popularitas tidak disertakan dalam set data CrUX.

Origin

Origin mewakili seluruh situs, yang dapat ditangani oleh URL seperti https://www.example.com. Agar dapat disertakan dalam set data CrUX, origin harus memenuhi dua persyaratan:

  1. Dapat ditemukan secara publik
  2. Cukup populer

Anda dapat memverifikasi bahwa origin Anda dapat ditemukan dengan menjalankan audit Lighthouse dan melihat hasil kategori SEO. Situs Anda tidak dapat ditemukan jika root page Anda gagal dalam proses Halaman diblokir dari pengindeksan atau audit Halaman memiliki kode status HTTP yang tidak berhasil.

Jika origin dianggap dapat ditemukan secara publik, pengalaman pengguna yang memenuhi syarat di semua halaman origin tersebut akan digabungkan di tingkat origin, terlepas dari visibilitas setiap halaman. Semua pengalaman ini diperhitungkan dalam persyaratan popularitas origin.

Untuk tujuan kueri, perhatikan bahwa semua origin dalam set data CrUX menggunakan huruf kecil.

Halaman

Persyaratan halaman yang akan disertakan dalam set data CrUX sama dengan origin:

  1. Dapat ditemukan secara publik
  2. Cukup populer

Anda dapat memverifikasi bahwa halaman dapat ditemukan dengan menjalankan audit Lighthouse dan melihat hasil kategori SEO. Halaman Anda tidak dapat ditemukan jika gagal saat Halaman diblokir dari pengindeksan atau audit Halaman memiliki kode status HTTP yang gagal.

Jika halaman dapat ditemukan secara publik bagi beberapa pengguna, tetapi dalam beberapa situasi menampilkan status HTTP tidak berhasil, pengalaman tersebut tidak akan disertakan dalam CrUX.

Halaman biasanya memiliki ID tambahan di URL-nya, termasuk parameter string kueri seperti ?utm_medium=email dan fragmen seperti #main. ID ini dihilangkan dari URL dalam set data CrUX sehingga semua pengalaman pengguna di halaman tersebut diagregasikan bersama. Hal ini berguna untuk halaman yang tidak akan memenuhi nilai minimum popularitas jika ada banyak variasi URL yang terpisah untuk halaman yang sama. Perhatikan bahwa dalam kasus yang jarang terjadi, hal ini dapat secara tidak terduga mengelompokkan pengalaman untuk halaman yang berbeda secara bersamaan; misalnya jika parameter ?productID=101 dan ?productID=102 mewakili halaman yang berbeda.

Halaman di CrUX diukur berdasarkan halaman tingkat atas. Halaman yang disertakan sebagai iframe tidak dilaporkan secara terpisah di CrUX, tetapi berkontribusi terhadap metrik halaman tingkat atas. Misalnya, jika https://www.example.com/page.html menyematkan https://www.example.com/frame.html di iframe, page.html akan direpresentasikan di CrUX (tunduk pada kriteria kelayakan lainnya), tetapi frame.html tidak akan. Jika frame.html memiliki CLS yang buruk, CLS akan disertakan saat mengukur CLS untuk page.html. CrUX adalah Laporan Pengalaman Pengguna Chrome dan pengguna mungkin bahkan tidak mengetahui bahwa ini adalah iframe. Oleh karena itu, pengalaman diukur di halaman tingkat atas—sesuai dengan cara pengguna melihatnya.

Arsitektur {i>website<i} dapat memperumit bagaimana datanya direpresentasikan di CrUX. Misalnya, aplikasi web satu halaman (SPA) mungkin menggunakan skema transisi rute berbasis JavaScript untuk berpindah antarhalaman, berbeda dengan navigasi halaman berbasis anchor konvensional. Transisi ini muncul sebagai kunjungan halaman baru bagi pengguna, tetapi bagi Chrome dan API platform yang mendasarinya, seluruh pengalaman akan diatribusikan ke kunjungan halaman awal. Hal ini adalah batasan API platform web tempat CrUX dibuat. Lihat Pengaruh arsitektur SPA terhadap Core Web Vitals di web.dev untuk mengetahui informasi selengkapnya.

Pengguna

Agar pengguna dapat menggabungkan pengalamannya dalam set data CrUX, mereka harus memenuhi kriteria berikut:

  1. Aktifkan pelaporan statistik penggunaan.
  2. Menyinkronkan histori browser mereka.
  3. Frasa sandi sinkronisasi belum disetel.
  4. Gunakan platform yang didukung.

Platform yang didukung saat ini adalah:

  • Chrome versi desktop termasuk sistem operasi Windows, macOS, ChromeOS, dan Linux.
  • Chrome versi Android, termasuk aplikasi seluler yang menggunakan Tab Khusus dan WebAPKs.

Ada beberapa pengecualian penting yang tidak menyediakan data ke {i>dataset<i} CrUX:

  • Chrome di iOS.
  • aplikasi Android yang menggunakan WebView.
  • Browser Chromium lainnya (misalnya Microsoft Edge).

Chrome tidak memublikasikan data tentang proporsi pengguna yang memenuhi kriteria ini. Anda dapat mempelajari lebih lanjut data yang kami kumpulkan di Laporan Resmi Privasi Chrome.

Accelerated Mobile Pages (AMP)

Halaman yang dibuat dengan AMP disertakan dalam set data CrUX seperti halaman web lainnya. Sejak rilis CrUX pada Juni 2020, halaman yang ditayangkan menggunakan AMP Cache dan / atau dirender di AMP Viewer juga direkam, dan diatribusikan ke URL halaman penayang.

Kualitas data

Data di CrUX mengalami sedikit pemrosesan untuk memastikan data tersebut akurat secara statistik, terstruktur dengan baik, dan lebih mudah untuk dikueri.

Pemfilteran

{i>Dataset<i} CrUX difilter untuk memastikan bahwa data yang disajikan valid secara statistik. Hal ini dapat mengecualikan seluruh halaman atau asal agar tidak muncul dalam set data.

Selain kriteria kelayakan yang diterapkan ke origin dan halaman, pemfilteran lebih lanjut diterapkan untuk segmen dalam data:

Origin atau halaman yang lebih dari 20% dari total traffic-nya dikecualikan karena kombinasi dimensi yang tidak memenuhi syarat dikecualikan sepenuhnya dari set data.

Karena set data tingkat global mencakup pengalaman pengguna dari semua negara, kombinasi dimensi yang tidak memenuhi kriteria popularitas di tingkat negara mungkin masih disertakan di tingkat global, asalkan popularitasnya memadai.

Proses fuzzing

Sejumlah kecil keacakan diterapkan ke set data untuk mencegah rekayasa balik data sensitif, seperti total volume traffic. Hal ini tidak memengaruhi keakuratan statistik gabungan.

Presisi

Sebagian besar nilai metrik dalam set data CrUX direpresentasikan sebagai histogram nilai dan ukuran bin, dengan nilai histogram adalah pecahan dari semua segmen yang disertakan yang menjumlahkan menjadi 1. Ukuran bin adalah angka floating point antara 1,0 dan 0,0001.

Histogram lebar bin dinormalkan untuk menyederhanakan pembuatan kueri dan visualisasi data. Artinya, bin yang lebih besar dapat dibagi menjadi bin yang lebih kecil, yang memiliki sama kepadatan asli untuk mempertahankan lebar bin yang konsisten.

Lisensi

Set data CrUX oleh Google dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0 International.