Bagaimana Google menentukan hasil pencarian?
Mari memahami proses perayapan, pengindeksan, dan algoritma pencarian untuk menyusun strategi SEO yang benar.
Artikel ini ditulis dan diadaptasikan untuk pembaca Indonesia oleh Artisan Konten dari sumber asli How Search works.
Untuk setiap kata atau kalimat yang kita masukkan ke formulir pencarian, terdapat ribuan hingga jutaan laman web dengan konten yang mungkin relevan.
Lantas, bagaimana Google menentukan laman web mana yang layak untuk ditampilkan di hasil pencarian?
Ada tiga proses yang dijalankan: perayapan (crawling), pengindeksan (indexing), dan penerapan algoritma pencarian.
Selanjutnya, mari kita dalami satu per satu:
- Perayapan dan Pengindeksan
- Mengumpulkan informasi dengan bot perayap
- Menata informasi dengan pengindeksan
- Penerapan Algoritma Pencarian
- Menganalisis kata, frasa, atau kalimat kita
- Mencocokkan hasil analisis dengan indeks
- Menentukan ranking laman web
- Mempertimbangkan konteks pencarian
- Menyajikan hasil pencarian terbaik
- Penyajian Hasil Pencarian
- Jawaban dari Knowledge Graph
- Jawaban langsung
- Cuplikan Unggulan
- Daftar ragam
- Menjawab sebelum kita bertanya
- Perubahan seiring perkembangan internet
Perayapan dan Pengindeksan
Untuk menata informasi dalam jumlah tak terbatas – dan terus menerus bertambah, Google menjalankan bot perayap (web crawler) sebagai pengumpul data, kemudian menyimpan hasilnya dalam indeks pencarian (search index).
Proses perayapan dimulai dari pemeriksaan daftar alamat web yang sudah pernah dirayapi sebelumnya.
Jika daftar itu belum ada, bot perayap akan memeriksa file peta situs (sitemap) yang dikirimkan oleh webmaster.
Saat web crawler menelusuri sebuah website, bot ini akan memeriksa dan menggunakan link-link yang ada dalam suatu laman untuk menemukan laman-laman lainnya.
Bot perayap akan mencatat setiap tautan yang baru dibuat, tautan yang sudah diperbarui, termasuk tautan yang rusak (broken link).
Semua proses itu dilakukan secara otomatis. Maka, kapan proses perayapan dilakukan, seberapa sering diulang, hingga berapa banyak laman yang dikunjungi tidak bisa ditentukan secara pasti.
Meskipun demikian, webmaster masih bisa menentukan batasan perayapan dengan menggunakan file robots.txt.
Kita bisa mengatur bagaimana bot Google merayapi website kita dengan menggunakan webmaster tools, alat bantu gratis yang boleh digunakan oleh semua webmaster untuk memastikan obyektivitas hasil pencarian.
Mengumpulkan informasi dengan bot perayap
Internet ibarat sebuah perpustakaan raksasa dengan triliunan buku yang jumlahnya selalu bertambah setiap detik. Ironisnya, tidak ada katalog pustaka tunggal yang memuat data seluruh buku yang ada di dalamnya.
Untuk mengumpulkan data tersebut, Google menggunakan sebuah software yang disebut web crawlers. Bot-bot perayap ini mengunjungi seluruh laman web yang diizinkan untuk diakses oleh publik.
Crawlers membaca setiap laman web satu per satu, kemudian mengikuti setiap tautan yang ada di laman itu untuk mengunjungi laman-laman lainnya.
Setelahnya, bot-bot perayap akan mencatat data mengenai seluruh laman web yang telah mereka kunjungi, dan menyimpannya ke dalam server-server Google.
Menata informasi dengan pengindeksan
Setelah bot perayap mengunjungi sebuah laman web, sistem Google akan mencoba menampilkan kontennya sebagaimana yang dilihat oleh pengunjungnya.
Kemudian, sistem pengindeksan akan mencatat setiap sinyal-sinyal utama – mulai dari kata kunci (keyword) hingga kebaruan konten (freshness) – dan menyimpan catatan tersebut ke dalam Indeks Pencarian Google.
Google Search Index memuat data laman web dalam jumlah yang tak terhitung, dengan ukuran data lebih dari 100 juta gigabita.
Mirip seperti indeks di bagian belakang sebuah buku yang memuat kata-kata penting yang ada di tiap-tiap halaman, Google mengindeks seluruh laman web yang ada di internet berdasarkan kata, frasa, dan kalimat yang ada dalam kontennya.
Dengan Knowledge Graph, Google memperdalam sistem pengindeksan lebih dari sekedar pencocokan kata kunci saja.
Demi meningkatkan relevansi hasil pencarian, Google juga mengindeks identitas tokoh, lembaga, lokasi, maupun entitas nyata lainnya.
Saat ini, Google Search mampu membantu kita menemukan:
- Teks yang termuat dalam jutaan buku di sejumlah perpustakaan besar dunia.
- Jadwal perjalanan dari agen transportasi publik lokal.
- Data dari sumber-sumber yang bisa diakses oleh publik, misalnya Data Terbuka Bank Dunia.
Penerapan Algoritma Pencarian
Ketika mengetikkan kata kunci di formulir pencarian – atau mengucapkan pertanyaan pada “Ok Google“, kita tentu mengharapkan jawaban yang paling relevan, bukan sekedar daftar laman web yang memuat kata kunci tersebut.
Untuk memenuhi harapan penggunanya, Google menerapkan sistem ranking atas setiap laman web yang tersimpan dalam Indeks Pencarian.
Sistem peringkat ini tersusun dari serangkaian (sangat panjang) algoritma yang berfungsi untuk menganalisis pertanyaan kita dan menentukan jawaban yang paling sesuai dalam waktu sepersekian detik saja.
Search algorithm tersebut terus menerus diperbaiki dan diperbarui demi mewujudkan pengalaman terbaik bagi penggunanya.
Berikut ini adalah sejumlah proses yang dijalankan oleh Algoritma Pencarian Google untuk menampilkan hasil pencarian terbaik:
Menganalisis kata, frasa, atau kalimat kita
Pemahaman atas makna pertanyaan sangat krusial dalam menentukan jawaban yang tepat.
Maka, proses pertama yang dilakukan dalam algoritma pencarian adalah menganalisis arti dari setiap kata, frasa, dan kalimat yang diajukan oleh pengguna.
Google membangun sejumlah model struktur bahasa untuk mengurai makna kalimat dan menyesuaikannya dengan data indeks.
Proses ini melibatkan beberapa langkah yang seolah sangat sederhana, semisal menentukan kekeliruan ejaan.
Selanjutnya, algoritma akan mencoba memahami jenis pertanyaan kita dengan menerapkan serangkaian hasil riset mengenai pemahaman bahasa alamiah (natural language).
Ilustrasi berikut ini menampilkan sistem pengenalan sinonim terhadap kata yang memiliki berbagai makna. Sebuah sistem yang mencakup identifikasi sinonim dalam berbagai bahasa, dan diklaim mampu meningkatkan kualitas pencarian hingga sebesar 30%.
Selain itu, Google juga mencoba memahami kategori informasi yang diharapkan oleh penggunanya:
- Apakah pencarian tersebut cukup spesifik atau masih sangat luas?
- Adakah kata-kata kunci tertentu seperti “ulasan” atau “gambar” atau “jam buka” yang mengindikasikan informasi spesifik?
- Apakah pengguna menggunakan kata kunci yang sedang tren pada saat itu?
Mencocokkan hasil analisis dengan indeks
Berikutnya, Google akan mencari laman-laman web yang memuat informasi sesuai pertanyaan pengguna.
Saat kita melakukan pencarian, algoritma Google mencari istilah yang cocok dengan kata kunci kita di dalam indeks laman web.
Algoritma ini menentukan frekuensi dan lokasi kata kunci dalam setiap laman web, baik pada judul, subjudul, maupun tubuh teks.
Selain mencocokkan kata kunci, algoritma pencarian juga mencoba menemukan berbagai petunjuk untuk mengukur seberapa besar potensi relevansi suatu laman web atas pertanyaan pengguna.
Misalnya, saat kita mencari dengan kata kunci “sepeda”, kemungkinan kita tidak mengharapkan laman web yang memuat kata “sepeda” terlalu sering.
Google mencoba untuk menentukan apakah sebuah laman web memuat jawaban atas pertanyaan kita, dan bukan sekedar menjejalkan kata kunci secara berlebihan di dalamnya (baca tentang penjejalan kata kunci).
Maka, algoritma pencarian menganalisis apakah sebuah laman web memiliki konten yang berguna untuk kita, misalnya memuat gambar sepeda, video sepeda, atau daftar tipe sepeda.
Selanjutnya, search algorithm akan memeriksa apakah konten dalam laman web tersebut dituliskan dalam bahasa yang sama dengan kata kunci kita.
Dengan demikian maka peringkat hasil pencarian tertinggi akan diurutkan sesuai dengan relevansi, mutu (value), dan bahasa yang digunakan dalam sebuah laman web.
Menentukan ranking laman web
Untuk setiap kueri pencarian, terdapat ribuan, bahkan jutaan laman web dengan potensi konten yang relevan.
Demi menentukan laman dengan konten terbaik, Google membangun sebuah algoritma guna mengevaluasi seberapa bernilai sebuah laman bagi para pengunjungnya.
Algoritma ini menganalisis ratusan faktor yang menentukan seberapa bagus kualitas laman web. Mulai dari kebaruan konten, frekuensi penggunaan kata kunci dalam teks, hingga seberapa baik user experience yang disajikan.
Untuk menentukan faktualitas dan otoritas konten yang disajikannya, Google memilih website yang dianggap berguna oleh para pengunjungnya berdasarkan kueri pencarian lainnya yang mirip.
Jika ada website lain yang memiliki otoritas dalam topik tertentu memuat tautan ke suatu laman web, ini merupakan penanda bahwa informasi yang disajikannya cukup berkualitas.
Terdapat banyak sekali website dengan konten tak bermutu (spammy) yang berusaha untuk mencuri tempat di laman hasil pencarian.
Para pemilik website sampah semacam ini menjalankan taktik curang dengan menggunakan penjejalan kata kunci (keyword stuffing) atau membeli tautan guna meningkatkan PageRank.
Situs web mereka menyajikan pengalaman pengguna yang buruk dan bahkan tak jarang merugikan atau memberikan informasi yang menyesatkan pada para pengunjungnya.
Untuk mengatasi masalah tersebut, Google menyusun algoritma untuk mengidentifikasi spam dan menghapus situs web sampah dari indeks pencarian.
Baca selengkapnya tentang hal-hal Yang Harus Dihindari oleh webmaster.
Mempertimbangkan konteks pencarian
Informasi seperti lokasi pengguna, riwayat penelusuran, dan Setelan Penelusuran membantu Google untuk menyajikan hasil yang paling berguna dan relevan pada saat itu.
Google menggunakan negara dan lokasi pengguna untuk menyajikan konten yang sesuai dengan wilayahnya.
Sebagai contoh, kita berada di Indonesia dan kita mengetikkan kueri “presiden”, kemungkinan besar hasil yang disajikan adalah mengenai Presiden Republik Indonesia saat ini.
Sebaliknya, bagi orang yang berada di negara lain, kueri pencarian serupa akan menghasilkan laman web mengenai presiden di negara tersebut.
Selain lokasi, Setelan Penelusuran juga menjadi indikator penting dalam menentukan hasil yang bermanfaat bagi masing-masing pengguna.
Misalnya, jika kita memilih pengaturan SafeSearch untuk menyaring konten eksplisit atau vulgar.
Pada situasi tertentu, Google juga menerapkan personalisasi hasil pencarian menggunakan riwayat penelusuran kita.
Misalnya, kita yang berada di Indonesia dan beberapa waktu yang lalu mencari website “majalah Tempo”. Jika kita mengetikkan kueri “tempo”, maka diperkirakan bahwa kita mengharapkan informasi mengenai majalah tersebut, dan bukan mengenai definisi kata terkait.
Kita bisa menentukan aktivitas pencarian mana saja yang bisa digunakan Google untuk memperbaiki hasil pencarian, termasuk mengatur data apa saja yang tersimpan dalam akun Google kita melalui laman Akun Saya.
Menyajikan hasil pencarian terbaik
Sebelum menyajikan hasil pencarian kita, Google mengevaluasi kesesuaian dari pelbagai informasi yang tersedia:
- Adakah suatu topik yang menonjol di antara hasil pencarian?
- Apakah terlalu banyak laman web yang isi kontennya terlalu mirip satu sama lain?
Google berupaya untuk menyajikan informasi yang bervariasi dalam format yang paling berguna bagi tipe pencarian kita.
Dan, seiring perkembangan dunia internet, sistem ranking yang diterapkan juga selalu diperbarui demi menyajikan hasil pencarian terbaik.
Penyajian Hasil Pencarian
Larry Page pernah membayangkan sebuah mesin pencari sempurna yang memahami dengan tepat apa yang kita inginkan dan menyajikan hasil yang akurat.
Dari waktu ke waktu, rangkaian pengujian yang dilakukan oleh Google menunjukkan bahwa para pengguna menginginkan jawaban cepat atas pertanyaan mereka.
Untuk memenuhinya, Google terus menerus menerapkan perbaikan demi memberikan hasil pencarian paling relevan, dalam waktu yang lebih singkat, dengan format yang paling sesuai dengan kebutuhan penggunanya.
Jika kita mencari informasi soal cuaca, kemungkinan besar kita mengharapkan tampilan prekiraan cuaca sebagai hasil pencarian, bukan sekedar daftar link ke website prakiraan cuaca.
Jika kita mencari “arah ke bandara adisucipto”, maka kita mungkin lebih butuh peta daripada situs petunjuk arah.
Hal-hal semacam ini terutama penting bagi pengguna perangkat mobile (ponsel dan tablet) dengan bandwidth yang terbatas dan butuh kepraktisan.
Ribuan teknisi dan ilmuwan senantiasa bekerja keras demi memperbaiki algoritma Google dan mewujudkan metode-metode pencarian baru.
Berikut ini adalah beberapa inovasi penyajian hasil pencarian yang telah diterapkan oleh Google sampai saat ini:
Jawaban dari Knowledge Graph
Pada tahun 2012, Google meluncurkan Knowledge Graph, sebuah basis data raksasa uang memuat lebih dari satu triliun data tokoh, tempat, dan berbagai entitas nyata lainnya. Data tersebut memuat lebih dari 50 triliun fakta dan koneksi antar entitas.
Singkatnya, Knowledge Graph dibangun untuk menyajikan hubungan antara satu entitas nyata dengan entitas lainnya.
Kita bisa memperoleh jawaban cepat atas pertanyaan seperti:
- di mana letak borobudur
- kapan borobudur dibangun
- apa saja objek wisata di dekat borobudur
- siapa pencipta lagu garuda pancasila
- 1 dolar berapa rupiah
Knowledge Graph akan menyajikan format jawaban yang paling sesuai dengan pertanyaan kita mengenai berbagai entitas nyata di dunia.
Petunjuk arah dan kondisi lalu lintas
Cukup jelas bahwa setiap kali kita mencari alamat di Google, misalnya “jalan rotowijayan no 1”, kita lebih mengharapkan peta atau petunjuk arah daripada link ke website yang menyebutkan nama jalan tersebut.
Kita lebih butuh informasi mengenai letaknya, jaraknya dari lokasi kita, dan bagaimana caranya untuk menuju ke sana.
Maka, Google membangun peta digital yang bisa diklik, digeser, di-zoom, dsb untuk memudahkan penjelajahan lokasi.
Jawaban langsung
Acapkali kita membutuhkan jawaban langsung yang singkat dan jelas untuk pertanyaan tertentu.
Google bekerjasama dengan sejumlah perusahaan yang mampu memberikan informasi dan layanan yang kita butuhkan, yang mengizinkan konten mereka untuk ditampilkan sebagai jawaban langsung di hasil pencarian.
Contoh jawaban langsung di Google search result misalnya cuaca dan skor pertandingan olahraga.
Cuplikan Unggulan – Featured snippets
Saat kita mengajukan sebuah pertanyaan spesifik, Google berusaha untuk menjawab secara cepat dan singkat melalui cuplikan unggulan.
Cuplikan (snippet) ini dihasilkan dari konten website yang dianggap relevan dengan pertanyaan kita, dan memuat kutipan konten, link, judul, dan URL laman web.
Contoh cuplikan unggulan bisa kita lihat dengan mengetikkan kueri: “keterampilan hidup“.
Daftar ragam – Rich lists
Jawaban yang paling sesuai dengan pertanyaan kita tak melulu berupa entitas tunggal. Tak jarang kita lebih membutuhkan sebuah daftar atau kategorisasi tokoh, film, musik, buku, lokasi, dan lain sebagainya.
Saat kita mengajukan kueri “film garin” atau “buku pramoedya“, Google akan menampilkan korsel atau galeri koleksi bergambar dari film-film karya Garin Nugroho atau buku-buku karya Pramoedya Ananta Toer.
Korsel daftar ragam ini dibangun dengan mempertimbangkan berbagai sumber referensi yang ada di internet, juga hasil kerja dari para kurator konten.
Menjawab sebelum kita bertanya
Di era mobile ini, para pengguna internet membutuhkan akses informasi semudah dan secepat menjentikkan jarinya.
Google Quick Search Box untuk Android atau iOS yang ada di ponsel dan tablet kita menyajikan sejumlah pintasan (shortcuts) yang memberikan akses atas informasi penting tanpa harus membuka browser terlebih dahulu.
Aplikasi ini menampilkan informasi terbaru seputar olahraga, restoran, hiburan, dan cuaca di beranda ponsel kita tanpa menunggu kueri pencarian.
Perubahan seiring perkembangan teknologi internet
Dunia web terus menerus bertumbuh dengan ratusan website baru setiap detik dan jutaan artikel baru setiap hari – lihat statistik internet.
Kecepatan pertumbuhan itu tercermin pada hasil pencarian Google dengan kinerja bot perayap dan pengindeksan tanpa henti.
Pengindeksan untuk masing-masing kueri memiliki kecepatan perubahan yang tak sama. Misalnya, indeks untuk pencarian skor pertandingan olahraga yang selalu update setiap saat, berbeda dibandingkan dengan indeks tokoh sejarah yang cenderung statis.
Saat ini, diperkirakan Google menangani hingga belasan miliar kueri pencarian per hari (lihat data pencarian per tahun). Dari keseluruhan angka tersebut, sebanyak 15% merupakan kueri baru yang belum pernah tercatat sebelumnya.
Dengan fakta-fakta mencengangkan tersebut, Google mempekerjakan tim ilmuwan dan programmer terbaik demi mengejar mimpi mewujudkan sebuah mesin pencari yang sempurna bagi penggunanya.
Demikian uraian ringkas mengenai bagaimana Google menentukan hasil pencarian.
Setelah membaca dan memahami cara kerja Google Search, semoga kamu memperoleh inspirasi untuk menyusun strategi SEO yang tepat dan sesuai dengan “selera” mereka.
Baca artikel lainnya di Arsip Esai SEO Topi Putih.
Kredit: semua gambar adalah hak cipta Google Inc.