Como funciona o sistema de busca do Google

Como funciona o sistema de busca do Google

Você sabe como funciona o sistema de busca do mais famoso do mundo?

Para uma consulta típica, existem milhares, até bilhões, de páginas da web com informações potencialmente relevantes.

Então, como o Google descobre o que mostrar nos resultados da pesquisa? Bem, a viagem começa antes mesmo de digitar sua pesquisa ..

O Google é o sistema de buscas mais utilizado no mundo, pois foi o primeiro a organizar a informação mundial armazenada na internet e torná-la universalmente acessível e útil. O resultado da pesquisa feita pelo usuário é instantâneo, porém, o processo por trás da exibição dos resultados é extremamente minucioso e complexo. Entenda como funciona o mecanismo de busca do Google e melhore a sua experiência com o buscador.

Como a Pesquisa organiza informações

Antes de pesquisar, os rastreadores da web coletam informações em centenas de bilhões de páginas da web e organizam-no no índice de pesquisa.

Os fundamentos da pesquisa

Encontrando informações rastreando

A web é como uma biblioteca cada vez maior com bilhões de livros e nenhum sistema central de arquivamento. Nós usamos o software conhecido como web crawlers para descobrir páginas publicamente disponíveis. Os rastreadores olham para páginas da web e seguem links nessas páginas, bem como você faria se estivesse navegando conteúdo na web. Eles vão do link para o link e trazem os dados sobre essas páginas para os servidores do Google.

O processo de rastreamento começa com uma lista de endereços da web de rastreamentos passados ​​e sitemaps fornecidos pelos proprietários do site. À medida que nossos rastreadores visitam esses sites, eles usam links nesses sites para descobrir outras páginas. O software presta atenção especial a novos sites, mudanças em sites existentes e links mortos. Os programas de computador determinam quais sites rastrear, com que frequência e quantas páginas devem ser obtidas em cada site.

Nós oferecemos ferramentas para webmasters para dar os proprietários do site opções granulares sobre como o Google rastreia o seu site: eles podem fornecer instruções detalhadas sobre como processar páginas em seus sites, pode solicitar um novo rastreamento ou pode optar por sair de rastejar por completo usando um arquivo chamado “ robots.txt “. O Google nunca aceita pagamentos para rastrear um site com mais freqüência – nós fornecemos as mesmas ferramentas para todos os sites para garantir os melhores resultados possíveis para nossos usuários.

Organizando informações por indexação

Quando os rastreadores encontrarem uma página da web, nossos sistemas processam o conteúdo da página, assim como o faz um navegador. Tomamos nota de sinais-chave – a partir de palavras-chave para frescura website – e manter o controle de tudo isso no índice de pesquisa.

O índice de Pesquisa do Google contém centenas de bilhões de páginas da Web e tem mais de 100 milhões de gigabytes de tamanho. É como o índice na parte de trás de um livro – com uma entrada para cada palavra vista em cada página da web que indexamos. Quando indexamos uma página da Web, a adicionamos às entradas para todas as palavras que ela contém.

Com o Knowledge Graph, continuamos a ir além da correspondência de palavras-chave para entender melhor as pessoas, os lugares e as coisas que você gosta. Para fazer isso, não apenas organizamos informações sobre páginas da web, mas também outros tipos de informações. Hoje, a Pesquisa do Google pode ajudá-lo a pesquisar texto de milhões de livros das principais bibliotecas , encontrar horários de viagem de sua agência de transporte público local ou ajudá-lo a navegar dados de fontes públicas como o Banco Mundial .

Os “robôs de busca” do Google fazem o trabalho

Quando o usuário digita um termo de pesquisa no Google, denominados palavras-chave, os servidores do buscador iniciam um processo de rastreamento e indexação dos resultados em seu índice. Esse rastreamento é feito nas mais de 30 trilhões de pages armazenadas na web que tenham relação com o termo digitado.

Ao realizar esse rastreamento, os “robôs de busca” do Google examinam criteriosamente todas as páginas que tenham algum assunto relacionado com a pesquisa, são centenas de milhares de resultado, mas, o buscador faz uma série de análises nestas páginas para ter a certeza de que o resultado apresentado será realmente útil para o que o usuário deseja.

Como funcionam os algoritmos de pesquisa

omo funcionam os algoritmos de pesquisa

Você quer a resposta, não bilhões de páginas da web, então Google ranking sistemas classificar através das centenas de bilhões de páginas da web em nosso índice de pesquisa para lhe dar resultados úteis e relevantes em uma fração de segundo.

Esses sistemas de classificação são constituídos por uma série de algoritmos que analisam o que você está procurando e quais informações retornar para você. E à medida que evoluímos para torná-lo mais útil, refinamos nossos algoritmos para avaliar suas pesquisas e os resultados em detalhes para que nossos serviços funcionem melhor para você.

Aqui estão algumas das maneiras pelas quais o Google usa algoritmos de pesquisa para retornar informações úteis da web:

  • Analisando suas palavras

    Compreender o significado de sua pesquisa é crucial para retornar boas respostas. Então, para encontrar páginas com informações relevantes, o nosso primeiro passo é analisar o que significam as palavras em sua consulta de pesquisa. Construímos modelos de linguagem para tentar decifrar quais seqüências de palavras devemos procurar no índice.

    Isso envolve etapas tão simples como interpretar erros de ortografia e se estende a tentar entender o tipo de consulta que você inseriu aplicando algumas das últimas pesquisas sobre compreensão da linguagem natural. Por exemplo, nosso sistema de sinônimos ajuda a Pesquisar o que você quer dizer, mesmo que uma palavra tenha várias definições. Este sistema levou mais de cinco anos para desenvolver e melhorar significativamente os resultados em mais de 30% das pesquisas em diferentes idiomas.

    Nós também tentamos entender qual categoria de informações você está procurando. É uma pesquisa muito específica ou uma consulta ampla? Há palavras como “revisão” ou “fotos” ou “horário de funcionamento” que indicam uma necessidade de informação específica por trás da pesquisa? Você está procurando palavras-chave de tendências que implicam que você deseja conteúdo publicado naquele dia? Ou você está procurando um negócio nas proximidades e quer informações locais?

    Correspondência da sua pesquisa

    Em seguida, procuramos páginas da web com informações que correspondam à sua consulta. Quando você procura, no nível mais básico, nossos algoritmos pesquisam seus termos de pesquisa no índice para encontrar as páginas apropriadas. Eles analisam a frequência e onde essas palavras-chave aparecem em uma página, seja em títulos ou títulos ou no corpo do texto.

    Além de palavras-chave correspondentes, os algoritmos procuram pistas para medir o quão bem os resultados de pesquisa potenciais dão aos usuários o que eles estão procurando. Quando você procura “cachorros”, você provavelmente não quer uma página com a palavra “cachorros” nele centenas de vezes. Tentamos descobrir se a página contém uma resposta à sua consulta e não apenas repete sua consulta. Portanto, os algoritmos de Pesquisa analisam se as páginas incluem conteúdo relevante – como fotos de cães, vídeos ou até mesmo uma lista de raças. Finalmente, verificamos se a página está escrita no mesmo idioma que a sua pergunta para priorizar páginas no seu idioma preferido.

    Classificação de páginas úteis

    Para uma consulta típica, existem milhares, até milhões, de páginas da web com informações potencialmente relevantes. Então, para ajudar a classificar as melhores páginas primeiro, também escrevemos algoritmos para avaliar a utilidade dessas páginas.

    Esses algoritmos analisam centenas de fatores diferentes para tentar superar as melhores informações oferecidas pela web, desde o frescor do conteúdo, até o número de vezes que seus termos de pesquisa aparecem e se a página possui uma boa experiência de usuário. Para avaliar confiabilidade e autoridade sobre o assunto, buscamos sites que muitos usuários parecem valer para consultas semelhantes. Se outros sites proeminentes sobre o assunto link para a página, isso é um bom sinal, a informação é de alta qualidade.

    Existem muitos sites spam na web que tentam jogar o caminho para o topo dos resultados de pesquisa através de técnicas como repetir palavras-chave repetidamente ou comprar links que passam PageRank. Esses sites oferecem uma experiência de usuário muito fraca e podem mesmo prejudicar ou enganar os usuários do Google. Então, escrevemos algoritmos para identificar spam e remover sites que violam as diretrizes do Google para webmasters de nossos resultados .

    Considerando o contexto

    Informações como a sua localização, histórico de pesquisa passado e Configurações de pesquisa ajudam a adaptar seus resultados ao que é mais útil e relevante para você nesse momento.

    Usamos seu país e local para entregar o conteúdo relevante para sua área. Por exemplo, se você estiver em Chicago e você procura “futebol”, o Google provavelmente mostrará resultados sobre o futebol americano e os Chicago Bears primeiro. Considerando que se você pesquisar “futebol” em Londres, o Google classificará os resultados sobre futebol e a Premier League maior. Definições de pesquisa também são um importante indicador de que resulta é provável que você achar útil, como se você definir um idioma preferido ou optado por SafeSearch (uma ferramenta que ajuda a filtrar resultados explícitos).

    Em alguns casos, podemos também personalizar seus resultados usando informações sobre sua atividade de Pesquisa recente. Por exemplo, se você procura por “Barcelona” e procurou recentemente “Barcelona vs Arsenal”, isso poderia ser uma pista importante de que você deseja informações sobre o clube de futebol e não a cidade. Você pode controlar o que a atividade de pesquisa é usada para melhorar sua experiência de Pesquisa, incluindo o ajuste de quais dados são salvos em sua Conta do Google, em myaccount.google.com .

    Retornando os melhores resultados

    Antes de atender aos seus resultados, avaliamos como todas as informações relevantes se encaixam: só existe um tópico entre os resultados da pesquisa ou muitos? Existem muitas páginas focadas em uma interpretação restrita? Nós nos esforçamos para fornecer um conjunto diverso de informações em formatos que são mais úteis para seu tipo de pesquisa. E à medida que a web evolui, desenvolvemos nossos sistemas de classificação para oferecer melhores resultados para mais consultas.

    Larry Page descreveu uma vez o motor de busca perfeito, entendendo exatamente o que você quer dizer e devolvendo exatamente o que você deseja. Ao longo do tempo, nossos testes mostraram consistentemente que os usuários querem respostas rápidas às suas consultas. Nós fizemos muitos progressos em fornecer as respostas mais relevantes, mais rápidas e em formatos que são mais úteis para o tipo de informação que você está procurando.

    Se você está procurando o clima, você provavelmente quer a previsão do tempo na página de resultados, e não apenas links para sites meteorológicos. Ou instruções: se a sua consulta for “Direções para o aeroporto de São Francisco”, você quer um mapa com instruções, e não apenas links para outros sites. Isto é especialmente importante em dispositivos móveis onde a largura de banda é limitada e o clique entre sites pode ser lento.

    Milhares de engenheiros e cientistas estão trabalhando no trabalho refinando nossos algoritmos e criando novas maneiras úteis de pesquisar. Você pode encontrar algumas das nossas inovações de Pesquisa abaixo. Com algumas melhorias de 1600 para a Pesquisa do Google em 2016, estas são apenas uma amostra de algumas das maneiras como fazemos pesquisar melhor e melhor ao longo do tempo.

    Esperamos que esse artigo tenha contribuindo para a sua formação no intendimento de como funciona o motor de busca do Google.

    fonte: https://www.google.com/search/howsearchworks/

 

 

Se quiser Saber tudo sobre esse assunto leia nossa matéria completa no site da DataCenterBr é super simples, basta clicar

Sobre o Autor:
Arthur Queiroz Arthur Queiroz
Arthur Queiroz é CEO da DataCenterBr, bem como Especialista Sênior em Redes e Marketing Digital | Arthur é formado em Publicidade e desenvolvedor do Curso Ponto Matriz de Marketing para empresas | Arthur também é redator chefe e CEO do Blog e Canal do Youtube One Nerd.
Enviar Mensagem!
1
Ei me manda uma mensagem :D
Olá!!! 👋
posso te ajudar ?
Me manda uma mensagem no WhatsApp :D