Pesquise de forma esperta com «vacilação Google»

Por Gabi Sobliye

https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/il/Google-dorking-cik-illustration.png


Resumindo: Uma introdução às técnicas de pesquisas avançadas na Internet usando a técnica «Vacilação no Google» (em inglês, Google Dorking), como elas funcionam em diferentes buscadores, e como você pode usar estas técnicas em suas investigações. Lembre-se das dicas sobre como proteger sua privacidade enquanto pesquisa e proteja suas informações pessoais daqueles que podem usar este técnica para fins maliciosos.


Por favor, note que a maioria dos hiperlinks apontam para sites e recursos em inglês.

Ao investigar, muitas vezes você precisa reunir o máximo de informações possíveis sobre um tema. Técnicas de pesquisa avançada podem ajudar a descobrir arquivos ou pistas relevantes para as perguntas que você está tentando responder. Por exemplo, você pode encontrar as declarações fiscais de uma empresa ou um relatório de gastos do governo local, informações que podem não aparecer em nos sites destas entidades ou não aparecem quando você faz uma pesquisa normal na web.

Vacilo ou Vacilação no Google (do inglês Google Dorking, também conhecido como Google hacking) é uma técnica usada por redações, organizações de jornalismo investigativo, auditores de segurança e criminosos experientes em tecnologia para consultar os buscadores, a fim de encontrar informações que possam estar disponíveis em sites públicos ou para identificar evidência de vulnerabilidades de segurança digital. Esta técnica pode ser usada na maioria dos buscadores, não apenas no Google, por isso normalmente nos referimos a ele simplesmente como vacilação (em inglês dorking).

O «vacilo» envolve o uso de buscadores em todo o seu potencial para descobrir resultados que não são visíveis com uma pesquisa regular. Ele permite que você refine suas buscas e mergulhe mais fundo, e com maior precisão, em páginas da web e documentos que estão disponíveis online. Descobrir arquivos escondidos e falhas de segurança por vacilação não requer muito conhecimento técnico. Realmente se resume a aprender apenas algumas pesquisas técnicas e usá-las em vários buscadores.

Tudo o que você precisa para realizar um vacilação é um computador, uma conexão de Internet e uma compreensão básica da sintaxe de pesquisa apropriada: palavras-chave e símbolos – às vezes chamados de «operadores», «filtros» ou bang (em inglês) – que você pode usar para refinar seus resultados de pesquisa. Para fazê-lo de forma eficaz, no entanto, você também pode precisar de persistência, criatividade, paciência e sorte.

Uma breve história da vacilação

A vacilação no Google foi documentada ao menos desde início dos anos 2000. Como muitos outros hacks, a vacilação não é tecnicamente sofisticada. Simplesmente requer uma pequena quantidade de conhecimento um tanto obscuro e alguma criatividade.

Johnny Long, também conhecido como j0hnnyhax, foi um pioneiro da vacilação. Ele postou pela primeira vez sua bem humorada definição do recém-criado termo, googleDork, em 2002. Desde então, seu significado evoluiu para incluir outros usos.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-googledork.jpg A definição de Johnny Long de googleDork em 2002

Uma pesquisa normal em buscadores depende de uma maneira semântica de solicitar informações - seja digitando uma pergunta inteira (»O que é vacilando no Google?», ou «O que é vacilando no Google?) ou selecionando palavras-chave importantes (»significado de Google Hacking»).

Um vacilo ou uma vacilação é um refinamento dessa consulta, combinando elementos técnicos e semânticos, a fim de aproveitar ao máximo o fato de que o conteúdo da web está sendo constantemente digitalizado e indexado por máquinas.

Em uma entrevista de 2011, JohnnyLong disse:

«Nos anos que passei como hacker profissional, aprendi que a abordagem mais simples geralmente é a melhor. Como hackers, tendemos a complicar, concentrando-se na tecnologia, sem perceber que pode haver métodos não-técnicos à nossa disposição que funcionam tão bem ou melhor do que suas contrapartes de alta tecnologia. Eu sempre fiquei de olho nas soluções simples para desafios complexos.»

Vacilar ou não vacilar

Ao liberar todo o poder dos buscadores, a vacilação pode expor informações sobre sites, bem como vulnerabilidades dentro deles. Isto pode incluir informações que deveriam ficar em um pasta protegida por senha, mas acabou em outro lugar. Ou, pode incluir um script de configuração para um sistema de gerenciamento de conteúdo (CMS) que ainda tem capacidade para desempenhar funções administrativas como adicionar usuários e alterar senhas.

A vacilação pode fortalecer suas investigações e expandir seu acesso a informação que é de interesse público mas que, seja intencional ou por acidente, não está inicialmente disponível através de buscadores. Pode também ajudá-lo a encontrar falhas de segurança digital em seus próprios serviços online e plataformas de publicação.


Nota:

Com grande acesso à informação, vem uma grande responsabilidade ética. Embora você possa usar essas técnicas de uma maneira responsável para expandir suas investigações, outros podem usá-las para obter dados pessoais ou explorar vulnerabilidades. Como costuma acontecer, as intenções são importantes.


Segurança em primeiro lugar!

Se você está pensando em usar o Vacilo Google como uma técnica investigativa, há várias precauções a serem tomadas antes de começar.

a vacilação Google exige conscientização sobre as questões legais que envolvem o acesso a páginas e arquivos, mesmo que sejam em um servidor de acesso público. Embora na maioria dos casos você esteja livre para pesquisar em nos buscadores, acessar determinadas páginas da web ou baixando arquivos a partir deles pode, em algumas circunstâncias, ser um ato que dá margem a processos, especialmente nos Estados Unidos, de acordo com o vago e ultrapassando Computer Fraud and Abuse Act (CFAA) (Lei de Fraude e Abuso de Computador). Além disso, como as consultas de pesquisa são monitoradas e armazenadas indefinidamente por provedores de busca e até governos, é possível que suas buscas poderiam ser registrados, identificadas como suas e até mesmo usadas contra você no futuro.

Para protegê-lo em sua pesquisa, recomendamos usar o Navegador Tor N ou Tails (um sistema operacional que roteia todo o tráfego da Internet através da rede de anonimato Tor) quando utilizar vacilação em qualquer buscador. Tor mascara seu tráfego de internet, separando as informações de identificação do seu computador das páginas da web que você está acessando.

O Site Security-in-a-Box, da Tactical Tech, inclui guias detalhados sobre como visitar sites bloqueados e navegar anonimamente usando o navegador Tor e VPNs, entre outros.

Embora o navegador Tor tenha se tornado mais fácil de usar ao longo dos anos, ele pode às vezes tornar suas buscas mais difíceis. Google e outras buscadores podem pedir para você resolver CAPTCHAs para provar que você é humano. O Tor se conecta ao site que você deseja acessar por meio de uma série de servidores se comunicando em seu nome e formando o que é chamado de Tor circuito. O último servidor a processar sua solicitação e se conectar ao site que você deseja é chamado de nó de saída do Tor. Se muitos programas automatizados (ou bots) estiveem usando o mesmo nó de saída, isso pode fazer os buscadores suspeitarem de suas atividades, mesmo quando não é você quem está executando o sistema automatizado. Nesses casos, os buscadores podem bloquear suas pesquisas inteiramente. Se isto acontecer, você pode tentar mudar seu circuito Tor até conecte-se a um nó de saída que não esteja na lista de bloqueio. Então, clique no ícone de informações do site (»ⓘ») no lado esquerdo do barra de endereços e selecione «Novo circuito para este site», conforme mostrado abaixo.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-New-Circuit.png *Captura de tela de como solicitar um novo circuito no navegador Tor *

Observe que, dependendo do país em que você está, o uso do Tor pode sinalizar sua atividade online como suspeita. A menos que você seja especificamente alvo de um ataque avançado, o navegador Tor é bastante eficaz em impedir a associação de sua identidade online com os sites que você visita ou os termos de pesquisa que você digita, mas o Tor não esconde o fato de que você está usando o Tor.

Este é um risco que você deve estar disposto a correr ao usá-lo, embora você pode atenuar esse risco até certo ponto, configurando o navegador Tor para usar uma Ponte com o transporte conectável «obfs4». Usar uma ponte tenta esconder o fato de que você está se conectando a um Tor servidor, e usando «obfs4» tenta fazer essa conexão parecer algo diferente do tráfego do Tor.

Se você não pode usar o Tor, outra opção, embora menos eficaz em preservar seu anonimato, seria usar um VPN (Rede Privada Virtual).

VPNs funcionam disfarçando seu endereço IP, que pode ser usado por sites que você visita para mapear de onde você está vindo. Ao usar uma VPN, ao invés de ver seu endereço IP real, os sites que você visita verão o IP do seu provedor de VPN.

Existem muitas opções de VPN e pode ser confuso decidir qual escolher. Para aumentar a confusão, a maioria das avaliações e listagens de VPN não são independentes, e algumas são realmente tendenciosos. Safety Detectives é um site de revisão de VPN que você pode verificar, entre muitos outros. Verifique também este guia (mais antigo, mas ainda relevante) sobre como escolher uma VPN do «That One Privacy Site» (este site não está mais sendo atualizado). Recomenda-se que você escolha uma empresa de VPN que afirme não guardar registro de seu tráfego. Embora a maioria das VPNs gratuitas deva ser evitada porque eles geralmente financiam suas operações vendendo seus dados de log (registros de quais sites os usuários visitam via VPN), existem alguns respeitáveis que podemos endossar, como:

Você também pode usar um buscador amigável à privacidade, como DuckDuckGo que suporta algumas das técnicas de pesquisa avançada abordadas abaixo.

Se você decidir prosseguir com uma investigação que envolva o Vacilo Google, os métodos a seguir irão ajudá-lo a começar e fornecem uma comparação de técnicas suportadas, em março de 2019, em vários buscadores.

Como funciona a vacilação

https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/il/Google-dorking_Breakdown_01-cik-illustration.png

No uso diário, buscadores como Google, Bing, DuckDuckGo e Yahoo aceita um termo de pesquisa (uma palavra) ou uma sequência de termos de pesquisa e retorna resultados correspondentes. Mas a maioria dos buscadores está programada para aceitar «filtros» avançados ou «operadores de prefixo» também. O filtro é uma palavra-chave ou frase que tem um significado particular para a pesquisa no buscador. Isso inclui termos como:

  • inurl:

  • intext:

  • site:

  • feed:

  • language:


Observação:

Cada palavra-chave de filtro termina com dois pontos (:) e é seguida pelo(s) termo(s) de pesquisa relevante(s) - sem espaço antes ou depois dos dois pontos! Mostraremos alguns exemplos a seguir.

Se você chama isso de algo pretensioso (como «sintaxe de consulta do buscador avançado») ou algo bobo, um vacilo é apenas uma pesquisa que se baseie nessas e em outras palavras-chave especiais para obter resultados mais significativos. Esses resultados podem incluir linhas de texto de texto no corpo de um site, por exemplo, ou arquivos hospedados em um endereço da web específico.

Nem todas as técnicas de pesquisa «avançadas» dependem de filtros de prefixo como esses mostrados acima. Acrescentando aspas (»farmácias 24 horas em Curitiba», por exemplo) informa a maioria dos buscadores para encontrar uma frase. Colocar um OR (OU em inglês) em letras maiúsculas entre os termos de pesquisa (como farmácias OR drogarias em Curitiba) diz ao buscador para retornar resultados com qualquer termo.

O seguinte é um exemplo simples de um vacilo que depende de um operador de prefixo. vai procurar PDF indexados hospedados no domínio https://tacticaltech.org

site:tacticaltech.org filetype:pdf

Outro exemplo, que retorna todos os sites sob o domínio tacticaltech.org que têm a palavra «invisible» em seus títulos, seria assim:

site:tacticaltech.org intitle:invisible

Se precisar usar um termo de pesquisa que contenha várias palavras, você pode colocá-las entre aspas:

site:tacticaltech.org intext:exposing intitle:"the invisible"

Vacilos também podem ser combinados com um termo de pesquisa geral. Por exemplo:

expondo site:tacticaltech.org, ou

exposing site:tacticaltech.org, ou

expondo site:tacticaltech.org filetype:pdf, ou exposing site:tacticaltech.org filetype:pdf

Aqui, “expondo” é o termo de pesquisa geral e os filtros site: e filetype: restringem os resultados.

Resultados de pesquisa de exemplo são mostrados abaixo.

imagem de tela do Google mostrando resultados para a busca site:tacticaltech.org filetype:pdf Exemplo de busca de pdf em TacticalTech.org no Google

Uma pesquisa semelhante em um domínio diferente exposingtheinvisible.org não mostra nenhum documento, mostrando que não há PDFs públicos hospedados naquele site.

imagem de tela do Google mostrando resultados para a busca site:exposingtheinvisible.org filetype:pdf *Exemplo de busca de pdf em exposingtheinvisible.org no Google *


Dica:

A ordem dos termos inseridos, incluindo filtros, importa em alguns buscadores, então pode valer a pena tentar diferentes combinações para resultados mais precisos ou relevantes.

Vacilação para Iniciantes

Existem muitos operadores de vacilação diferentes, e eles variam de acordo com o buscador. Para lhe dar uma ideia geral do que pode ser encontrado, incluimos quatro exemplos de vacilação abaixo. Mesmo que vários buscadores suportem os mesmos operadores, em geral retornam resultados diferentes.

Repetir essas pesquisas em vários buscadores é uma boa maneira de ter uma noção dessas diferenças. Para uma referência comparativa rápida, consulte os operadores usados pelo Google, DuckDuckGo, Yahoo e Bing no tabela abaixo.

Exemplo 1: encontrar orçamentos no site da Segurança Interna dos EUA

Esta vacilação trará a você todas as planilhas de Excel indexadas e públicas que contêm a palavra budget (orçamento) em :

budget site:dhs.gov filetype:xls

O operador ‘filetype:’ não reconhece automaticamente versões de formatos de arquivo semelhantes (ou seja, doc vs. odt ou xlsx vs. csv), então cada um desses formatos deve ser um vacilo separadamente:

budget site:dhs.gov filetype:xlsx OR filetype:csv

Esta vacilação retornará arquivos PDF no site da NASA:

site:nasa.gov filetype:pdf

Esta vacilação retornará planilhas .xlsx contendo a palavra budget no site do Departamento de Segurança Interna dos Estados Unidos (DHS, Department of Homeland Security):

budget site:dhs.gov filetype:xls

Essa consulta final, realizada em vários buscadores, retornará resultados diferentes, conforme ilustrado abaixo.

Google

No Google, tivemos que resolver um CAPTCHA.

tela do Google mostrando captcha Exemplo 1 do Google: Captcha

imagem de tela do Google mostrando resultados para a busca site:tacticaltech.org filetype:pdf Exemplo 1 do Google: orçamentos nos resultados de pesquisa do site da Segurança Interna dos EUA

Bing

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example1-bing.png Exemplo 1 no Bing: resultados de pesquisa por documentos de orçamento no site da Segurança Interna dos EUA (resultados de buscas em 2019)

Yahoo

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example1-yahoo.png Exemplo 1 do Yahoo: resultados de pesquisa por documentos de orçamento no site da Segurança Interna dos EUA (resultados de buscas em 2019)

DuckDuckGo

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example1-duck.png Exemplo 1 no DuckDuckGo: resultados de pesquisa por documentos de orçamento no site da Segurança Interna dos EUA (resultados de buscas em 2019)

Como você pode ver, os resultados variam entre os buscadores.

Exemplo 2: preços de imóveis em Belo Horizonte

Outro exemplo interessante analisa os preços de aluguel em Belo Horizonte. Abaixo estão os resultados da consulta a seguir, que submetemos a quatro diferentes buscadores. Atenção ao uso do operador AND (E, em inglês):

filetype:xls "aluguel" AND "Belo Horizonte"

Sobre fundo branco, resultados da pesquisa por planilhas com as palavras-chave 'aluguel' e 'Belo Horizonte'. Em destaque: 'Relatórios CVM', 'Contratos - Hemominas' e 'cultura1999aeb_60s5' Exemplo 2 no Google: resultados da pesquisa por planilhas com as palavras-chave «aluguel» e «Belo Horizonte».

resultados da pesquisa por planilhas com as palavras-chave 'aluguel' e 'Belo Horizonte'. Em destaque: 'portalibre.fgv.br', 'Banco Central do Brasil', 'p1.abcdpdf.com' Exemplo 2 no Bing: resultados da pesquisa por planilhas com as palavras-chave «aluguel» e «Belo Horizonte».

imagem de tela mostrando resultados da pesquisa por planilhas com as palavras-chave 'aluguel' e 'Belo Horizonte' no Yahoo. Em destaque, dois resultados do 'portalibre.fgv.br', e um 'ftp.ibge.gov.br' Exemplo 2 no Yahoo: resultados da pesquisa por planilhas com as palavras-chave «aluguel» e «Belo Horizonte».

resultados pesquisa por planilhas com as palavras-chave 'aluguel' e 'Belo Horizonte' no DuckDuckGo . Em destaque 'portalibre.fgv.br', 'id232.lb.fgv.br' e 'p1.abcdpdf.com' Exemplo 2 no DuckDuckGo: resultados da pesquisa por planilhas com as palavras-chave «aluguel» e «Belo Horizonte»

Exemplo 3: Procurando os planos de segurança do governo indiano

Para nosso exemplo final, localizaremos documentos contendo as palavras security plan (plano de segurança) em sites do governo indiano. Abaixo estão os resultados da seguinte consulta:

filetype:doc "security plan" site:gov.in

![](https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/pt/expondo-invisivel-google-dorking-exemplo-security-plan-india-google.png «resultados pesquisa por planilhas com as palavras-chave “filetype:doc”, “»security plan»” e “site:gov.in” no Google. Em destaque “Directorate General of Shipping”») Exemplo 3 no Google: resultados da pesquisa pelo plano de segurança do governo indiano.

![](https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/pt/expondo-invisivel-google-dorking-exemplo-security-plan-india-bing.png «resultados pesquisa por planilhas com as palavras-chave “filetype:doc”, “»security plan»” e “site:gov.in” no Bing. Em destaque “Directorate General of Shipping”») Exemplo 3 no Bing: resultados da pesquisa pelo plano de segurança do governo indiano.

![](https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/pt/expondo-invisivel-google-dorking-exemplo-security-plan-india-yahoo.png «resultados pesquisa por planilhas com as palavras-chave “filetype:doc”, “»security plan»” e “site:gov.in” no Yahoo. Em destaque, dois resultados de “Directorate General of Shipping”») Exemplo 3 no Yahoo: resultados da pesquisa pelo plano de segurança do governo indiano.

![](https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/pt/expondo-invisivel-google-dorking-exemplo-security-plan-india-duckduckgo.png «resultados pesquisa por planilhas com as palavras-chave “filetype:doc”, “»security plan»” e “site:gov.in” no DuckDuckGo.») Exemplo 3 no DuckDuckGo: resultados da pesquisa pelo plano de segurança do governo indiano.

Depois de ver os exemplos acima, você pode pensar em alguns sites que você gostaria de pesquisar usando técnicas semelhantes.

Na seção a seguir, vamos compartilhar algumas da vacilações que temos considerado particularmente útil e discutir como elas funcionam com diferentes buscadores.

Vacile Você Mesmo

Abaixo está uma lista das vacilações relevantes que identificamos e atualizamos em março de 2019. Esta lista pode não ser completa, mas estes operadores devem ajudá-lo a começar bem.

Coletamos e testamos esses vacilos nos buscadores com a ajuda dos seguintes recursos:

Tabela: Operadores de vacilos para Google, DuckDuckGo, Yahoo e Bing

Vacilo Descrição Google  DuckDuckGo  Yahoo  Bing 
cache:[url] Mostra a versão da página da web no cache do buscador.
related:[url] Localiza páginas da Web semelhantes à página da Web especificada.
info:[url] Apresenta algumas informações que o Google possui sobre uma página da Web, incluindo páginas semelhantes, a versão em cache da página e sites com links para a página.
site:[url] Localiza páginas apenas dentro de um determinado domínio e todos os seus subdomínios.
intitle:[texto] ou allintitle:[texto] Localiza páginas que incluem uma palavra-chave específica como parte da tag de título indexada. Você deve incluir um espaço entre os dois pontos e a consulta para que o operador funcione no Bing.
allinurl:[texto] Localiza páginas que incluem uma palavra-chave específica como parte de seus URLs indexados.
meta:[texto] Localiza páginas que contêm a palavra-chave específica nas meta tags.
filetype:[extensão do arquivo] Procura por tipos de arquivo específicos.
intext:[texto], allintext:[texto], inbody:[texto] Pesquisa o texto da página. Para Bing e Yahoo, a consulta é inbody:[texto]. Para DuckDuckGo, a consulta é intext:[text]. Para o Google, intext:[text] ou allintext:[text] podem ser usados.
inachor:[texto] Pesquisa ocorrêncisa do termo em links
location:[código ISO] ou loc:[código ISO], region:[código da região] Pesquisa uma região específica. Para Bing use location:[código ISO] or loc:[código ISO] e para DuckDuckGo use region:[código ISO]. Um código de localização ISO é um código curto para um país. Por exemplo, Egito eg, e os EUA é us. https://pt.wikipedia.org/wiki/ISO_3166-1
contains:[texto] Identifica sites que contêm links para o tipo de arquivo descrito aqui (e.g. contains:gif)
altloc:[código ISO] Pesquisa por local além de um especificado pelo idioma do site (por exemplos, pt-br ou en-us)
feed:[tipo de feed. Por exemplo RSS] Localizar feed RSS relacionado ao termo de pesquisa
hasfeed:[url] Localiza páginas da web que contêm o termo ou termos que você está consultando e um ou mais feeds RSS ou Atom. ✓ 
ip:[endereço ip] Encontre sites hospedados por um endereço IP específico
language:[código do idioma] Retorna sites que correspondem ao termo de pesquisa em um idioma especificado
book:[título] Pesquisas de títulos de livros relacionados a palavras-chave
maps:[localização] Pesquisas de mapas relacionados a palavras-chave
linkfromdomain:[url] Mostra sites cujos links são mencionados na url especificada (com erros)

DorkDorkGo

Incluímos os buscadores mais usados ​​na análise acima, mas nosso serviço preferido é DuckDuckGo, que é um buscador com foco na privacidade que afirma não coletar informações pessoais sobre seus usuários e que salva as consultas de pesquisa de forma que não possam ser atribuídas a usuários específicos.

Dito isso, se você estiver fazendo uma pesquisa sensível, ainda faz sentido usar o navegador Tor, em combinação com o DuckDuckGo, para proteger ainda mais sua privacidade. E, felizmente, o DuckDuckGo tem muito menos probabilidade do que o Google de bloquear usuários do Tor ou fazê-los resolver CAPTCHAs.

O DuckDuckGo também possui um recurso útil chamado bang, que permite consultar outros buscadores sem sair do site do DuckDuckGo. Para fazer isso, você inicia sua pesquisa com um ponto de exclamação seguido de um qualificador, que normalmente é uma abreviação de um provedor de pesquisa específico. Observe que, se o DuckDuckGo for o buscador padrão do seu navegador, você também poderá usar bang na barra de endereço.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-bangs.png Bangs no DuckDuckGo: https://duckduckgo.com/bangs

Por exemplo, iniciar sua pesquisa com !w bang permite que você pesquise diretamente na Wikipédia, enquanto !twitter, seguido de seus termos de pesquisa, retornará postagens relevantes do Twitter. Você pode encontrar milhares de atalhos de bang aqui: DuckDuckGo Bangs. (em Inglês)

Suponha que você queira pesquisar a entrada da Wikipedia para “ggoogle hackin”. A consulta a seguir o levará ao buscador da Wikipédia.

!w google hacking


Segurança em primeiro lugar!

Observe que o uso de uma bang não protegerá suas pesquisas de acordo com a política de privacidade do DuckDuckGo e, pois as próprias buscas são realizadas por outros serviços. Em nosso exemplo agora, a Wikipedia.

E, por ser uma correspondência exata, você terminará na própria entrada “google hacking” da Wikipedia, mas com um significado diferente do nosso.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-dorking.png DuckDuckGo Bangs resultado da pesquisa para !w dorking

Outros buscadores amigáveis à privacidade

Para pesquisas gerais, também recomendamos StartPage que é um buscador que retorna os resultados do Google usando um filtro de privacidade que reduz a quantidade de informações pessoais que o Google pode coletar sobre suas pesquisas.

Por mais importante que seja usar buscadores amigáveis à privacidade em sua navegação diária, o Navegador Tor deve oferecer proteção suficiente para permitir que você utilizar vacilação em outros buscadores quando necessário.

Vacilo defensivo

https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/il/Google-dorking-breakdown_02_cik_smaller.png

Você pode usar o dork para proteger seus próprios dados e defender sites para qual você é responsável. Chamamos isso de «vacilo defensivo» e normalmente assume uma de duas formas:

  • Verificação de vulnerabilidades de segurança em um serviço online, como um site ou um servidor FTP, que você administra; ou

  • Procurando informações confidenciais sobre você - ou sobre alguém, com a permissão deles - que podem estar expostas involuntariamente em um site, independentemente de você administrar ou não aquele site.

Este conselho se refere principalmente com o último tipo de vacilo, mas antes apresentaremos um banco de dados que pode ajudar você ou administradores de seu site com o primeiro caso.

Verificação de vulnerabilidades de segurança

O Google Hacking Database (GHDB) (Base de dados de vacilos ou hackings em buscadores) sugere várias palavras-chave e outros termos que você pode usar - juntamente com o filtro site:seusite.org para identificar certas vulnerabilidades.

Embora essas pesquisas possam ajudar os invasores a localizar sites vulneráveis, elas também ajudam os administradores a se protegerem. Nós recomendamos que você coordene com o administrador técnico do site que você deseja testar (a menos, é claro, que seja você) antes de tentar eles para fora.

Procurando informações confidenciais

Para procurar informações confidenciais, recomendamos começar com o seguintes comandos simples, juntamente com o filtro site:seusite.org. Você pode então remover o filtro site: para descobrir quais outros sites podem estar expondo informações sobre você ou sua organização. Abaixo estão alguns exemplos.

Você pode pesquisar seu nome em documentos PDF com:

<seu nome> filetype:pdf

Você pode repetir esta pesquisa com outros tipos de arquivos potencialmente relevantes, como xls, xlsx, doc, docx, ods ou odt. Você pode até procurar vários diferentes tipos de arquivos em uma pesquisa:

<seu nome> filetype:pdf OR filetype:xlsx OR filetype:docx

Ou você pode pesquisar seu nome no conteúdo regular do site com algo como o seguinte. (Consulte a tabela acima para obter informações sobre se o buscador de sua escolha usa intext: ou inbody: como filtro de pesquisa de texto.)

<seu nome> intext:"<informações pessoais como um número de telefone ou endereço>"


Segurança em primeiro lugar!

Tenha cuidado, no entanto. Se você pesquisar seu nome ou endereço e, em seguida, digamos, seu número de seguro social, você está essencialmente dando isso informações para quem executa o buscador. Até o navegador Tor não pode protegê-lo desse tipo de vazamento de privacidade.

Você também pode pesquisar informações associadas ao endereço IP de seus servidores:

ip:[endereço IP do seu servidor] filetype:pdf

Para mais exemplos, dê uma olhada na lista de arquivos contendo informações interessantes no Exploit DB.


Exemplo: Encontrando senhas

Pesquisar informações de login e senha pode ser útil como vacilo defensivo. Às vezes, as senhas são armazenadas em arquivos acessíveis ao público em servidores web. O vacilo no Google é uma maneira de identificar vulnerabilidades de segurança como esta.

A maneira mais fácil de tentar isso, deixando sua ética intacta, é restringir suas pesquisas a um site que você gerencia ou a um que é gerenciado por alguém de quem você pode pedir permissão. Teste o seguinte vacilos em diferentes buscadores:

senha filetype:doc site:seusite.org senha filetype:docx site:seusite.org senha filetype:pdf site:seusite.org senha filetype:xls site:seusite.org password filetype:doc site:seusite.org password filetype:docx site:seusite.org password filetype:pdf site:seusite.org password filetype:xls site:seusite.org

Para evitar chamar atenção para qualquer empresa ou organização em particular, tentei esta pesquisa sem o filtro ‘site:’. Fazer isso coloca um tanto de responsabilidade sobre nós:

  • Não compartilhe nenhuma senha que possamos visualizar ou baixar,

  • Criptografe qualquer arquivo que possamos baixar,

  • Não teste ou use quaisquer senhas que possamos descobir, e

  • Notifique o administrador de qualquer site do qual encontrar uma lista de senhas expostas.

A seguir, você verá resultados do Google vinculados a arquivos que continham nomes de usuários reais e senhas para duas instituições, incluindo uma escola secundária norte-americana. Ocultamos esses resultados, na captura de tela abaixo, e notificamos o escola que seus dados eram vulneráveis. Depois disto, a lista de senhas foi removidas.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-pass-googleo.png

Resultados da pesquisa por vacilos relativos a senha no Google

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-pass-bing.png

Resultados da pesquisa por vacilos relativos a senha no Bing

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-pass-yahoo.png

Resultados da pesquisa por vacilos relativos a senha no Yahoo

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-pass-duck.png

Resultados da pesquisa por vacilos relativos a senha no DuckDuckGo

Como você pode ver, os vários buscadores mais uma vez produziram diferentes resultados. Alguns deles não incluíram os documentos acima mencionados em suas primeiras páginas de resultados. Além disso, tanto o Yahoo quanto o DuckDuckGo retornou alguns resultados não relacionados a documentos.

Esse tipo de variação de resultados é esperado ao fazer vacilação; algumas consultas funcionam melhor do que outras e os resultados diferem entre as pesquisas motores.


Publicado em abril de 2019 / Última atualização em março de 2023
Traduzido para português em julho de 2023

Recursos

Artigos e Guias

Ferramentas e Bancos de Dados

Glossário

term-bang

Bang - é um apelido nerd para o ponto de exclamação (»!») no contexto de programação e tecnologia.

term-blacklist

Lista negra - uma lista de sites bloqueados e outros serviços da Internet que não podem ser acessados devido a uma política de filtragem restritiva. O termo está caindo em desuso para evitar conotações racistas e está gradualmente sendo substituído por lista de bloqueio e termos similares.

term-bot

Robô – também chamado de robot, bot, web bot ou internet bot, é um software aplicativo que executa tarefas automatizadas pela internet. Por exemplo, um robô do Twitter que publica mensagens automatizadas e feeds de notícias.

term-captcha

CAPTCHA – um teste automatizado usado por sites e serviços online para determinar se um usuário é humano ou robô. Por exemplo, um teste pedindo usuários para identificar todos os semáforos em uma série de nove fotos.

term-cms

Sistema de Gerenciamento de Conteúdo - Também conhecido como Gerenciador de Conteúdo (em inglês, Content Management System ou CMS), é um software usado para gerenciar o conteúdo que depois será renderizado em páginas na internet.

term-directory

Diretório – um contêiner usado para categorizar arquivos ou outros contêineres de arquivos e dados.

term-domain

Nome de domínio - um nome comumente usado para acessar um site (por exemplo, tacticaltech.org). Os nomes de domínio são traduzidos em endereços IP.

term-defensedork

Vacilo defensivo– um «vacilo» para identificar vulnerabilidades que possam afetar seus próprios dados ou os sites para os quais você s qesponsável.

term-dorking

Vacilação - uma técnica de usar o máximo potencial de através do uso pesquisas refinadas e operadores de prefixo. Também conhecido como Google Dorking ou Google Hacking.

term-dork

Vacilão – A pessoa que usa a técnica de vacilação

term-filter

Filtro – no contexto de pesquisa na web, é uma palavra-chave ou frase que tem significado particular para o buscador.

term-ftpserv

Servidor FTP - um aplicativo de software que executa o protocolo de transferência de arquivos (File Transfer Protocol, ou FTP), que é usado para transferir arquivos entre computadores através da Internet.

term-hack

Hack – a prática de interagir com a tecnologia de forma inesperada de forma a aprender mais sobre ela. (Também ganhou usos e conotações maliciosas.)

term-hacker

Hacker- tradicionalmente, qualquer pessoa que interaja com a tecnologia de maneiras inesperadas, a fim de aprender mais sobre esta. No contexto negativo, um criminoso de computador mal-intencionado que pode estar tentando acessar informações confidenciais ou assumir o controle do computador de alguém.

term-ip

Endereço IP – Endereço de Protocolo de Internet (IP vem do inglês Internet Protocol), é um conjunto de números usados para identificar um computador ou local de dados ao qual você está se conectando. Exemplo: 213.108.108.217 (IPv4) ou 2606:4700:4700::1111 (IPv6)

term-prefix

Operador de prefixo - texto especial que é adicionado antes do texto em uma barra de pesquisa. Por exemplo, «site:https://www.worldbank.org filetype:pdf» procurará todos os arquivos .pdf no site do Banco Mundial.

term-script

Script – uma lista de comandos que são executados por um determinado programa para automatizar processos. Por exemplo, visitar um URL a cada dois segundos e salvar o dados que são retornados.

term-seo

Otimização para buscadores – Também conhecido como Search Engine Optimization ou SEO, um método para influenciar a visibilidade orgânica (não paga) de um site ou página da web nos buscadores. Por exemplo, usando certas formas de construir títulos e conteúdo ou links para/de várias fontes.

term-searchsyntax

Sintaxe de pesquisa - palavras-chave e símbolos, às vezes chamados de «operadores» ou «filtros», que você pode usar para refinar seus resultados de pesquisa na Internet.

term-string

Termo de Busca – a combinação de palavras, números e outros caracteres que usamos ao pesquisar informações nos buscadores.

term-server

Servidor – um programa de computador ou dispositivo de hardware que fornece um serviço para outro programa de computador e seu usuário (conhecido como cliente). Um exemplo de serviço de servidor típico é o fornecimento de dados a outros computadores. Outro é hospedar uma página da Web ou enviar e receber e-mail de/para outros computadores.

term-tor

Navegador Tor – um navegador que mantém suas atividades online mais privadas. Ele disfarça sua identidade e protege seu tráfego na web de várias formas de vigilância na internet. Também pode ser usado para ignorar certos filtros da Internet.

term-url

Universal Resource Locator (URL) – um endereço da web usado para recuperar um página ou dados em uma rede ou internet. Popularmente chamado de endereço, e às vezes, link.

term-vpn

Rede Privada Virtual (VPN) - tradicionalmente chamada de VPN (do inglês Virtual Private Network), é um software que cria um «túnel» criptografado entre seu dispositivo e um servidor mantido pelo seu provedor de VPN. Sites e outros serviços online receberão as solicitações de - e retornarão suas respostas para - o endereço IP desse servidor em vez do seu endereço IP real, mascarando seu endereço IP real quando você visita sites e utilizar outros serviços online.

term-webdomain

Domínio da Web – um nome comumente usado para acessar um site que se traduz em um endereço IP. Por exemplo, tacticaltech.org.

term-webinterf

Interface da Web – uma interface gráfica do usuário na forma de uma página da Web que é acessada através do navegador de internet.

term-página da web

Página da Web – um documento acessível pela Internet, exibido em um navegador da web.

term-webserver

Servidor da Web – também conhecido como servidor de internet, é um sistema que hospeda websites e entrega seu conteúdo e serviços aos usuários finais através da Internet. Inclui hardware (máquinas servidoras físicas que armazenam o informação) e software que facilitam o acesso dos usuários ao conteúdo.

term-webadmin

Administrador do site – a pessoa responsável por gerenciar os sistemas por trás de um site. Também chamado de webmaster.