Busca de Forma más Inteligente con la Técnica de Dorking

por Gabi Sobliye

https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/il/Google-dorking-cik-illustration.png


SÍNTESIS: Un vistazo a las búsquedas avanzadas en Internet usando «Google dorking», cómo funcionan en diferentes motores de búsqueda y cómo puedes utilizar la técnica en tus investigaciones. Ten en cuenta los consejos sobre cómo proteger tu privacidad mientras buscas y preservar tu información personal de aquellas personas que podrían utilizar esta técnica con fines maliciosos.

Al investigar, a menudo necesitas reunir tanta información como sea posible sobre un tema; las técnicas de búsqueda avanzada pueden ayudar a descubrir archivos o huellas que sean relevantes para las preguntas que intentas responder. Por ejemplo, es posible que puedas encontrar las declaraciones de impuestos de una empresa o los informes de gastos de un gobierno local, información que puede no estar disponible en sus sitios web o no aparecer cuando realizas una búsqueda web regular.

Google dorking (también conocido como Google hacking) es una técnica utilizada por salas de redacción, organizaciones dedicadas a informes de investigación, auditorías de seguridad y criminales expertas y expertos en tecnología, para consultar los motores de búsqueda a fin de encontrar información oculta que pueda estar disponible en sitios web públicos o para identificar evidencia de vulnerabilidades de seguridad digital. Esta técnica se puede utilizar en la mayoría de los motores de búsqueda, no sólo en Google, por lo que generalmente nos referimos a ella simplemente como «dorking».

Dorking implica usar los motores de búsqueda en todo su potencial para descubrir resultados que no son visibles con una búsqueda regular, te permite refinar tus búsquedas y profundizar con mayor precisión en páginas web y documentos que están disponibles en línea. Descubrir archivos ocultos y fallas de seguridad mediante el uso de dorking no requiere gran conocimiento técnico, sino de aprender algunas técnicas de búsqueda y usarlas en varios motores de búsqueda.

Todo lo que necesitas para llevar a cabo un Google dorking es una computadora, una conexión a Internet y una comprensión básica de la sintaxis de búsqueda adecuada: palabras clave y símbolos (a veces llamados «operadores» o «filtros») que puedes utilizar para refinar los resultados de búsqueda. Sin embargo, para hacerlo de manera efectiva, es posible que también necesites persistencia, creatividad, paciencia y suerte.

Una breve historia del dorking

La técnica de Google dorking ha sido documentada desde principios de la década del 2000. Como muchos otros hacks, el dorking no es técnicamente sofisticado, simplemente requiere una pequeña cantidad de conocimiento oscuro y algo de creatividad.

Johnny Long, también conocido como j0hnnyhax, fue pionero del dorking. Publicó por primera vez su definición del término recién acuñado, googleDork, en el 2002. Desde entonces, su significado ha evolucionado para incluir otros usos.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-googledork.jpg La definición de Johnny Long del 2002 de un googleDork

Una búsqueda ordinaria se basa en una forma semántica de pedir información, ya sea escribiendo una pregunta completa (»¿Qué es Google dorking?») o seleccionando palabras clave importantes (»Google dorking significado»).

Un dork refina esa consulta, combinando elementos técnicos y semánticos, para aprovechar al máximo el hecho de que el contenido web es escaneado e indexado constantemente por las máquinas.

En una entrevista del 2011, Johnny Long dijo:

«En los años que llevo como hacker profesional, he aprendido que el enfoque más simple__suele ser el mejor. Como hackers, tendemos a prestar demasiada atención a los detalles y perdemos de vista la situación en su conjunto, enfocándonos en la tecnología, sin darnos cuenta de que puede haber métodos no técnicos a nuestra disposición que funcionen tan bien o mejor que sus equivalentes de alta tecnología. Siempre estuve atento a la solución más simple para los desafíos avanzados».

Usar dorking o no

Al liberar todo el poder de los motores de búsqueda, el dorking puede exponer información en los sitios web, así como vulnerabilidades dentro de ellos. Esto podría incluir información que se suponía que debía permanecer en una carpeta protegida por contraseña pero que terminó en otro lugar. O bien, puede incluir un script de configuración para un sistema de administración de contenido (CMS) que todavía tiene la capacidad de realizar funciones administrativas como agregar usuarios o usuarias, y cambiar contraseñas.

El dorking puede fortalecer tus investigaciones al expandir tu acceso a información de interés público pero que no está fácilmente disponible, ya sea por diseño, por accidente, o a través de los motores de búsqueda. También puede ayudarte a encontrar fallas de seguridad digital en tus propios servicios en línea y plataformas de publicación.


Nota:

Un gran acceso a la información conlleva una gran responsabilidad ética. Si bien puedes usar estas técnicas, de manera responsable, para extender tus investigaciones, otras personas pueden usarlas para obtener datos personales o aprovechar vulnerabilidades. Como suele ser el caso, las intenciones son importantes.


¡La seguridad es lo primero!

Si estás pensando en usar Google dorking como una técnica de investigación, hay varias precauciones que debes tomar antes de comenzar.

Google dorking exige un conocimiento de los problemas legales relacionados con el acceso a páginas y archivos, incluso si están en un servidor público. Aunque en la mayoría de los casos eres libre de buscar a voluntad en los motores de búsqueda, acceder a ciertas páginas web o descargar archivos de ellas puede configurar, en algunas circunstancias, un delito, especialmente en los Estados Unidos, de acuerdo con la >imprecisa y excesiva “Ley de Fraude y Uso Indebido de la Informática” (CFAA). Además, dado que las consultas de búsqueda son monitoreadas y almacenadas indefinidamente por los proveedores de búsqueda e incluso por los gobiernos, es posible que tus búsquedas puedan registrarse, identificarse como tuyas, e incluso usarse en tu contra en el futuro.

Para protegerte en tu investigación, te recomendamos utilizar el navegador Tor o Tails (un sistema operativo que enruta todo el tráfico de Internet a través de la red de anonimato Tor) cuando hagas Google dorking en cualquier motor de búsqueda. Tor enmascara tu tráfico de Internet, separando la información de identificación de tu computadora de las páginas web a las que estás accediendo.

El sitio web Security-in-a-Box de Tactical Tech incluye guías detalladas sobre cómo permanecer anónimo y eludir la censura en internet usar el navegador Tor en Linux, Mac y Windows, entre otros.

Si bien el Navegador Tor se ha vuelto más fácil de usar a lo largo de los años, a veces puede dificultar tus búsquedas. Google y otros motores de búsqueda pueden pedirte que resuelvas un CAPTCHA para demostrar que eres humano. Tor se conecta al sitio al que deseas acceder a través de una serie de servidores que se comunican en tu nombre y forman lo que se llama un circuito Tor. El último servidor que procesa tu >solicitud y se conecta al sitio que deseas, se llama nodo de salida Tor. Si muchos programas automatizados (o bots) están utilizando este mismo nodo de salida, pueden hacer que los motores de búsqueda sospechen de tus actividades, incluso si no eres el que ejecuta el bot. En tales supuestos, los motores de búsqueda pueden bloquear tus búsquedas por completo; en este caso, puedes intentar cambiar tu circuito Tor hasta que se conecte a un nodo de salida que no esté en la lista negra. Para hacerlo, haz clic en el icono de información del sitio (»ⓘ») en el lado izquierdo de la barra de direcciones y selecciona «Nuevo circuito para este sitio», como se muestra a continuación.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-New-Circuit.png Captura de pantalla de cómo solicitar un nuevo circuito en el navegador web Tor

Ten en cuenta que, dependiendo del país en el que te encuentres, el uso de Tor puede marcar tu actividad en línea como sospechosa. A menos que no seas el objetivo de un ataque avanzado, el navegador Tor es bastante efectivo para evitar la asociación de tu identidad en línea con los sitios web que visitas o los términos de búsqueda que ingresas, pero no oculta el hecho de que estás utilizando Tor.

Este es un riesgo que debes estar dispuesto a asumir al usar Tor, aunque puedes mitigar ese riesgo hasta cierto punto configurando el navegador Tor para usar un «Bridge» / puente con el pluggable transport «obfs4». Al usar un puente se intenta ocultar el hecho de que te estás conectando a un servidor Tor, y el uso de «obfs4» intenta hacer que esa conexión se vea como algo diferente al >tráfico de Tor.

Si no puedes usar Tor, otra opción, aunque menos efectiva para preservar tu anonimato, sería usar una VPN (Red Privada Virtual).

Las VPN funcionan enmascarando tu dirección IP, que puede ser utilizada por los sitios web que visitas para mapear de dónde vienes. Cuando uses una VPN, en lugar de ver tu dirección IP real, los sitios que visites verán la IP del proveedor de la VPN. Hay muchas opciones de VPN y puede ser confuso decidir cuál elegir. Para aumentar la confusión, la mayoría de reseñas y listados de VPN no son independientes, algunos están sesgados. Detectives de Seguridad es un sitio de revisión de VPN que puede consultar, entre muchos otros. Consulte también esta guía (más antigua pero aún relevante) sobre [cómo elegir una VPN] (https://web.archive.org/web/20230314120534/https://thatoneprivacysite.xyz/choosing-the-best-vpn-for -usted/) «Ese único sitio de privacidad» (este sitio ya no se actualiza). Se recomienda que elijas una compañía VPN que afirme que no lleva registros de tu tráfico. Si bien la mayoría de las VPN gratuitas deben evitarse porque a menudo financian sus operaciones vendiendo sus datos de registro (registros de los sitios que visitan las y los usuarios a través de la VPN), hay algunas de buena reputación que podemos respaldar, como:

También puedes usar un motor de búsqueda que respeta la privacidad, como DuckDuckGo, que admite algunas de las técnicas de búsqueda avanzadas que se detallan a continuación.

Si decides llevar adelante una investigación que involucra Google dorking, los siguientes métodos te ayudarán a comenzar y ofrecen una comparación de los dorks compatibles, a marzo del 2019, en diversos motores de búsqueda.

Cómo funciona el dorking

En el uso diario los motores de búsqueda como Google, Bing, DuckDuckGo y Yahoo aceptan un término de búsqueda (una palabra) o una cadena de términos de búsqueda, y devuelven resultados coincidentes, pero la mayoría de los motores de búsqueda también están programados para aceptar «filtros» u « operadores de prefijo» más avanzados. Un filtro es una palabra clave o frase que tiene un significado particular para el motor de búsqueda. Esto incluye términos como:

  • inurl:

  • intext:

  • site:

  • feed:

  • language:


Nota:

Cada palabra clave de filtro termina con dos puntos (:) y va seguida del término o términos de búsqueda relevantes, ¡sin espacio antes o después de los dos puntos! Mostraremos algunos ejemplos a continuación.

A fin de cuentas, ya sea que lo llames de forma pretenciosa (como «sintaxis de consulta avanzada del motor de búsqueda») o de forma simple, un dork es sólo una búsqueda que se basa en estas y otras palabras clave especiales para obtener resultados más significativos; estos resultados, pueden incluir cadenas de texto específicas del cuerpo de un sitio web por ejemplo, o archivos alojados en una dirección web específica.

No todas las técnicas de búsqueda «avanzada» se basan en filtros de prefijo como los que se muestran arriba. Agregar comillas (por ejemplo, «farmacias de guardia en Budapest») le dice a la mayoría de los motores de búsqueda que coincidan con una frase exacta. Colocando una «O» mayúscula entre los términos de búsqueda (como farmacias O boticas en Budapest) le dice al motor de búsqueda que devuelva resultados con ambos términos.

El siguiente es un ejemplo simple de un dork que se basa en un operador de prefijo. Buscará en https://tacticaltech.org todos los archivos PDF indexados alojados en ese dominio : site:tacticaltech.org filetype:pdf

Otro ejemplo que devuelve todos los sitios web bajo el dominio tacticaltech.org que tienen la palabra «invisible» en sus títulos podría verse así: site:tacticaltech.org intitle:invisible

Si necesitas usar un término de búsqueda que contenga varias palabras, puedes ponerlas entre comillas: site:tacticaltech.org intext:exposing intitle:"the invisible"

Los dorks también se pueden combinar con un término de búsqueda general, por ejemplo: exposing site:tacticaltech.org, o exposing site:tacticaltech.org filetype:pdf

Aquí, «exposing» es el término de búsqueda general y los filtros site: y filetype: acotan los resultados.

Algunos ejemplos de resultados de búsqueda se muestran a continuación:

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-tactecpdf.png Ejemplo de búsqueda de pdf en TacticalTech.org en Google

Una búsqueda similar en un dominio diferente exposingtheinvisible.org no encuentra documentos, lo que nos muestra es que no hay archivos PDF públicos alojados en ese sitio web.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-etipdf.png Ejemplo de búsqueda de pdf en exposingtheinvisible.org en Google


Consejo:

El orden de los términos que ingreses, incluidos los filtros, es importante en algunos motores de búsqueda, por lo que sería conveniente probar diferentes combinaciones para obtener resultados más precisos o relevantes.

Dorking para novatos

Hay muchos operadores de dorking diferentes, y varían según los motores de búsqueda. Para darte una idea general de lo que se puede encontrar, incluimos a continuación cuatro ejemplos de dorks; incluso si dos motores de búsqueda admiten los mismos operadores, a menudo devuelven resultados diferentes.

Repetir estas búsquedas en varios motores de búsqueda es una buena manera de tener una idea de esas diferencias. Para una referencia comparativa rápida, mira los operadores de dorking utilizados por Google, DuckDuckGo, Yahoo y Bing en la tabla a continuación.

Ejemplo 1: Encontrar presupuestos en el sitio web de Seguridad Nacional de los EE. UU.

Este dork te traerá todas las hojas de cálculo de Excel públicas indexadas que contienen la palabra «presupuesto»:

budget filetype:xls

El operador «filetype:» no reconoce automáticamente las diferentes versiones de formatos de archivo similares (es decir, doc vs. odt o xlsx vs. csv), por lo que cada uno de estos formatos se debe dorkear por separado:

budget filetype:xlsx OR filetype:csv

Este dork devolverá archivos PDF del sitio web de la NASA:

site:nasa.gov filetype:pdf

Y este dork devolverá hojas de cálculo .xlsx que contienen la palabra «presupuesto» en el sitio web del Departamento de Seguridad Nacional de los Estados Unidos:

budget site:dhs.gov filetype:xls

Esa última consulta, realizada en varios motores de búsqueda, arrojará resultados diferentes, como se ilustra a continuación.

Google

En Google, tuvimos que resolver un CAPTCHA.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-captcha.png Google ejemplo 1: Captcha

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example1-google.png Google ejemplo 1: Resultados de la búsqueda de presupuestos en el sitio web de la Seguridad Nacional de los EE. UU.

Bing

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example1-bing.png Bing ejemplo 1: Resultados de la búsqueda de presupuestos en el sitio web de la Seguridad Nacional de los EE. UU.

Yahoo

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example1-yahoo.png Yahoo ejemplo 1: Resultados de la búsqueda de presupuestos en el sitio web de la Seguridad Nacional de los EE. UU.

DuckDuckGo

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example1-duck.png DuckDuckGo ejemplo 1: Resultados de la búsqueda de presupuestos en el sitio web de la Seguridad Nacional de los EE. UU.

Como puedes ver, los resultados varían según los motores de búsqueda.

Ejemplo 2: Precios de las viviendas en Londres

Otro ejemplo interesante analiza los precios de viviendas en Londres. A continuación se muestran los resultados de la siguiente consulta que enviamos a cuatro motores de búsqueda diferentes:

filetype:xls "house prices" AND "London"

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example2-google.png Google ejemplo 2: Resultados de búsqueda de precios de viviendas en Londres

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example2-bing.png Bing ejemplo 2: Resultados de búsqueda de precios de viviendas en Londres

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example2-yahoo.png Yahoo ejemplo 2: Resultados de búsqueda de precios de viviendas en Londres

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example2-duck.png DuckDuckGo ejemplo 2: Resultados de búsqueda de precios de viviendas en Londres

Ejemplo 3: Buscar los planes de seguridad del gobierno indio

Para nuestro ejemplo final ubicaremos documentos que contengan las palabras «plan de seguridad» en los sitios web del gobierno indio. A continuación se muestran los resultados de la siguiente consulta:

filetype:doc "security plan" site:gov.in

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example3-google.png Google ejemplo 3: Resultados de búsqueda de planes de seguridad del gobierno indio

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example3-bing.png Bing ejemplo 3: Resultados de búsqueda de planes de seguridad del gobierno indio

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example3-yahoo.png Yahoo ejemplo 3: Resultados de búsqueda de planes de seguridad del gobierno indio

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-example3-duck.png DuckDuckGo ejemplo 3: Resultados de búsqueda de planes de seguridad del gobierno indio

Con suerte, después de ver los ejemplos anteriores, puedes pensar en algunos sitios web en los que te gustaría buscar utilizando técnicas similares. En la siguiente sección, compartiremos algunos de los dorks que hemos encontrado particularmente útiles y discutiremos cómo funcionan con diferentes motores de búsqueda.

Dorkea tú mismo

A continuación se muestra una lista de los dorks relevantes que identificamos y actualizamos a marzo del 2019, puede que esta lista no sea exhaustiva, pero los operadores deberían ayudarte a comenzar.

Recopilamos y probamos estos dorks en los motores de búsqueda con la ayuda de los siguientes recursos:

[Tabla: Operadores de dorking para Google, DuckDuckGo, Yahoo y Bing]

Dork Descripción Google DuckDuckGo Yahoo Bing
cache: [url] Muestra la versión de la página web de la memoria caché del motor de búsqueda.
related: [url] Encuentra páginas web que son similares a la página web especificada.
info: [url] Presenta cierta información que Google tiene sobre una página web, incluidas páginas similares, la versión en caché de la página y los sitios que enlazan con la página.
site: [url] Encuentra páginas sólo dentro de un dominio particular y en todos sus subdominios.
intitle: [text] or allintitle: [text] Encuentra páginas que incluyen una palabra clave específica como parte de la etiqueta de título indexada. Debes incluir un espacio entre los dos puntos y la consulta para que el operador funcione en Bing.
allinurl: [text] Encuentra páginas que incluyen una palabra clave específica como parte de sus URL indexadas.
meta: [text] Encuentra páginas que contienen la palabra clave específica en las metaetiquetas.
filetype: [file extension] Busca tipos de archivos específicos.
intext: [text], allintext: [text], inbody: [text] Busca en el texto de la página. Para Bing y Yahoo, la consulta es inbody: [texto]. Para DuckDuckGo, la consulta es intext: [texto]. Para Google, se puede usar intext: [texto] o allintext: [texto].
inanchor: [text] Busca texto en textos con links
location: [iso code] or loc: [iso code], region: [region code] Busca en una región específica. Para Bing usa location: [código iso] o loc: [código iso] y para DuckDuckGo usa region: [código iso]. Un código de ubicación iso es un código corto para un país, por ejemplo, Egipto es eg y EE. UU. es us.https://es.wikipedia.org/wiki/ISO_3166-1
contains: [text] Identifica sitios que contienen enlaces a tipos de archivo especificados (ejemplo, contains:pdf)
altloc: [iso code] Busca ubicación, además de la especificada por el idioma del sitio (ejemplo, pt-us o en-us)
feed: [feed type, i.e. rss] Encuentra fuentes RSS relacionadas con el término de búsqueda
hasfeed: [url] Encuentra páginas web que contienen el término o términos que estás consultando como una o más fuentes RSS o Atom.
ip: [ip address] Encuentra sitios alojados por una dirección IP específica
language: [language code] Devuelve sitios web que coinciden con el término de búsqueda en un idioma específico
book: [title] Busca títulos de libros relacionados con palabras clave
maps: [location] Busca mapas relacionados con palabras clave
linkfromdomain: [url] Muestra sitios web cuyos enlaces se mencionan en la URL especificada (con errores)

DorkDorkGo

Incluimos los motores de búsqueda más utilizados en el análisis anterior, pero nuestro servicio preferido es DuckDuckGo, que es un motor de búsqueda centrado en la privacidad, que afirma que no recopila información personal sobre las personas usuarias y que guarda las consultas de búsqueda de tal manera que no puedan atribuirse a usuarios o usuarias específicas.

Dicho esto, si estás llevando adelante una investigación sensible, tiene sentido usar el navegador Tor, en combinación con DuckDuckGo, para proteger aún más tu privacidad. Y afortunadamente, DuckDuckGo es mucho menos dado que Google a bloquear a las personas usuarias de Tor o a pedirles que resuelvan un CAPTCHA.

DuckDuckGo también tiene una característica útil llamada « bang», que te permite consultar otros motores de búsqueda sin salir del sitio web de DuckDuckGo. Para hacerlo, comienza tu búsqueda con un signo de exclamación seguido de un calificador, que normalmente es la abreviatura de un proveedor de búsqueda específico. Ten en cuenta que si DuckDuckGo es el motor de búsqueda predeterminado de tu navegador, también puedes usar bang en tu barra de direcciones.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-bangs.png DuckDuckGo Bangs: https://duckduckgo.com/bangs

Por ejemplo, comenzar tu búsqueda con el bang!wte permite buscar en Wikipedia directamente, mientras que!twitter, seguido de tus términos de búsqueda, devolverá las publicaciones relevantes de Twitter. Puedes encontrar miles de atajos bang aquí.

Supongamos que deseas buscar la entrada de Wikipedia para «dorking». La siguiente consulta te llevará al motor de búsqueda de Wikipedia.

!w dorking


¡La seguridad es lo primero!

Ten en cuenta que el uso de bangs no protegerá tus búsquedas de acuerdo con la política de privacidad de DuckDuckGo, ya que las búsquedas en sí son realizadas por otros servicios, en nuestro ejemplo es Wikipedia. Y, debido a que es una coincidencia exacta, terminarás en la entrada de Wikipedia «dorking», pero con un significado diferente al nuestro.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-dorking.png Resultado de búsqueda de DuckDuckGo Bangs para !w dorking

Otros motores de búsqueda con privacidad

Para búsquedas generales también recomendamos StartPage, que es un motor de búsqueda que devuelve los resultados de Google utilizando un filtro de privacidad que reduce la cantidad de información personal que Google puede recopilar sobre tus búsquedas.

Tan importante como es utilizar motores de búsqueda que respetan la privacidad en tu navegación diaria, el Navegador Tor debería ofrecer la suficiente protección como para permitirte hacer dorking en otros motores de búsqueda cuando sea necesario.

Dorking defensivo

https://cdn.ttc.io/i/fit/1000/0/sm/0/plain/kit.exposingtheinvisible.org/il/Google-dorking-breakdown_02_cik_smaller.png

Puedes usar dorking para proteger tus propios datos y defender los sitios web de los que eres responsable. Llamamos a esto «dorking defensivo» y generalmente se manifiesta en una de dos formas:

  • Verificar vulnerabilidades de seguridad en un servicio en línea, como un sitio web o un servidor FTPque administras.

  • Buscar información confidencial tuya o sobre otra persona, con su permiso, que pueda exponerse involuntariamente en un sitio web, independientemente de si administras o no ese sitio web.

Este consejo se refiere principalmente al último tipo de dorking, pero antes presentaremos una base de datos que podría ayudarte a ti o a tus administradores y administradoras de servicios con el primero.

Comprobación de vulnerabilidades de seguridad

La base de datos de hackeo de Google (GHDB)sugiere varias palabras clave y otros términos que puedes usar junto con el filtro site:yoursite.orgpara identificar ciertas vulnerabilidades.

Si bien estas búsquedas pueden ayudar a las y los atacantes a localizar servicios vulnerables, también ayudan a las y los administradoresa proteger los suyos. Recomendamos que coordines con la administradora técnica o el administrador técnico del servicio que deseas probar (a menos, por supuesto, que seas tú) antes de hacerlo.

Buscando información confidencial

Para buscar información confidencial recomendamos comenzar con los siguientes comandos simples, junto con el filtro:site:yoursite.org; luego puedes eliminar el filtro site:para descubrir qué otros sitios web podrían estar exponiendo información sobre ti o tu organización. A continuación algunos ejemplos.

Puedes buscar tu nombre en documentos PDF con: <your name> filetype:pdf

Puedes repetir esta búsqueda con otros tipos de archivos potencialmente relevantes, como xls, xlsx, doc, docx, ods u odt. Incluso puedes buscar varios tipos de archivos diferentes en una sola búsqueda: <your name> filetype:pdf OR filetype:xlsx OR filetype:docx

O puedes buscar tu nombre en el contenido normal del sitio web con algo como lo siguiente. (Consulta la tabla anterior para obtener información sobre si tu motor de búsqueda elegido utiliza intext:oinbody:como filtro de búsqueda de texto.)

<your name> intext:»<personal information like a phone number or address>»


¡La seguridad primero!

Pero ten cuidado, si buscas tu nombre o dirección y luego, digamos, tu número de seguridad social, esencialmente estás dando esa información a quien administra el motor de búsqueda, incluso el navegador Tor no puede protegerte de ese tipo de fuga de privacidad.

También puedes buscar información asociada con la dirección IPde tus servidores:

ip: [your server”s IP address] filetype:pdf

Para más ejemplos, dale una mirada a la lista Files Containing Juicy Info de Exploit Database.


Ejemplo: Encontrar contraseñas

La búsqueda de información de inicio de sesión y contraseñas puede ser útil como dork defensivo. Las contraseñas a veces se almacenan en documentos de acceso público en servidores web. El dorking es una forma de identificar vulnerabilidades de seguridad como esta.

La forma más fácil de probar esto, a la vez que mantienes intacta tu ética, es restringir tus búsquedas a un sitio web que administres, o a uno administrado por alguien a quien puedas pedir permiso. Prueba los siguientes dorks en diferentes motores de búsqueda:

password filetype:doc site:yoursite.orgpassword filetype:docx site:yoursite.orgpassword filetype:pdf site:yoursite.orgpassword filetype:xls site:yoursite.org

Para evitar mencionar a una empresa u organización en particular, intentamos esta búsqueda sin el filtro «site:». Hacerlo así nos impone ciertas responsabilidades:

  • no compartir ninguna contraseña que podamos ver o descargar,

  • cifrar cualquier archivo que podamos descargar,

  • no probar ni usar las contraseñas que aprendamos, y

  • notificar al administrador o administradora de cualquier sitio web en el que encontremos una lista de contraseñas expuestas.

Los resultados de Google vincularon archivos que contenían nombres de usuario reales y contraseñas para dos instituciones, incluso una escuela secundaria de EE. UU. Ocultamos estos resultados en la captura de pantalla que aparece a continuación, y notificamos a la escuela que sus datos eran vulnerables. La lista de contraseñas se ha eliminado desde entonces.

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-pass-googleo.png Resultados de búsqueda de contraseñas usando dorking en Google

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-pass-bing.png Resultados de búsqueda de contraseñas usando dorking en Bing

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-pass-yahoo.png Resultados de búsqueda de contraseñas usando dorking en Yahoo

https://cdn.ttc.io/i/fit/800/0/sm/0/plain/kit.exposingtheinvisible.org/google-dorking-pass-duck.png Resultados de búsqueda de contraseñas usando dorking en DuckDuckgo

Como puedes ver, los diversos motores de búsqueda una vez más produjeron resultados diferentes; algunos de ellos no incluyeron los documentos mencionados anteriormente en sus primeras páginas de resultados. Además, tanto Yahoo como DuckDuckGo devolvieron algunos resultados que no eran documentos. Incluso, quién sabe por qué razón, una colección de recetas de comida cajún.

Es de esperar este tipo de resultados variables cuando se hace dorking; algunas consultas funcionan mejor que otras, y los resultados son diferentes según los motores de búsqueda.

Publicado en abril del 2019

Recursos

Artículos y guías

· Bing Query Language Guide (para descargar desde la página archivada guardada por la Wayback Machine de Internet Archive) y Operators explained, de Microsoft Bing.

· DuckDuckGo Search guide. Un conjunto de consejos y pautas sobre cómo realizar búsquedas avanzadas con el motor de búsqueda DuckDuckGo.

· Google Searches. conjunto de consejos y pautas sobre cómo realizar búsquedas avanzadas con el navegador Google.

· Google hacking, de Wikipedia.

· Investigative Online Search, del Centro de Periodismo de Investigación. Una guía sobre investigación básica y avanzada en internet.

· Search Commands for Google, Yahoo and «Live Search».

Herramientas y Bases de datos

· Advanced Search Operators for Yahoo, Bing and Google, guía y hoja de trucos de Bruce Clay Inc.

· Google Advanced Search Operators. The Complete List, de Joshua Hardwick, Ahref.com.

Glosario

term-bang

Bang: Es un apodo nerd para el signo de exclamación (»!»).

term-blacklist

Blacklist / blocklisting: Lista negra. Una lista de sitios web bloqueados y otros servicios de Internet a los que no se puede acceder debido a una política de filtrado restrictiva. (NOTA: el término se está sustituyendo gradualmente por blocklisting y términos similares para evitar connotaciones y matices racistas).

term-bot

Bot: También llamado robot web o bot de internet, es una aplicación de software que ejecuta tareas automatizadas en internet. Por ejemplo, un bot de Twitter que publica mensajes automáticos y noticias.

term-captcha

CAPTCHA: Una prueba automatizada utilizada por sitios web y servicios en línea para determinar si un usuario es humano o robot. Por ejemplo, una prueba que pide a los usuarios que identifiquen todos los semáforos en una serie de nueve imágenes.

term-cms

Content Management System (CMS): Sistema de administración de contenido. Software utilizado para administrar contenido que luego se convierte en páginas en Internet.

term-directory

Directorio: Un contenedor utilizado para clasificar archivos u otros contenedores de archivos y datos.

term-domain

Domain name: Nombre de dominio. Un nombre que se usa comúnmente para acceder a un sitio web (por ejemplo: tacticaltech.org). Los nombres de dominio se traducen a direcciones IP.

term-defensedork

Defensive dork: Dork defensivo. Significa hacer dorking para identificar vulnerabilidades que podrían afectar tus propios datos o los sitios web de los que eres responsable.

term-dorking

Dorking: Una técnica que consiste en utilizar los motores de búsqueda en toda su capacidad mediante el uso de búsquedas refinadas y operadores de prefijo.

term-dork

Dork: Como en Google dork, la persona que usa la técnica de dorking.

term-filter

Filter: Filtro. En el contexto de búsqueda web, es una palabra clave o frase que tiene un significado particular para el motor de búsqueda.

term-ftpserv

FTP server: Servidor FTP. Una aplicación de software que ejecuta el Protocolo de transferencia de archivos (FTP), que se utiliza para transferir archivos entre computadoras a través de Internet.

term-hack

Hack: La práctica de interactuar con la tecnología de maneras inesperadas para aprender más sobre ella. (También ha ganado usos y connotaciones maliciosas).

term-hacker

Hacker: Tradicionalmente, cualquiera que interactúa con la tecnología de manera inesperada para aprender más sobre ella. En un contexto negativo, una persona delincuente informática maliciosa que puede estar intentando acceder a información confidencial o tomar el control de la computadora de alguien.

term-ip

Internet Protocol (IP) address: Dirección de Protocolo de Internet (IP): Un conjunto de números utilizados para identificar una computadora o ubicación de datos a la que se está conectando. Ejemplo: 213.108.108.217

term-prefix

Prefix operator: Operador de prefijo: Texto especial que se agrega antes del texto buscado en una barra de búsqueda. Por ejemplo, «site:https://www.worldbank.org filetype:pdf» buscará todos los archivos .pdf en el sitio del Banco Mundial.

term-script

Script: Una lista de comandos ejecutados por un programa para automatizar procesos, por ejemplo, visitar una URL cada dos segundos y guardar los datos que se devuelven.

term-seo

Search Engine Optimisation (SEO): Optimización del motor de búsqueda. Un método para influir en la visibilidad orgánica (no pagada) de un sitio web o una página web en los motores de búsqueda. Por ejemplo, al usar ciertas formas de redactar títulos y contenido o enlazar a/desde múltiples fuentes.

term-searchsyntax

Search syntax: Sintaxis de búsqueda: palabras clave y símbolos, a veces llamados «operadores» o «filtros», que puedes usar para refinar tus resultados de búsqueda en Internet.

term-string

Search string: Cadena de búsqueda: la combinación de palabras, números y otros caracteres que usamos cuando buscamos información en los motores de búsqueda.

term-server

Server: Servidor: una computadora que permanece encendida y conectada a Internet para proporcionar algún servicio, como alojar una página web o enviar y recibir correo electrónico, a otras computadoras.

term-tor

Tor Browser: Navegador Tor: un navegador que mantiene la privacidad de tus actividades en línea. Oculta tu identidad y protege tu tráfico web de muchas formas de vigilancia de Internet. También se puede usar para evitar los filtros de Internet.

term-url

Universal Resource Locator (URL): Localizador de recursos uniforme (URL): una dirección web utilizada para recuperar una página o datos en una red o internet.

term-vpn

Virtual Private Network (VPN): Red privada virtual (VPN): software que crea un «túnel» encriptado desde tu dispositivo a un servidor ejecutado por tu proveedor de servicios VPN. Los sitios web y otros servicios en línea recibirán tus solicitudes y devolverán tus respuestas a la dirección IP de ese servidor en lugar de a tu dirección IP real.

term-webdomain

Web domain: Dominio web: un nombre comúnmente utilizado para acceder a un sitio web que se traduce en una dirección IP.

term-webinterf

Web interface: Interfaz web: una interfaz gráfica de usuario en forma de página web a la que se accede a través del navegador de Internet.

term-webpage

Webpage: Página web: documento accesible a través de Internet, que se muestra en un navegador web.

term-webserver

Web server: Servidor web: también conocido como servidor de Internet, es un sistema que aloja sitios web y entrega su contenido y servicios a los usuarios finales a través de Internet. Incluye el hardware (máquinas del servidor físico que almacenan la información) y el software que facilita el acceso de los usuarios al contenido.

term-webadmin

Website administrator: Administrador del sitio web: la persona responsable de administrar los sistemas detrás de un sitio web. También se llama webmaster.