martes, 31 de enero de 2012

GOOGLE AL SERVICIO DE LA LINGÜISTICA


Cómo poner el Google al servicio de la investigación lingüística
Ricardo Soca
 


Los mecanismos de búsqueda de la Internet desempeñaron y papel de fundamental importancia en la transformación de la red mundial en el gigantesco y revolucionario venero de datos y conocimientos que tenemos a nuestra disposición en este comienzo de siglo. Sin ellos, la web no existiría o sería un vasto depósito de datos perdidos, entre los cuales difícilmente podríamos movernos.

Hacia 1995, eran Lycos, Yahoo, Webcrawler y tal vez algún otro, después aparecieron el Excite y el Hotbot, mientras que en la Internet en español se multiplicaban las herramientas de este tipo, principalmente en España. Sin embargo, el avance tecnológico y el poderío económico de los Estados Unidos tornaron sus buscadores más poderosos, hasta que la aparición del Altavista los hizo imprescindible.

Pero el verdadero milagro ocurrió con la creación del Google, un verdadero Gran Hermano digital cuyos ojos abarcan la Internet entera, con tecnología de búsqueda más nueva, servicios en varias lenguas -incluso español, claro- y la aparición de una variedad inimaginable de funciones, con cálculos matemáticos, conversión de medidas y traducción a varios idiomas.

El único requisito para extraer el máximo provecho de esa maravilla tecnológica es conocer algunas reglas simples que permiten afinar las búsquedas y hacerlas más eficientes.

Para los usuarios del Internet Explorer, el primer paso debe ser la instalación de la barra Google, que permite hacer las búsquedas directamente desde el navegador sin necesidad de abrir la página inicial del buscador.

Para movernos entre el enorme número de datos que el Google pone a nuestra disposición, la regla de oro es afinar la búsqueda para el número de casos encontrados sea menor y, al mismo tiempo, esté más cerca de lo que buscamos. 

Si hacemos una búsqueda por "siglo de oro", por ejemplo, el Google nos da 36.600 enlaces. ¿Es demasiado material para que podamos buscar con precisión? Supongamos que sólo nos interesan las páginas en que se mencione a Fray Luis de León. Ponemos entonces: 

"siglo de oro" +"Fray Luis de León"

Los 36.600 enlaces cayeron ahora a sólo 1.430. Si todavía resultan muchos, debemos afinar un poco más nuestra búsqueda con nuevos datos. Supongamos que nos interesan las páginas sobre el siglo de oro en las que aparezca Fray Luis de León, pero en las que no se hable de la ciudad de Salamanca. Enviaremos entonces al Google el siguiente comando:

"siglo de oro" +"Fray Luis de León" -Salamanca

sin olvidar que los signos + y - deben llevar un espacio antes pero ninguno después. Los hallazgos cayeron ahora a sólo 74, una cantidad razonable para comenzar a buscar. Ahora tenemos una selección hallada entre cientos de millones de páginas que reúne lo que más se aproxima a lo que estamos buscando.

Es preciso recordar que las comillas son esenciales en este tipo de búsqueda. En efecto, si ordenamos buscar

siglo de oro

sin comillas, el mecanismo buscará todas las páginas que contienen la palabrasiglo, más las que contienen la palabra de, más las que contienen la palabraoro, con lo que la búsqueda sería inútil.

Si queremos saber en qué países se usa el voseo, podemos orientarnos con una búsqueda como ésta:

"vos sabés" +"vos tenés"

La mayoría de los resultados son de Argentina, con algunas páginas de España (con textos argentinos) y de Uruguay, pero examinando un poco más detenidamente los casi 900 casos aparecidos, seguramente aparecerán otros países.

A todos nos pasa alguna vez que nos suena vagamente una frase o un verso de una poesía, pero no recordamos de cuál se trata ni quién es su autor. Supongamos que nos ocurre eso con el trecho e iban frases vagas y tenues suspiros. Preguntémosle a Google 

"e iban frases vagas y tenues suspiros"

y el buscador nos informará que se trata de Era un aire suave, del libro de Rubén Darío Prosas profanas.

El buscador también nos permite saber cuántos enlaces hacia una determinada página descubrió e indizó en su recorrido por la Internet: 

site:www.elcastellano.org o biensite:cervantes.es

Hace un par de semanas, me esforzaba inútilmente por recordar el título de una película que había visto hace algunos años, con Clint Eastwood y Meryl Streep. Sólo lograba recordar que el título hablaba de puentes... los puentes de algo...

Fui a la barra de Google de mi navegador y tecleé apenas:

bridges +Eastwood

El resultado, The bridges of Madison County, demoró menos de un segundo después de pulsar la tecla ENTER

Ortografía


Si tenemos una duda ortográfica en cualquier lengua, el buscador puede ayudarnos a disiparla. Supongamos que no sabemos, o no estamos seguros, cómo se escribe necesito. Le pedimos entonces al Google que busque nesesito y veremos que aparecen casi 10.000 casos; enseguida lo consultamos con necesito y el buscador encuentra 285.000 casos, casi 30 veces más. O tal vez queramos saber cuál es la forma preferible entre dos grafías académicamente correctas de una palabra, como ocurre conpsicólogo y sicólogo. La primera forma aparece 161.000 veces en Google mientras que la misma palabra escrita sin p, igualmente correcta, aparece apenas 6.220 veces.

Traducción

El Google, al igual que el Altavista, nos ofrece además la posibilidad de traducir textos breves en docenas de lenguas, abrir páginas en inglés ya traducidas al español o hacer búsquedas específicas en determinados idiomas o países.

Cálculo

Una novedad de este buscador es que también sabe hacer cuentas, para lo cual basta apenas con entrar los números y signos correspondientes en la barra de texto del buscador. Veamos algunas operaciones posibles:A esta altura, muchos deben preguntarse por qué, ante este cúmulo de maravillas, sobreviven otros buscadores, si el mundo entero está archivado en Google. Esto ocurre porque el algoritmo con que Google trabaja no permite el uso de comodines ni de operadores lógicos que es permitido, por ejemplo, en Altavista.

En este último mecanismo, es posible buscar por ejemplo *tribuir, que nos permite hallar todas las palabras terminadas en tribuir, pero que Google ignora olímpicamente, así como el uso de operadores lógicos como AND, OR, AND NOT y NEAR, aunque estos últimos pueden ser sustituidos por los signos + y -, como se explica en la página de ayuda del Google.

No hay comentarios:

Publicar un comentario