Sociedad

TECNOLOGÍA

Explotando el poder de las hojas de cálculo

Como descargar información de una manera práctica de las páginas de Internet.

Viernes 29 de septiembre | Edición del día

Antes de explicar el sencillo funcionamiento de la herramienta, cabe aclarar su objetivo es poder descargar información de paginas web. Por ejemplo las "tablas", que están por todos lados, sólo que no tenemos entrenado el ojo para reconocerlas como tales.

Un ejemplo práctico

La mejor manera de entender la herramienta es con un ejemplo práctico, allá vamos.

Le pedimos al lector/a que entre a la página y nos vaya siguiendo en el ejemplo para comprender el funcionamiento de la herramienta.

Supongamos que necesitamos descargar información de senadores ya que estamos haciendo una nota o investigación, entramos a la página del Senado donde está la lista de los mismos. Si, aunque nos parezca una lista, es en realidad una tabla para el navegador web.

Nos encontramos con esto

Entonces haríamos el clásico esfuerzo de ir seleccionando, copiando y pegando la información (que dependiendo el caso puede ser una tabla con cientos de personas) lo cual nos lleva a un tedioso trabajo... con esta herramienta vamos a poder descargar la información en unos simples pasos.

Abrimos un spreadsheet (hoja de cálculo de Google) en blanco, para quienes no estén familiarizados con esto, es un Excel on-line y se ve así:

Aquí es donde la "magia" de esta herramienta comienza, nos posicionamos en la primera fila y columna "A1" y escribimos lo siguiente "=IMPORTHTML(" al hacerlo automáticamente nos saldrá una ayuda de la misma página que nos guiará en el proceso.

Entonces vemos que tenemos tres campos separados por punto y coma a completar entre los paréntesis. Éstos son

=IMPORTHTML("acá copiamos y pegamos el link de la página donde está la tabla";"acá especificamos que buscamos una tabla";"acá ponemos el numero de tabla ya que puede haber varios por pagina")

y damos enter, en nuestro caso quedaría así.

=IMPORTHTML("http://www.senado.gov.ar/senadores/listados/listaSenadoRes";"table";1)

Es importante poner las comillas dobles, en caso de que no funcione puede ser por la configuración de nuestra PC en ese caso probar con las comillas simples ’así’.

Entonces luego de procesar unos segundos, todo dependiendo de la cantidad de información que estemos descargando tendremos el resultado.

¡Una tabla organizada con todos los datos que necesitábamos escribiendo solo unas lineas!

Pero no sólo esto, si cambia la información de la página, la información de la misma almacenada en nuestra hoja de cálculos, se actualizará automáticamente.

Otra función que podemos utilizar para descargar noticias de un RSS por ejemplo las noticias de portada de La Izquierda Diario.

En este caso varia la formula que debemos utilizar y es "=IMPORTFEED()"

Un ejemplo para que prueben seria:

=IMPORTFEED("http://www.laizquierdadiario.com/spip.php?page=backend_portada";"items";VERDADERO;50)

Como podemos ver si seguimos el ejemplo, esta fórmula nos descarga el link con una descripción de las notas destacas en portada del diario que se mantiene actualizada permanentemente.

Continuaremos en próximas notas con más herramientas que nos simplifican la extracción de datos de la web y manejo de redes sociales.






Temas relacionados

Informática   /    Google   /    Internet   /    Ciencia y Tecnología   /    Sociedad

Comentarios

DEJAR COMENTARIO