¿Qué es el web scraping?
Es una técnica utilizada mediante programas de software para extraer información de sitios web. Usualmente, estos programas simulan la navegación de un humano en la World Wide Web ya sea utilizando el protocolo HTTP manualmente, o incrustando un navegador en una aplicación.1
Entre algunos tipos de contenidos que podríamos necesitar extraer tenemos a:
- listados de noticias o empleos
- lista de productos, sus imágenes y precios
- relación de libros
- otros
A modo de ejemplo, extraeré …