Continuando con un post realizado hace unos meses sobre los fundamentos del webscraping: Webscraping básico con Python - I, en esta ocasión presento otro ejemplo práctico para obtener información de un website.
Para nuestra pruebas utilizaremos Books to scrape, una página que simula ser una librería, creada con fines educativos por ScrapingHub1.
Dicha web cuenta con:
- 1000 items en total
- Paginación
- 20 items por página
- No requiere javascript para leer el contenido
Requisitos
Necesitamos tener instaladas los siguientes paquetes:
- beautifulsoup4 …