Instrucciones para convertir un archivo CSV a un archivo SQLite. SQLite viene con su propia línea de comandos para realizar algunas tareas, entre ellas, la importación de archivos CSV.
Full Stack Developer
Instrucciones para convertir un archivo CSV a un archivo SQLite. SQLite viene con su propia línea de comandos para realizar algunas tareas, entre ellas, la importación de archivos CSV.
Peewee es un ORM para python. Incluye soporte para SQLite, MySQL, PostgreSQL y Cockroachdb.
Sus siglas significan Object-Relational mapping, o en español: Mapeo Objeto-relacional. Es una técnica que permite convertir entre los tipos de datos usados en los lenguajes de programación orientados a objetos y los tipos de datos de algun sistema de base de datos relacional.
Se instala mediante pip.
pip install peewee
Para comprobar que se haya realizado la instalación, podemos …
En esta ocasión, siguiendo el ejemplo del post anterior, realizaré la misma tarea pero utilizando Scrapy, un framework especializado en la tarea de realizar webscraping.
Nuestro objetivo es el mismo: descargar la lista de libros y precios de Books to scrape.
Necesitamos instalar scrapy:
pip install scrapy
Nuestro script, según el ejemplo de la documentación de scrapy, toma la siguiente forma:
import scrapy
url = 'http://books.toscrape.com'
class BooksSpider(scrapy.Spider):
name = 'books'
start_urls = [
url,
]
def parse …
Continuando con un post realizado hace unos meses sobre los fundamentos del webscraping: Webscraping básico con Python - I, en esta ocasión presento otro ejemplo práctico para obtener información de un website.
Para nuestra pruebas utilizaremos Books to scrape, una página que simula ser una librería, creada con fines educativos por ScrapingHub1.
Dicha web cuenta con:
Necesitamos tener instaladas los siguientes paquetes:
Una de las tareas en Librera implica recopilar la información de un libro en base a su ISBN, para lo cual en algunos casos se recurre al webscraping.
En algunos casos, al obtener la portada de un libro desde algún servicio externo como Google Books API, Goodreads API o scrapeando alguna web verificábamos que obteníamos una portada incorrecta.
Nuestro proceso para obtener la portada de un libro implicaba:
Mis proyectos Personales
Y para mi próximo truco, un post inusual.
Este año tengo dos proyectos que avanzo en mi tiempo libre (o que intento al menos).
Librera es un marketplace de libros originales el cual llevo en conjunto con algunos compañeros. El objetivo es agrupar a diversos vendedores, ya sean librerías, vendedores independientes u ocasionales y permitirles contar con un espacio en el que publicar sus libros.
Uno de los problemas que intentamos resolver es la dificultad para …