Python
En este nuevo tutorial vamos a ilustrar como ir un paso más allá al obtener data desde el API, vamos a utilizar headers. Anteriormente mostramos como se puede hacer web scrapping directo al API, puedes encontrar el tutorial aquí.
Ahora vamos a intentar realizar el mismo procedimiento para el portal de inmuebles www.metrocuadrado.com.
Vemos que al intentar consumirlo directamente desde Postman, nos arroja un error.
Este error lo vamos a solucionar obteniendo el API Key necesario y pasandolo como un headers en el request al API.
A diferencia del ejemplo anterior con el portal www.fincaraiz.com.co , en este se utiliza un metodo GET. Por tanto, no necesitamos un body y basta con agregar el header al request para obtener la información que estamos buscando.
El siguiente paso es realizar la función completa utlizando una lógica similar a la del tutorial anterior.
En nuestra funcion final, muy similar al tutorial anterior, hemos aplicado un par de cosas interesantes. La primera es el offset para indicar el punto de partida inicial del request, la segunda es un ordenamiento por estratos. Este ordenamiento es aplicado en caso de que la data supere los 10000 inmuebles, ya que es el limite del API. Al ordendar por estrato nos permite que esa cantidad disminuya para cada llamado y asi lograr obtener la data completa.
Esta es una forma de obtener la data y se puede optimizar, simplemente nos funciona como ejemplo de como podemos facilmente hacer data scrapping directo del API y con la variación que obtener en este portal nos ayuda a ejemplicar como utilizar los headers en caso de ser necesarios.
El notebook completo se encuentra aqui.
Cualquier duda que tengan o feeddback sera bien recibido en los comentarios,
Att. Squaid