Instalacion y consultas a Google Big Query desde Jupyter

Instalación y consultas a Google Big Query desde Jupyter

Algunas notas para hacer un pedido a google big query. En este caso el objetivo es consultar la base de datos de Properati, y llevarla a un pandas. Agrego al final unos ultimos pasos para persistir la data en un mongo local.

Instalación Google Cloud

  1. Voy a crear un ambiente virtual especifico usando conda. En este caso le agrego python 3.6. Le llamo bigquery
  1. Activar el ambiente

Dentro del ambiente puedo entrar a python, y voy a chequear desde donde python se esta ejecutando

  1. El siguiente paso es instalar google-cloud en el ambiente. Lo instalo tambien desde conda. Lo siguiente no va a funcionar:

La forma correcta es especificando conda-forge:

Ahora sí levanta bien google cloud en python:

  1. Ahora voy a armar el ipykernel para poder levantar este ambiente desde jupyter. Instalo primero ipykernel en el ambiente con conda. El siguiente comando ejecuta el ipykernel llamando al python del ambiente sobre el que estamos trabajando

    (bigquery) C:\Users\Richard>conda install ipykernel

    Solving environment: done

    (bigquery) C:\Users\Richard>python -m ipykernel install –user –name bigquery –display-name "Python 36 (bigquery)"

    Installed kernelspec bigquery in C:\Users\Richard\AppData\Roaming\jupyter\kernels\bigquery

  2. Levanto jupyter (bigquery) C:\Users\Richard>jupyter notebook

     

Configurando la conexion

Ir a la pagina de google que permite crear credenciales de autentificacion

https://cloud.google.com/docs/authentication/getting-started?hl=es-419

1572618642641

Ejecutando el query

Desde jupyter

Hacer el pedido y llevarlo a un dataframe

Llevando la data a mongodb

Listo:

 

Leave a Reply

Your email address will not be published. Required fields are marked *