Skip to content

pabloeb/Empresas-streaming-Data-Analysis-and-ML

Repository files navigation

Empresas de streaming - Consulta a bases de datos y Sistema de recomendación de películas y series

logos

Entorno:
El presente repositorio contiene un proyecto que forma parte del entrenamiento en Ciencia de Datos de la etapa de proyectos de la
academia Henry.

Objetivos:
Por un lado, a través de varios datasets de usuarios que contienen los datos de usuarios y películas de empresas renombradas de streaming,
se elabora una API con FASTAPI que consume los datos de un dataframe unificado y responde consultas en base a los requerimientos solicitados. Las consultas son:

  • Consulta 1:
    Película con mayor duración con filtros opcionales de AÑO, PLATAFORMA Y TIPO DE DURACIÓN. (la función debe llamarse
    get_max_duration(year, platform, duration_type))

  • Consulta 2:
    Cantidad de películas por plataforma con un puntaje mayor a XX en determinado año (la función debe llamarse
    get_score_count(platform, scored, year))

  • Consulta 3:
    Cantidad de películas por plataforma con filtro de PLATAFORMA. (La función debe llamarse get_count_platform(platform))

Por otro lado, a través de un algoritmo de Machine Learning del tipo Sistema de Recomendación basado en la técnica
de filtro colaborativo, se busca predecir si una película determinada es recomendable para un usuario dado.

FastAPI en Render

Se puede acceder a la consola de FastAPI a través del siguiente enlace(es lenta la carga, si no carga, repetir):

https://proyecto-ml-labs1-09ll.onrender.com

Se ingresa a una imagen de portada y luego haciendo click sobre la pantalla se redirige a /docs donde se realizan la
mencionadas consultas. Los parámetros correspondientes son los siguientes:

  • Parametros consulta1 : year (número entero entre 1920 y 2021),platform (Netflix,Hulu,Disney,Amazon), duration_type (min, season)

  • Parametros consulta2 : year (número entero entre 1920 y 2021),platform (Netflix,Hulu,Disney,Amazon), scored (0 a 5 con intervalos de 0.5))

  • Parametros consulta3 : platform (Netflix,Hulu,Disney,Amazon)

Tambien se puede hacer consultas directamente a través de la URL, por ejemplo:

https://proyecto-ml-labs1-09ll.onrender.com/consulta1?year=2014&platform=Netflix&duration_type=min

Consola de Gradio para predicciones de ML

Se puede ingresar a la consola a través del siguiente enlace:

https://c434a5893f2e494810.gradio.live

Se debe ingresar un número de identificación de cliente y de película. El modelo responderá el valor que ese usuario asignaría a la
película y en función de ello, si se le recomienda o no.El valor fijado para recomendar las películases de 3.75 puntos o más sobre un
máximo de 5.

Otro contenido del repositorio Hay una serie de archivos para revisar el código utilizado para construir el proyecto.

main.py : contiene el código para creación de la API

Consola Gradio.ipynb : contiene el código para creación de la consola de Gradio

EDA_Sistema_Recomendacion.ipynb: contiene el codigo del EDA y del modelo de Machine Learning (SVD,KNNWithMEANS,NMF)

ETA_inicio_proyecto.ipynb: contiene la fase inicial del proyecto , limpieza y ordenamiento de datos.

Video explicativo del proyecto completo

https://www.screencast.com/t/PlAriZSH4

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published