Este proyecto, desarrollado como trabajo final para la materia de Ciencia de Datos, se centra en la predicción y clasificación de precios de inmuebles en Argentina. La clasificación determina si el precio de una propiedad, ya sea para compra o venta, debe considerarse como "bajo", "medio" o "alto" según sus características. Este enfoque es adaptable y permite trabajar con diferentes intervalos de precios según las necesidades del usuario. Inicialmente, se trabajó con tres categorías.
Los datos utilizados provienen de anuncios clasificados de la plataforma Properati, accedidos a través de un conjunto de datos histórico disponible en Kaggle. Este dataset abarca el periodo de 2013 a 2017, ofreciendo una perspectiva única del mercado inmobiliario sudamericano.
- Limpieza de Datos: Se llevaron a cabo procesos exhaustivos para eliminar datos irrelevantes o incompletos, garantizando un análisis confiable y preciso.
- Visualizaciones: Se generaron gráficos que permiten identificar tendencias y correlaciones clave dentro del mercado inmobiliario.
- Modelado Predictivo: Utilizamos técnicas de aprendizaje automático para predecir precios de propiedades en USD con base en las características del inmueble.
- Enfoque Geográfico: El proyecto se concentra exclusivamente en el mercado inmobiliario de Argentina, proporcionando insights útiles para agentes y compradores locales.
El objetivo principal es desarrollar un modelo que asista a agentes inmobiliarios, compradores y vendedores al proporcionar una clasificación y predicción de precios precisa, basada en datos históricos y características detalladas de cada propiedad.
This project, developed as a final assignment for the Data Science course, focuses on the prediction and classification of real estate prices in Argentina. The classification determines whether a property's price, whether for purchase or sale, should be considered "low," "medium," or "high" based on its characteristics. This approach is adaptable and allows working with different price ranges according to the user's needs. Initially, three categories were utilized.
The data used comes from classified ads on the Properati platform, accessed through a historical dataset available on Kaggle. This dataset covers the period from 2013 to 2017, offering a unique perspective on the South American real estate market.
- Data Cleaning: Comprehensive processes were conducted to remove irrelevant or incomplete data, ensuring reliable and accurate analysis.
- Visualizations: Graphs were generated to identify key trends and correlations within the real estate market.
- Predictive Modeling: Machine learning techniques were applied to predict property prices in USD based on the property's features.
- Geographical Focus: The project exclusively concentrates on the Argentinian real estate market, providing valuable insights for local agents and buyers.
The primary goal is to develop a model that assists real estate agents, buyers, and sellers by offering accurate price classification and prediction, leveraging historical data and detailed property features.