El Business Intelligence (BI), o inteligencia de negocio, es la habilidad que existe para transformar los datos en información y la información en conocimiento. Es decir, es el conjunto de metodologías, aplicaciones y tecnologías con las que reunir, depurar y transformar los datos de manera que permite a roles empresariales, no técnicos, entender lo que sucede con una visión analítica, para que se centren en la toma de decisiones.
Nuestra función como consultores es trabajar con los datos para que sea sencillo llegar a conclusiones a partir de los mismos. Como comenta Javier Armesto en su post La importancia del Story Telling en un proyecto de Business Intelligence “cuanto más comunique nuestro informe más fácil será tomar decisiones críticas de negocio en base a éste”.
Poniendo foco en facilitar la toma de decisiones, las técnicas de predicción resultan un poderoso aliado, ya que, complementan el análisis descriptivo provisto por los cuadros de mando e informes con un análisis predictivo, incluso prescriptivo.
¡Manos a la obra!
Veamos un sencillo ejemplo para ilustrar el uso de técnicas de predicción en cuadros de mando e informes de Business Intelligence. En primera instancia, se motivará la realización de este estudio y su aplicabilidad. Después, se describirá el set de datos. Posteriormente, se detallarán las herramientas y la metodología aplicada. A continuación, se mostrarán algunos gráficos interesantes del cuadro de mandos implementado. Por último, se desarrollará un modelo predictivo y se integrarán los resultados con la aplicación Power BI.
La compra de una vivienda es, para la mayoría de la gente, la mayor inversión que hará a lo largo de su vida. Además, si se financia mediante una hipoteca, supone un compromiso con el banco a largo plazo. Dentro de la compra de una vivienda no solo entran en juego factores económicos, también se suman factores emocionales, familiares, sociales, etc., por lo que tomar la mejor decisión no es tarea fácil. Sin embargo, el uso de herramientas analíticas puede ayudarnos a entender mejor el mercado inmobiliario en nuestra ciudad, estimar el precio de nuestra casa soñada y detectar las oportunidades que el mercado puede ofrecer.
Se va a trabajar con dataset House Sales in King County, USA el cual contiene el precio de las casas vendidas en King County (Seattle) desde mayo de 2014 hasta mayo de 2015. Se dispone de 21.600 propiedades aproximadamente y contamos con 21 variables, algunas de ellas son: precio de venta, número de habitaciones y baños, superficie habitable y total, número de plantas, año de construcción, localización, CP y estado de la propiedad.
Cuadros de mando y Power BI
Para la creación de los cuadros de mando se trabajará con Power BI, potente herramienta que nos ofrece un abanico de posibilidades para adaptarnos a cualquier proyecto, tal y como se puede ver en el post de Javier Armesto Proyectos de Business Intelligence con Microsoft Power BI. Por otro lado, para aplicar técnicas de predicción, se utilizará el lenguaje de programación Python, donde después de entrenar el modelo se mostrarán los resultados en Power BI.
Comenzaremos con la representación del precio por pie cuadrado dentro del mapa de nuestra ciudad objetivo para tener una visión global de lo que sucede en el mercado por ubicación. En el gráfico, cada punto corresponde a una vivienda, donde los colores oscuros representan viviendas donde el pie cuadrado es relativamente caro y los colores claros viviendas donde el pie cuadrado es relativamente barato.
Por otro lado, tenemos la representación del precio medio del pie cuadrado por código postal:
Cambiando de dimensión, es posible realizar un análisis del precio de la superficie por año de construcción. En teoría, las construcciones con menos años de construcción habrían de ser más caras al ser más nuevas y requerir en promedio menores reformas. Sin embargo, se encuentra este comportamiento:
Vemos que las viviendas muy antiguas tienen mayor precio. ¿Dependerá de la ubicación? Analizando de nuevo el mapa de ubicaciones, y filtrando por el año de construcción, podemos observar como la mayoría de las viviendas del periodo que comprende desde 1900 a 1920, se encuentran construidas en la zona prime de la ciudad mientras que, para periodos recientes, se encuentra una mayor distribución de viviendas construidas en zonas periféricas.
Para tener una idea más exacta del comportamiento del mercado se ha de continuar el análisis segmentando el precio de la vivienda por las distintas dimensiones (variables). Sin embargo, con este análisis preliminar ya hemos ilustrado algunas posibilidades que ofrece el Business Intelligence a la hora de conocer el mercado inmobiliario en este estudio.
A continuación, daremos un paso más en nuestro estudio y no será analizar los precios existentes, sino predecir el precio de las viviendas entrenando un modelo de predicción. El modelo que se va a utilizar va a ser el Partial Least Squares (PLS) que es recomendado para casos como en el de este estudio en el que las variables se encuentran correlacionadas entre sí.
La metodología aplicada simplificada ha sido:
- Realizar un análisis descriptivo del set de datos (histogramas de cada variable, gráfico de correlación entre variables, datos faltantes e imputación, etc.).
- Pretratamiento (normalización, creación de varias dummies a partir de variables categóricas, etc.).
- Aplicación del modelo predictivo sobre el set.
- Eliminación de observaciones anómalas para que no alteren el modelo.
- Selección del número de variables latentes mediante cross-validación.
- Extracción de resultados para la integración con Power BI.
Después de trabajar el modelo, se consigue un coeficiente de determinación (R2) del 75% aproximadamente. Es decir, nuestro modelo es capaz de predecir ¾ partes del precio de un inmueble. Ahora ya tenemos la capacidad de estimar en base a las características de nuestra casa soñada un precio orientativo.
Pongámonos en un caso ficticio, el modelo es capaz de predecir que para una casa a la que se piden las siguientes características:
El precio ha de ser 613.000 $. Por lo tanto, hemos de asegurarnos que este precio se ajusta a nuestro presupuesto disponible para la compra de una vivienda o rebajar nuestras expectativas.
Una vez se dispone del modelo predictivo, se puede ir más allá y utilizarlo para buscar oportunidades de compra. Si se sabe cuál ha de ser el precio de una casa con un error razonable, somos capaces de detectar posibles oportunidades cuando el precio predicho de un inmueble sea mucho más elevado del precio al que actualmente se vende.
Una vez realizada la predicción de todo el dataset podemos integrar los resultados dentro del informe de BI para hacer más ágil la búsqueda de oportunidades de compra.
Este sería el resultado de representar la variable descuento respecto al precio predicho en el mapa, donde las ubicaciones más oscuras representan un descuento elevado respecto al valor predicho por el modelo, mientras que las ubicaciones más claras representan un sobre coste respecto al precio predicho.
Aplicando filtros según los requisitos que ha cumplir nuestra vivienda como el número de habitaciones, tamaño mínimo o código postal, podemos buscar una casa que cumpla con nuestros requisitos y que además presente un descuento.
Por supuesto, no todos los inmuebles con descuento representan oportunidades, ya que hay otras variables que no se han tenido en cuenta en este modelo. Es decir, si una casa presenta daños estructurales y esta información no es tenida en cuenta en el modelo, obviamente va a aparecer como una oportunidad cuando realmente no lo es.
Conclusión
Finalmente, tras haber aplicado ingeniería de negocio a este ejemplo de análisis y predicción de precios de la vivienda, podemos concluir que los informes de Business Intelligence mejoran la interpretación de los datos, permitiendo segmentar y filtrar las variables objetivo en un entorno multivariable. Asimismo, la inclusión de técnicas predictivas en los informes de BI complementa el análisis descriptivo de los datos mejorando la toma de decisiones a los usuarios.
Por último, en el día a día de la consultoría empresarial se presentan innumerables situaciones en las que la aplicación de técnicas predictivas a la metodología BI nos permite ofrecer soluciones novedosas y sumamente atractivas para nuestra clientela.