Minería de datos de Netflix


Minería de datos de Netflix

En el año 2000, Netflix comenzó a utilizar un sistema de calificación de las películas en DVD que alquilaba. A través de la plataforma en línea, los suscriptores tenían la posibilidad de calificar las películas vistas, otorgándoles de 1 a 5 estrellas. A partir de esta información, el sistema hacía recomendaciones al usuario. Este primer sistema recibía el nombre de Cinematch.

En octubre de 2006, la compañía lanzó la convocatoria del Netflix Prize o Premio Netflix, que buscaba mejorar este sistema. Dotado con un premio en efectivo de 1 millón de dólares, el objetivo del concurso era generar un algoritmo que mejorara las predicciones de Cinematch en un 10%; el individuo o equipo ganador sería aquel que alcanzara primero la meta, por lo cual no había fecha final prevista. Casi 3 años después, el 26 de julio de 2009, el equipo llamado BellKor’s Pragmatic Chaos, integrado por investigadores de AT&T logró superar a Cinematch en un 10.6%, ganando así la contienda y superando por tan solo 20 minutos al segundo lugar, The Ensemble, quienes lograron el mismo 10.6% de mejora.

Hasta antes de la puesta en marcha de su sistema de VOD por streaming los datos con los que contaba la compañía de cada uno de sus clientes eran, entre otros, nombre, código postal, género y la calificación otorgada a ciertas películas. Sin embargo, a partir del visionado de series y películas a través de la plataforma de streaming, el algoritmo tiene un conocimiento más puntual de los gustos del público gracias a datos como desde qué dispositivos se ve el catálogo, la hora del día en que se usa el servicio, durante cuánto tiempo se ve un determinado producto, qué géneros, directores, actores/actrices o año de estreno es que el que prefiere. Con esta información, además de personalizar la experiencia de cada consumidor (qué productos le recomienda, qué foto miniatura o tráiler muestra para presentar una serie o película), Netflix ha desarrollado proyectos originales que responden a estos gustos o que saben que encontrarán una audiencia.​

Incluso antes de empezar con la plataforma de streaming, la gran cantidad de información que acumula la empresa ya suscitaba temores entre los analistas de temas tecnológicos y privacidad. De igual forma, la manera de tratar estos datos ha sido motivo de demandas legales en Estados Unidos, particularmente ligadas a la liberación de información usada por los equipos participantes en el Netflix Prize.


Fuente: Wikipedia

Deja un comentario