Reducción de Dimensionalidad

Ejemplo de Reducción de Dimensionalidad con PCA

  • Carga de datos (Dataset IRIS)
  • Preprocesamiento
  • Splitting dataset en conjunto de training y conjunto de Test
  • Estandarización
  • PCA (selección de cantidad de componentes principales)
  • Clasificación: Training con Random Forest
  • Evaluación con PCA, sin PCA

Enlace del ejemplo:  PCAevaluacionAccuracy

Clustering

Ejemplo de Clustering en Python:

  • Extracción de datos (Datatoy de películas): Cada fila corresponde a los votos de un usuario sobre cada película (columna). Cada usuario es una muestra, cada película es un ítem (característica).
  • Descripción de datos
  • Estandarización
  • Reducción de Dimensionalidad con PCA y explicación de varianza
  • Clustering con Kmeans
  • Visualización de clusters en 2D (2 componentes) y en 3D (3 componentes)

Enlace del archivo: PCAdatatoyMoviesClustering