Introducción a la minería de datos

CI2352
Braulio José Solano Rojas

Agenda

En orden ascendente, de enero a diciembre

Abril 2012

Calendario Miércoles, 18 de abril de 2012 00:00

Tarea Nº1, I-2012

Este trabajo consiste en implementar el algoritmo ID3.

Estos son los requerimientos funcionales de dicho trabajo:

  • Debe utilizar el lenguaje de programación Java.
  • Debe utilizar el API de Weka.
  • La clase que resuelve el algoritmo ID3 debe ser hija weka.classifiers.Classifier.
  • Debe haber un programa final con interfaz gráfica que corre de manera independiente o autónoma.
  • El programa debe permitir como entrada de datos de entrenamiento archivos ARFF o CSV (puede opcionalmente como extra permitir conexión a base de datos).
  • El programa debe permitir mostrar las reglas generadas y un gráfico del árbol de decisión generado.  Para esto se puede apoyar en la funcionalidad que provee Weka.
  • El programa debe permitir clasificar individuos nuevos.

Es esencial que la implementación del algoritmo ID3 sea original.  Únicamente es permitido apoyarse en Weka para estructuras de datos, utilidades, etc.

Como documentación se deberá aportar un pequeño manual de usuario y una explicación de cómo se resolvió el problema con punteros hacia el código fuente.

Está permitido hacer el trabajo en parejas.

Junio 2012

Calendario Lunes, 11 de junio de 2012 19:00

Tarea Nº2, I-2012

Este trabajo consiste en implementar el algoritmo de Análisis en Componentes Principales.

Estos son los requerimientos funcionales de dicho trabajo:

  • Puede utilizar el lenguaje de programación Java, pero se podrá programar en cualquier lenguaje.
  • No debe utilizar ningún API específico, sino que para la graficación, las operaciones de matrices y las cargas de datos se podrá utilizar el API o biblioteca de preferencia.
  • Debe haber un programa final con interfaz gráfica que corre de manera independiente o autónoma.
  • El programa debe permitir como entrada de datos de entrenamiento archivos ARFF (si existe una biblioteca) o CSV (puede opcionalmente como extra permitir conexión a base de datos).
  • El programa debe permitir mostrar un gráfico con la graficación de los individuos y de las variables, además del circulo de correlación.
  • El programa debe permitir clasificar individuos nuevos.

Es esencial que la implementación del algoritmo sea original. Únicamente es permitido apoyarse en bibliotecas para estructuras de datos, utilidades, etc. Si se programa en Java se recomienda las siguientes bibliotecas: Jama, JChart2D y JavaCSV.

Como documentación se deberá aportar un pequeño manual de usuario y una explicación de cómo se resolvió el problema con punteros hacia el código fuente.

Está permitido hacer el trabajo en parejas.

Calendario Viernes, 22 de junio de 2012 19:00 | Duración: 2 horas | Ubicación: Aula 205

Exposición de proyectos

Exposición de los resultados del proyecto.

Calendario Martes, 26 de junio de 2012 19:00 | Duración: 2 horas | Ubicación: Aula 205

Exposición de proyectos

Exposición de los resultados del proyecto.

Calendario Viernes, 29 de junio de 2012 19:00 | Duración: 2 horas | Ubicación: Aula 205

2º examen parcial

La materia a revisar será desde métodos de análisis factorial.


Coordinador(es) de CI2352 : Braulio José Solano Rojas
Administrador de bsolano.com/ecci : Braulio J. Solano Rojas
Generado con Claroline © 2001 - 2013