jueves, 20 de mayo de 2010

Documentacion Cubo OLAP

Documento realizado para la creación de un cubo OLAP
clic aqui

miércoles, 12 de mayo de 2010

Data Mining


:: Data Mining ::

La minería de datos es un proceso trivial de identificación válida, novedosa potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos.

Data Mining: "Es la extracción de información predecible escondida en grandes bases de datos."

Data Mining se basa en tres tecnologías:
1. Recolección masiva de datos
2. Potentes computadoras con multiprocesadores
3. Algoritmos de Data Mining

Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados.

El entorno de la minería de datos suele tener una arquitectura cliente / servidor.

El data mining produce:
  • Asociaciones.
  • Secuencias.
  • Clasificaciones.
  • Agrupamientos.
  • Pronósticos.
Un ejemplo ilustrativo mas claro del Data Mining sería:
Donde:


Fases de un proyecto de la Minería de Datos.
El proceso de data mining pasa por las siguientes fases:
  • Filtrado de datos.
  • Selección de variables.
  • Extracción de conocimiento.
  • Interpretación y evaluación.
::Filtrado de Datos::
Eliminar los datos que nos interesan.

::Selección de variables::
Reduce el tamaño de los datos eligiendo las variables mas influyentes en el problema (aquellas con los mayores atributos que requiera el problema).

::Extracción de conocimiento::
Mediante una técnica de minería de datos se obtiene un módulo de conocimiento.

::Interpretación y evaluación::
Una vez obteniendo el modelo se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. Si son varios modelos se busca aquel que se ajuste mejor al problema.

Aplicaciones de uso.
  • En el gobierno.
  • En las empresas.
  • En las universidades.
  • Investigaciones especiales.
  • Clubes deportivos.

Extensiones de Data Mining.

::Web Mining::
Una de las extensiones del Data Mining consiste el aplicar sus técnicas a documentos y servicios de web, lo que se llama Web Mining.

El Web Mining se clasifica en tres técnicas:
  • Web Content Mining (Minería de Contenido Web). Proceso que consiste e la extrección de contenido de documentos o sus descripciones.
  • Web Structure Mining (Minería de Estructura Web). Proceso que consiste inferir el conocimiento de la organización www y la estructura de sus ligas.
  • Web Usage Mining (Minería de Uso Web). Proceso de extraer los modelos interesantes utilizando los log's de los accesos web.
::Text Web::
Consiste en examinar una colección de documentos por descubrir información no contenida en ningún otro documento.

Conclusión.
El Data Mining se presenta como una tecnología de apoyo para explorar, analizar, comprender y aplicar el conocimiento, usando grandes volúmenes de datos.

Ejemplos de Data Mining Click Aqui

lunes, 10 de mayo de 2010

KDD


:: KDD Descubrimiento del Conocimiento en Bases de Datos ::

Se encarga de la preparación de los datos y la interpretación de los resultados obtenidos, los cuales dan un significado a sus patrones obtenidos.

De forma general, los datos son la materia prima bruta. En el momento que el usuario los atribuye algun significado especial pasan a convertirse información.

KDD apunta a procesod automaticamente a grandes cantidades de datos para encontrar conocimientos utiles entre ellos.

El objetivo de la KDD es basicamente proporcionar informacion relevante, útil, válido y nuevo para el usuario.

::Metas del KDD::
  • Procesar automaticamente grandes cantidades de datos crudos.
  • Identificar los patrones mas significativos y relevantes.
  • Presentarles como conociento apropiado para satisfacer las metas del usuario.

::Relacion con otras Disciplinas::

  • Sistemas de informacion / Bases de Datos
  • Estadistica, aprendizaje automatico / IA (inteligencia artificial)
  • Reconocimiento de patrones
  • Visualizacion de datos
  • Computacion paralela / distribuida
  • Interfaces de lenguaje natural a BD

::Proceso de KDD::
Consiste en usar metodos de mineria de datos (algoritmos) para extraer (identificar) lo que se considera como conocimiento de acuerdo a la especificacion de ciertos parametros usando una base de datos junto con pre procesamientos.