miércoles, 12 de mayo de 2010

Data Mining


:: Data Mining ::

La minería de datos es un proceso trivial de identificación válida, novedosa potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos.

Data Mining: "Es la extracción de información predecible escondida en grandes bases de datos."

Data Mining se basa en tres tecnologías:
1. Recolección masiva de datos
2. Potentes computadoras con multiprocesadores
3. Algoritmos de Data Mining

Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados.

El entorno de la minería de datos suele tener una arquitectura cliente / servidor.

El data mining produce:
  • Asociaciones.
  • Secuencias.
  • Clasificaciones.
  • Agrupamientos.
  • Pronósticos.
Un ejemplo ilustrativo mas claro del Data Mining sería:
Donde:


Fases de un proyecto de la Minería de Datos.
El proceso de data mining pasa por las siguientes fases:
  • Filtrado de datos.
  • Selección de variables.
  • Extracción de conocimiento.
  • Interpretación y evaluación.
::Filtrado de Datos::
Eliminar los datos que nos interesan.

::Selección de variables::
Reduce el tamaño de los datos eligiendo las variables mas influyentes en el problema (aquellas con los mayores atributos que requiera el problema).

::Extracción de conocimiento::
Mediante una técnica de minería de datos se obtiene un módulo de conocimiento.

::Interpretación y evaluación::
Una vez obteniendo el modelo se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. Si son varios modelos se busca aquel que se ajuste mejor al problema.

Aplicaciones de uso.
  • En el gobierno.
  • En las empresas.
  • En las universidades.
  • Investigaciones especiales.
  • Clubes deportivos.

Extensiones de Data Mining.

::Web Mining::
Una de las extensiones del Data Mining consiste el aplicar sus técnicas a documentos y servicios de web, lo que se llama Web Mining.

El Web Mining se clasifica en tres técnicas:
  • Web Content Mining (Minería de Contenido Web). Proceso que consiste e la extrección de contenido de documentos o sus descripciones.
  • Web Structure Mining (Minería de Estructura Web). Proceso que consiste inferir el conocimiento de la organización www y la estructura de sus ligas.
  • Web Usage Mining (Minería de Uso Web). Proceso de extraer los modelos interesantes utilizando los log's de los accesos web.
::Text Web::
Consiste en examinar una colección de documentos por descubrir información no contenida en ningún otro documento.

Conclusión.
El Data Mining se presenta como una tecnología de apoyo para explorar, analizar, comprender y aplicar el conocimiento, usando grandes volúmenes de datos.

Ejemplos de Data Mining Click Aqui

No hay comentarios:

Publicar un comentario