Esta materia se trata de
- Estadísticas
- DataWerhause
- DataMinning
Soft que se usa en el curso
- Office 2007
- SqlServer 2005 : acá instalar los ejemplos, aquí hay 2 bd de ejemplos, y una de ellas es la que se usa AdventureWorks y AdventureWorksW
Business intelligence BI: mecanismos que mejoran el proceso de toma de decisiones, ojo, todo es medible, la decisión se toma en base a números
Data warehouse: es un almacén de daos, es una BD pero sus modelos no son normalizados y tengo un trabajo de compilación de la información, ej. Hacer una única lista de contribuyentes, permiten mostrar datos que la BD no permite extraer fácilmente, en el DW no necesariamente es el ultimo estado, la info gralmente esta sumariada, y consolidada
Data mining: Herramienta de modelización
Si le doy al usr una herramienta para que haga sus consultas ocurre:
- Hay problemas de seguridad
- En general los modelos de datos son complejos para que se le pueda transferir el conocimiento a cualquiera
- Extracción, transformación y carga de datos, a esto se lo denomina ETL, aca esta el 80% del trabajo sobre los datos, limpiar los datos queme mandan, levantar los datos del origen, ver como los almaceno
OLAP: on line analitical process
- Para descubrir el conocimiento que tengo en la BD puedo usar la DM que es mirar los datos de la base y la Query and reporting es la que usa el que conoce el negocio, la bd no le dijo nada, el pregunto lo necesario
- El DM es una evolución, 1ro se agota el SLQ y los querys básicos, luego se puede ver cosas mas sofisticadas como las características de mis mejores clientes (Analisis)
- El SQL sirve para verificar una hipótesis en, huelo algo y lo confirmo, Data mining confirma cosas que yo no espero, los datos que devuelve se espera que parte de ellos sean conocidos, y un porcentaje de cosas desconocidas
- Analista de datos: es el vinculo entre el área de tecnología y aéreas de negocios
- Data Cleaning: no solo trabaja sobre la entrada de datos, si no que también en los repositorios, ej. Veo que existen cajas de ahorros con saldo negativo
- DW tiene fotos en el tiempo, ej. Lo de enero, feb marzo etc… acá no existe la modificación , solo el agregado de datos, esto trae algunos problemas si tengo que hacer correcciones para atrás
- Data Marts: es un subconjunto del DW
- OLAP: permite hacer vistas multidimensionales, lo puedo ver por cliente, producto o región, complemente las actividades de DM
- Data Mining:
- es el análisis de grandes volúmenes de datos ,
- las técnicas de DM resuelven cosas que no puedo hacer a mano,
- se saca info que no es accesible vía SQL
- Hay una parte automática, mucha cuenta y una parte manual de saber leer el resultado, como se lee la solución desde el punto de vista del negocio
- No se hacen supuestos a priori
- es el análisis de grandes volúmenes de datos ,
- Data mining no es:
- Un producto
- No es mágico, hay mucho de interpretación del negocio
- No es un fin en si mismo, es para aplicar las soluciones al problema de negocio
- Un producto
- Data mining integra
- Inteligencia Artificial: mediante el uso de redes neuronales, para esto debo tener ejemplos si no no se puede hacer, hay datos para entrenar y datos para probar
- Estadística
- BD
- Aprovechamiento de procesamiento en paralelo
- Inteligencia Artificial: mediante el uso de redes neuronales, para esto debo tener ejemplos si no no se puede hacer, hay datos para entrenar y datos para probar
- Etapas de DM
- Entender el problema
- Transformar datos en información
- Actuar a partir de los resultados
- Medir los resultados de las acciones
- Entender el problema
- OLAP: son herramientas que permiten confirmar hipótesis
- Estadística, hasta los 70 se uso para confirmar cosas, luego para describir datos
- Redes neuronales
- Funcionan como caja negra, no da reglas explícitas, por esto no se usa mucho
- Funcionan como caja negra, no da reglas explícitas, por esto no se usa mucho
- CRM: es el proceso que administra la relación entre la compañía y sus clientes
- Problemas de DM
- Clasificación
- Estimación: es lo mas difícil, poder decir esto va a dar tanto, cuanto será la venta
- Agrupamiento por medio de reglas de sucesión
- Clustering: es hacer grupos
- Describir los clientes
- UP selling: venderle mas al mismo, Crosss seliing, pasar tus datos para que te venda otra cosa otra empresa
- Modelos de predicción de abandono
- Clasificación
No hay comentarios:
Publicar un comentario