As ferramentas de data mining são usualmente empregadas para descobrir padrões e relacionamentos em conjuntos de dados, enfatizando as suas utilizações no tratamento de dados complexos e em grandes dimensões.
Em um grande número de situações, pode-se aumentar eficiência, reduzir custos, gerar novas estratégias e conhecimento operacional ou limitar riscos pelo uso racional das informações “escondidas” nas bases de dados das organizações. Segue lista de exemplos:
• Descobrir as principais características dos consumidores, definir e identificar aquelas que são as mais estratégicas e imprevisíveis para a organização;
• Melhorar o processo produtivo – minimizar o número de peças não-conformes, identificar os fatores chaves no processo produtivo, as regras/janelas de processo, etc;
• Avaliar o risco, detectar e prevenir fraudes;
• Acompanhar e antecipar uma mudança no comportamento do mercado (consumo) visando otimizar vendas, antecipar os níveis de estoque, etc.

sexta-feira, 20 de agosto de 2010
O Processo KDD - Knowledge Discovery in Databases
O processo KDD, do inglês “Knowledge Discovery in Databases”, é um processo de descoberta de padrões válidos, novos, úteis e acessíveis. A principal vantagem do processo de descoberta é que não são necessárias hipóteses, sendo que o conhecimento é extraído dos dados sem conhecimento prévio.
O processo KDD é um conjunto de atividades contínuas que são compostas, basicamente, por cinco etapas: seleção dos dados, pré-processamento, formatação ou transformação, Mineração de Dados e interpretação dos resultados (vide metodologia CRISP-DM).
O processo KDD é um conjunto de atividades contínuas que são compostas, basicamente, por cinco etapas: seleção dos dados, pré-processamento, formatação ou transformação, Mineração de Dados e interpretação dos resultados (vide metodologia CRISP-DM).
Estatística Vs. Data Mining
Estatística e data mining (machine learning) apresentam objetivos comuns na descoberta de estruturas em dados. Algumas pessoas (principalmente estatísticos) consideram data mining como uma parte integrante da estatística, enquanto outros (principalmente os pesquisadores em machine learning) consideram a estatística como uma parte do data mining.
Entretanto, métodos como análise de regressão, clustering e discriminant analysis são encontradas em ambas as disciplinas. Porém existem significantes diferenças entre as áreas: análise estatística é usualmente orientada à hipótese - parte-se de uma hipótese inicial a validar (ou não); coleta-se dados; e finalmente realizam-se experimentos. Data mining e machine learning são disciplinas orientadas aos dados - inicia-se com uma base de dados pré-estabelecida e tenta-se encontrar algo interessante.
Diversos algorítimos de machine learning podem ser utilizados para análise exploratória de dados: decision trees, decision rules, neural networks, bayesian classifiers, support vector machine (SVM). Alguns desses métodos são baseados em princípios oriundos da área de inteligência artificial, outros desenvolvimentos e métodos nasceram da estatística.
Entretanto, métodos como análise de regressão, clustering e discriminant analysis são encontradas em ambas as disciplinas. Porém existem significantes diferenças entre as áreas: análise estatística é usualmente orientada à hipótese - parte-se de uma hipótese inicial a validar (ou não); coleta-se dados; e finalmente realizam-se experimentos. Data mining e machine learning são disciplinas orientadas aos dados - inicia-se com uma base de dados pré-estabelecida e tenta-se encontrar algo interessante.
Diversos algorítimos de machine learning podem ser utilizados para análise exploratória de dados: decision trees, decision rules, neural networks, bayesian classifiers, support vector machine (SVM). Alguns desses métodos são baseados em princípios oriundos da área de inteligência artificial, outros desenvolvimentos e métodos nasceram da estatística.
Apresentação
O objetivo principal desse blog é divulgar serviços de simulação e otimização de processos e/ou produtos.
Afim de aferir rapidez e eficiência no processo, refinamento de peças através de estudos especializado e capaz de otimizar material, resistência, ou qualquer outro objetivo que se almeje.
Meu nome é Fabricio, estou atuando na área de simulação há mais de 8 anos. Engenheiro Mecânico formado pela Universidade Federal de Santa Catarina (UFSC). Uma das Instituições mais renomadas do Brasil.
Atuo numa empresa de metal-mecânico no norte do Estado de Santa Catarina (SC).
Durante 2 anos, trabalhei num Centro de Excelência em Pesquisa Automotiva na França.
Assinar:
Postagens (Atom)