KDD – Knowlegde Discovery in Database

O termo KDD – Knowledge Discovery in Databases, foi formalizado em 1989 em referência ao amplo conceito de procurar conhecimento a partir de base de dados. O KDD é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados. O termo iterativo sugere a possibilidade de repetições integrais ou parciais do processo de KDD e a expressão não trivial alerta para a complexidade normalmente presente na execução de processos de KDD. Já com relação a expressão padrão válido indica que o conhecimento deve ser verdadeiro e adequado ao contexto da aplicação de KDD e o termo padrão novo deve acrescentar novos conhecimentos aos existentes, para que todo esse processo gere conhecimento útil que pode ser aplicado de forma a proporcionar benefícios ao contexto de aplicação de KDD. Porém, a extração de conhecimento de uma grande base de dados através da aplicação de um processo de KDD exige a melhor compreensão das diferenças entre dado, informação e conhecimento, conforme ilustra a figura abaixo.

KDD

O KDD ou descoberta de conhecimento em banco de dados em Português é um processo utilizado para identificação de padrões em grandes massas de dados, esse processo é dividido em cinco etapas: seleção, pré-processamento, transformação, mineração dos dados e interpretação de resultados. O objetivo desse processo é descobrir informações relevantes e importantes para apoiar os tomadores de decisão em suas decisões estratégicas.

image

Etapas do processo KDD

A etapa de seleção é a primeira etapa do KDD, é uma etapa muito importante, pois é nela que serão decididos quais os conjuntos de dados que serão relevantes para que sejam obtidos resultados com informações uteis.

Na etapa de pré-processamento acontece a limpeza dos dados e seleção de atributos. Nesta etapa informações ausentes, errôneas ou inconsistentes nas bases de dados devem ser corrigidas de forma a não comprometer a qualidade dos modelos de conhecimento a serem extraídos ao final do processo de KDD.

A etapa de transformação ou formatação dos dados analisa os dados obtidos da etapa anterior e os reorganiza de uma forma especifica para que possam ser interpretados na etapa seguinte.

Na etapa de mineração dos dados é onde tudo acontece, os dados depois de transformados serão lidos e interpretados. A mineração faz com que meros dados sejam transformados em informações, tais informações são indicadas através de força bruta, ou seja, lendo regra por regra e as interpretando.

Na última etapa a de interpretação de resultados é onde as regras indicadas pelo processo anterior serão interpretadas e avaliadas. Após a interpretação poderão surgir padrões, relacionamentos e descoberta de novos fatos, que podem ser utilizados para pesquisas, otimização e outros.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s