quinta-feira, 11 de outubro de 2007

Classificação

Uma tarefa de classificação consiste em associar um elemento a uma classe, de várias opções predefinidas.

Técnicas de classificação

Classificadores baseados em árvores de decisão
Uma árvore de decisão é um instrumento de apoio à tomada de decisão que consiste numa representação gráfica das alternativas disponíveis geradas a partir de uma decisão inicial. É uma árvore n-ária, em que cada nodo tem uma pergunta e n possíveis respostas. Cada resposta, induz uma travessia da correspondente sub árvore e assim em diante até que se atinja um nodo folha que apenas tenha uma resposta.

Redes neuronais
Nas redes neurais artificiais, a ideia é realizar o processamento de informações tendo como princípio a organização de neurónios do cérebro. Como o cérebro humano é capaz de aprender e tomar decisões baseadas na aprendizagem, as redes neurais artificiais devem fazer o mesmo. Assim, uma rede neural pode ser interpretada como um esquema de processamento capaz de armazenar conhecimento baseado em aprendizagem (experiência) e disponibilizar este conhecimento para a aplicação em questão.

Uma rede neural assemelha-se ao cérebro no sentido em que o conhecimento é obtido através de etapas de aprendizagem, e os pesos sinápticos são usados para armazenar o conhecimento. Sinapse é o nome dado à relação que se estabelece entre os neurónios. A estas relações são atribuídos valores, denominados pesos sinápticos. Desta forma as redes neuronais artificiais são constituídas por uma série de neurónios artificiais (ou virtuais) que através do seu relacionamento, vão criar uma rede de elementos de processamento.

A aprendizagem das redes neuronais consiste então em ajustar os pesos sinápticos, de forma, a que todos, ou quase todos, os exemplos sejam correctamente classificados.

Vizinho mais próximo
O algoritmo de classificação baseado no vizinho mais próximo (Nearest Neighbor – NN) consiste em descobrir o vizinho mais próximo de uma dada instância. O algoritmo (k-Nearest Neighbor – k-NN) funciona de forma semelhante mas procura os k vizinhos mais próximos do padrão de consulta, ao invés de apenas um único vizinho mais próximo.
O kNN classifica um dado elemento de acordo com as respectivas classes dos k vizinhos mais próximos. O algoritmo calcula a distância entre um dado elemento e os restantes e então ordena-os por ordem crescente de distância. Dos elementos ordenados seleccionam-se apenas os k primeiros, que servem de parâmetro para a regra de classificação.

K- means
Quando não existem protótipos específicos ou atributos ou critérios disponíveis, o projecto de classificadores é chamado de projecto não - supervisionado ou clustering. Um dos algoritmos destes projectos é o k-médias.

K-médias é um algoritmo de agrupamento iterativo que classifica objectos num determinado número predefinido K de grupos (clusters). Tem como função de classificação a distância do objecto ao centro do grupo (centróide). Minimiza a soma J de todas as distâncias euclidianas entre cada objecto e o seu centróide, segundo o critério dos mínimos quadrados

Classificadores Hierárquicos
Os algoritmos hierárquicos dividem-se em aglomerativos e divisivos, e em ambos os casos, a estrutura hierárquica, baseada na matriz de distâncias ou semelhanças, representa-se por um diagrama de árvore designado por dendrograma.



Segmentação pode ser comparada a uma tarefa de classificação sem classes predefinidas. O objectivo de uma tarefa de segmentação consiste em agrupar registos semelhantes e separar registos diferentes, ou seja, separar o diferente e agrupar o semelhante.