Análise da Violência nas Capitais Brasileiras - Redes Neurais - isnard martins

Palavras chave: Indicadores, Redes Neurais, Criminalística, Pesquisa Operacional, Trigonometria

  Centro Científico de Estudos de Segurança Pública
 

 
 
 
Este ensaio oferece uma classificação da violência nas capitais brasileiras, tratando índices de homicídios relacionados com a população, agrupando os resultados processados por meio de redes neurais. Os dados fonte compreendem indicadores de homicídios por 100.000 mil habitantes, referentes às capitais brasileiras, editados pelo Ministério da Saúde (ano 2000) e os índices demográficos divulgados pelo IBGE.
O visão final do estudo será o resultado do tratamento das variáveis processadas via rede neural, utilizando uma arquitetura SOM (Self Organized Method) Competitive Learning, agrupando as capitais em quatro clusters:

        Grupo        Critério de Classificação
       ----------------------------------------------------------------------------
           1         Capitais com População Grande e alta violência      ( + / + )
           2         Capitais com População Grande e baixa violência     ( + / - )
           3         Capitais com População Pequena e alta violência   ( -  / -  )
           4         Capitais com População Pequena e baixa violência     ( -  / + )

Usando como ambiente de classificação um círculo trigonométrico (hiper espaço), as variáveis foram distribuídas nos quadrantes do espaço onde, após processamento, foram gerados centróides (neurônios) melhor representativos das capitais em cada respectivo quadrante. As grandezas identificadas como "Grandes", "Pequenas", "Altas" ou "Baixas" são referências relativas, sem variações intermediárias ou sub-classificações, restrições impostas somente para efeitos deste ensaio.


Resultados gerais do Ensaio

Os resultados finais obtidos por este ensaio foram os seguintes (referências consideradas relativas e restritas) :

Quadrante 1
Populacional - Alto  (+)
Homicídios - Alto (+)

Quadrante 2
Populacional - Alto  (+)
Homicídios - Baixo  (-)
Quadrante 3
Populacional - Baixo  (-)
Homicídios - Baixo  (-)
Quadrante 4
Populacional - Baixo  (-)
Homicídios - Alto (+)

Recife

 

(Extraídas)
Rio de Janeiro
São Paulo

Belém
Belo Horizonte
Brasília
Curitiba
Fortaleza
Manaus
Porto Alegre
Salvador

Florianópolis
Goiânia
Natal
Palmas
São Luís
Teresina

Aracaju
Boa Vista
Campo Grande
Cuiabá
João Pessoa
Macapá
Maceió
Porto Velho
Rio Branco
Vitória

Capital Típica

Centróide

Capital Típica
Centróide

Capital Típica
Centróide

Capital Típica

Centróide

Recife

Salvador

Teresina

Boa Vista

O centróide, calculado via rede neural, ajusta-se ao vetor mais típico do quadrante, não representando necessariamente a capital mais ou menos violenta, ou mais ou menos populosa, dentro de cada quadrante.


O modelo de agrupamento e classificação

Fornece, através de heurística simples, um algoritmo para executar uma análise, usando técnicas de normalização de dados plotados sobre os quadrantes de um círculo trigonométrico

Após a fase de normalização das variáveis, teríamos a distribuição genérica das variáveis, assim plotadas no hiperespaço.

O critério para associação das variáveis com os padrões genéricos não é rígido. Livremente, podemos associar quaisquer das variáveis com quaisquer dos padrões do modelo, para os efeitos resultantes do processamento.

Desta forma:
- a variável relacionada com o padrão 1, assumirá do lado esquerdo do eixo vertical um valor relativamente alto;

- a variável relacionada com o padrão 2, assumirá do lado superior do eixo horizontal um valor relativamente alto.
 
- a variável relacionada com o padrão 1, assumirá do lado esquerdo do eixo vertical um valor relativamente baixo;

- a variável relacionada com o padrão 2, assumirá do lado inferior do eixo horizontal um valor relativamente baixo.


Associando variáveis aos Padrões

Associando o Padrão 1 com Homicídios e o Padrão 2 com Habitantes, teríamos:

 

Como seria recomendado para este tipo de classificação, as grandezas muito grandes ou muito pequenas devem ser desindexadas, de forma não distorcer a amostragem, resultando um indesejável deslocamento das variáveis remanescentes, quase absolutamente, para o terceiro ou quarto quadrantes.
Assim as capitais Rio de Janeiro e São Paulo, que apresentam valores excessivamente altos, tanto em seus indicadores populacionais, como em homicídios/100 mil ha, foram extraídas da tabela inicial na normalização.
 
Capital Por 100 mil População
Rio de Janeiro 49,50 6.094.183
São Paulo 58,50 10.927.985

Posteriormente, após classificados e normalizados:

o primeiro quadrante apresentou aquelas capitais com alto índice relativo populacional e alto índice de homicídios/ 100 mil ha

o segundo quadrante apresentou aquelas capitais com alto índice relativo populacional e baixo índice de homicídios/ 100 mil ha

o terceiro quadrante apresentou aquelas capitais com baixo índice relativo populacional e baixo índice de homicídios/ 100 mil ha

o quarto quadrante apresentou aquelas capitais com baixo índice relativo populacional e alto índice de homicídios/ 100 mil ha


As variáveis do Ensaio

Os dados originais usados neste ensaio foram os seguintes:

Capital

Homicídios

População

Capital

Homicídios

População

Por 100 mil ha

(IBGE 2003)

Por 100 mil ha

(IBGE 2003)

(Min. Saúde 2000)

 

(Min. Saúde 2000)

 

Aracaju

33,6

498.619

Manaus

32,4

1.644.690

Belém

21,9

1.405.871

Natal

6,7

778.040

Belo Horizonte

28,2

2.375.329

Palmas

21,8

208.165

Boa Vista

46,4

242.179

Porto Alegre

30

1.428.696

Brasília

33,5

2.333.108

Porto Velho

60,7

373.917

Campo Grande

37,2

749.768

Recife

67,4

1.501.008

Cuiabá

65,6

533.800

Rio Branco

35,2

305.731

Curitiba

21,1

1.757.904

Rio de Janeiro

49,5

6.094.183

Florianópolis

11,1

396.778

 

Salvador

11,8

2.673.560

Fortaleza

24,3

2.374.944

São Luís

14,9

978.824

Goiânia

22,2

1.201.006

São Paulo

58,5

10.927.985

João Pessoa

31,9

660.798

Teresina

20,3

788.773

Macapá

43,4

355.408

Vitória

54,4

313.312

Maceió

37,9

903.463

 

O Método de Classificação SOM

 

Análise dos Clusters

 

Competitive Learning

 É uma forma de aprendizado que particiona o conjunto de padrões de entrada em grupos específicos de dados.

Forma simplificada : Winner takes all (o ganhador leva tudo)

Objetivos:

·     Demonstra graficamente os resultados promovidos por uma competição entre os processadores de uma rede neural auto-organizável.

·     Desenvolve ensaios laboratoriais de estudos, onde o método denominado Competitive Learning pode ser aplicado como solução para “clusterização” de variáveis.

Representação Geométrica

 Supondo todos os vetores de entrada e vetores de peso normalizados – tem-se todos os vetores dentro de um circulo de raio 1

 

 

 

Após normalizados, os vetores de entrada (valores numéricos) foram plotados no círculo trigonométrico, apresentando a distribuição abaixo. Podemos observar, no primeiro quadrante, as referências dos vetores Rio de Janeiro e São Paulo, que, devido à magnitude, causou uma distorção nos demais vetores do conjunto selecionado para o ensaio. A distorção concentrou a massa de dados restante no terceiro quadrante.

 

Desta forma, estes dados foram desindexados do conjunto original, e novamente normalizados. O resultado da segunda organização apresentou o seguinte resultado gráfico:

Os dados classificados apresentaram os seguintes resultados e agrupamentos (clusters):


Primeiro Quadrante
População: Alto / Homicídios/ 100 mil ha : Alto

Centróide: Recife
Capitais:
Recife


Segundo Quadrante
População: Alto / Homicídios/ 100 mil ha : Baixo


Centróide: Salvador

Capitais:
Belém
Belo Horizonte
Brasília
Curitiba
Fortaleza
Manaus
Porto Alegre
Salvador

 


Terceiro Quadrante
População: Baixo / Homicídios/ 100 mil ha : Baixo


Centróide: Teresina

Capitais:
Teresina
Florianópolis
Goiânia
Natal
Palmas
São Luís
Teresina


Quarto Quadrante
População: Baixo / Homicídios/ 100 mil ha : Alto



Centróide: Boa Vista

Capitais:
Aracaju
Boa Vista
Campo Grande
Cuiabá
João Pessoa
Macapá
Maceió
Porto Velho
Rio Branco
Vitória


Relógio da Violência Urbana - Download Gratuito
Curioso projeto que oferece ao pesquisador visão da velocidade  da materialização das ocorrências de homicídios, roubos e  outros delitos, em cidades, bairros ou regiões selecionadas.
  
 

As Variáveis normalizadas

Os dados originais, após desindexados, foram os seguintes:
 

Capital Por 100 mil População
Aracaju 0,00 -0,63
Belém -0,35 0,05
Belo Horizonte -0,16 0,78
Boa Vista 0,38 -0,82
Brasília -0,01 0,75
Campo Grande 0,10 -0,44
Cuiabá 0,95 -0,60
Curitiba -0,37 0,32
Florianópolis -0,67 -0,70
Fortaleza -0,28 0,78
Goiânia -0,34 -0,10
João Pessoa -0,05 -0,51
Macapá 0,29 -0,73
Maceió 0,12 -0,32
Manaus -0,04 0,23
Natal -0,80 -0,42
Palmas -0,35 -0,84
Porto Alegre -0,11 0,07
Porto Velho 0,80 -0,72
Recife 1,00 0,12
Rio Branco 0,04 -0,77
Salvador -0,65 1,00
São Luís -0,56 -0,27
Teresina -0,40 -0,41
Vitória 0,61 -0,77

Software VisualSOM


O método e Software utilizados neste ensaio incorporam recursos desenvolvidos por Isnard Martins nas pesquisas de Doutorado, orientados pelos professores Dra Marley Vellasco, Engenharia Elétrica, PUC-Rio e DR Silvio Hamacher, Engenharia Industrial, PUC-Rio.

Referências bibliográficas e teóricas sobre o assunto podem ser consultadas em REDES NEURAIS.
 

Competitive Learning - Referência de operação
DEI - PUC-Rio  Isnard Martins – 2005/ 2006

Disponibilizei o  software para DownLoad no site referenciado.
Requer conhecimentos específicos de matemática para a perfeita compreensão teórica e funcionamento prático. Este software é gratuito para pesquisas e fins educacionais.

Não será oferecido suporte a este Sistema.
 


Bibliografia

 Vellasco Marley, Redes Neurais, ICA Núcleo de Pesquisa em Inteligência Computacional Aplicada, PUC-Rio, Julho de 2005

Haykin Simon; Neural Networks – A Comprehensive Foundation. Macmillan College Publishing Company, USA, 1994

Martins Isnard. Software Visual SOM – Competitive Learning Redes Neurais. DEI , PUC-Rio, 2005/2006

Martins Isnard - Competitive Learning - http://www.citynet.com.br/redesneurais/


Tecnologia de pesquisa Brasileira

Consulte: