data science
Revista da ESPM
| setembro/outubrode 2014
56
grandes fases: o “Map”, quedisparadiversos agentes para
os locais emque estãoosdados (páginasdaweb, arquivos
na internet), e o “Reduce”, que inicialmente consolida os
resultados totais da sua busca a partir de consolidações
locaisdecadaagente.Issotornaoprocessoextremamente
rápido, permitindoqueconsultasamilhõesdepáginasda
internet sejam feitas emmilissegundos no computador
pessoal ou smartphone de qualquer pessoa.
Essa ideia não é de fato original, mas não havia sido
convenientemente implementada até então. A ferra-
menta Hadoop é uma das que mais se popularizaram
como tecnologia que suporta o
big data
a partir da imple-
mentação doMapReduce.
Organizando e analisando as informações
Os dilemas que as empresas vivem no contexto do
big
data
fortalecema necessidade de organizarmos as infor-
mações para podermos, efetivamente, analisá-las de
forma razoável e factível.
Segundo a consultoriaGartnerGroup, entre 70%e 80%
das informações relevantes nos processos decisórios
têmcaracterização espacial. Isso significa que questões
críticas de negócio nas organizações têm, na maioria
dos casos, componentes como “onde?”. Onde está omeu
cliente, emeus fornecedores? Para onde devo expandir
minha operação? Onde está minha concorrência?
A natureza geográfica das informações possibilita a
integração de dados, informações, processos, inclusive
“
big data
”, pelo simples fato de eles conviverem emum
mesmo espaço geográfico. Essa integração induz a uma
visão sistêmica (integrada, ampla, abrangente e holís-
tica) da maioria das questões necessárias às tomadas
de decisão. Por exemplo: caracterizar espacialmente
um tweet disparado por um cidadão sobre a qualidade
dos serviços públicos da cidade. Essa informação pode
ser georreferenciada, principalmente se o tweet tiver
partido de um dispositivo móvel. Isso significa que
a opinião dos contribuintes em geral pode variar de
forma significativa conforme a região da cidade, e isso,
sim, pode servir de insumo prático para a ação local
do poder público.
As empresas consomem informações geográficas
normalmente em processos de suporte à operação,
para descrição, expansão, segmentação e otimização
do território de atuação.
No contexto do
big data analytics
, para ajudar a orga-
nizar as informações, os modelos estatísticos estão se
aprimorando para poderemabarcar as informações de
localização e outros predicados espaciais (pertinência,
conectividade e proximidade). Eessa é uma tendênciado
bigdata
analytics: ousode técnicasdeestatísticaespacial.
Muitos negócios podemse beneficiar dessas técnicas:
modelos tradicionais de previsão de renda e de crédito,
no segmentobancário enomercadofinanceiro emgeral;
modelosdegestãode riscoedesempenho, quequalificam
e analisam influências locais no aumento de risco para
seguradoras;eomercadoimobiliário,paraacorretagestão
de compra e venda de ativos e omapeamento de regiões,
visando a melhor precificação de imóveis, em um con-
texto emque a dinâmica urbana territorial é essencial.
O
big data
analytics temgrande potencial de investi-
gação sob a perspectiva geográfica, pela relevância que
essa natureza de informação teme pelo fato de que dis-
positivos móveis (comGPS ou outros sistemas de posi-
cionamento global) como
devices
de informação sãouma
realidade em regiões urbanas no mundo. O número de
celulares no Brasil já ultrapassou a população brasileira
— temos 272,6 milhões de assinaturas atualmente no
país, o que compreende 115% da população e representa
o quinto maior mercado de
mobile
no mundo.