Background Image
Table of Contents Table of Contents
Previous Page  55 / 176 Next Page
Information
Show Menu
Previous Page 55 / 176 Next Page
Page Background

setembro/outubrode2014|

RevistadaESPM

55

comentários de usuários seguidores, analisar o perfil,

interpretar de forma automática um comando de voz

feitopor umcliente emuma ligaçãono call center, inferir

como está o trânsito de uma determinada via a partir de

imagens sequenciais, suspeitar sobre o trajeto de uma

pessoa no estacionamento de um shopping center etc.

Tudoissocomplementaanálisesmaistradicionalmente

realizadas pelas empresas, que envolvemdados estrutu-

rados: cadastrodeclientes, transaçõescomerciais,CRMs,

informações bancárias, por exemplo. Dados mantidos

nos tradicionais sistemas gerenciadores de bancos de

dados (RDBMSs, na sigla em inglês), normalmente em

modelos relacionais similares ao proposto por Edgar F.

Codd, em1969, pesquisador da IBM. Atualmente, esses

dados já não dão conta de toda a necessidade informa-

cional que umexecutivo emuma empresa precisa para

dar segurança às suas decisões. E por isso os dados não

estruturados são cada vez mais necessários.

Alémdestes três “Vs” (volume, velocidade evariedade),

muitos adicionam, ainda, o quesito veracidade como

uma das características do

big data

, que se traduz em

“como realmente confiar nas informações que se utili-

zampara a tomada de decisão nas organizações”. Mais

de 90% dos executivos acreditam que o conhecimento

podesermaisbemaproveitado. Issoporqueapenas1%dos

dados corporativos é usado, efetivamente, para análise

nas grandes corporações. Logo, cerca de 90% das estra-

tégias corporativas fracassam. Adiciona-se a isso o fato

de que não conseguimos controlar as informações que

consultamos na internet — não sabemos se há notícias

falsas ou verdadeiras transitando, e comodiferenciá-las.

Averacidade se confunde comoquinto “V” do

big data

:

valor. Qual é o valor real que conseguimos adicionar aos

negócios quando trabalhamos no contexto do

big data

?

Comoinferirrelevânciaemumavastidãodeinformações?

Como saber, em uma busca de informações no Google,

que traz 538mil referências, quais realmente sãoasmais

relevantes para mim? Nem sempre as mais referencia-

das (que se encontramno topo “não promocional” da sua

lista de respostas) são as que realmenteme beneficiarão.

A tecnologia que suporta o

big data

, atualmente, deve

cuidar dedois grandesprocessos: oqueorganizaoacesso

a essas informações e o que organiza a análise das infor-

mações — essa tambémconhecida como analytics ou

big

data analytics

.

Armazenar os dados do

big data

não é uma tarefa fácil

—eles estãoconvivendoe se reinventandoa todo instante

na já famosa

cloud

. E talvez não sejamuito inteligente, ou

pelomenos é altamente custoso tentar replicá-lo estru-

turalmente emalgumoutro lugar da redemundial. Como

os peta, exa e zettabytes de dados são tipicamente não

estruturados, os bancos de dados batizados de NoSQL

(contração de “

Not only SQL

”) permitiramque os dados

fossem organizados ou pelo menos referenciados.

Oartifício técnico que permitiu que os dados continu-

assemonde estão e fossemrapidamente consultados foi

o algoritmo denominado MapReduce, que baseia, atu-

almente, o buscador do Google. Ele é composto de duas

Emumminuto, awebmovimenta 204

milhões de e-mails,mais de 2milhões de

consultas no google.com, 278mil tweets

e 1,8milhãode curtidas noFacebook

shutterstock

latinstock