setembro/outubrode2014|
RevistadaESPM
55
comentários de usuários seguidores, analisar o perfil,
interpretar de forma automática um comando de voz
feitopor umcliente emuma ligaçãono call center, inferir
como está o trânsito de uma determinada via a partir de
imagens sequenciais, suspeitar sobre o trajeto de uma
pessoa no estacionamento de um shopping center etc.
Tudoissocomplementaanálisesmaistradicionalmente
realizadas pelas empresas, que envolvemdados estrutu-
rados: cadastrodeclientes, transaçõescomerciais,CRMs,
informações bancárias, por exemplo. Dados mantidos
nos tradicionais sistemas gerenciadores de bancos de
dados (RDBMSs, na sigla em inglês), normalmente em
modelos relacionais similares ao proposto por Edgar F.
Codd, em1969, pesquisador da IBM. Atualmente, esses
dados já não dão conta de toda a necessidade informa-
cional que umexecutivo emuma empresa precisa para
dar segurança às suas decisões. E por isso os dados não
estruturados são cada vez mais necessários.
Alémdestes três “Vs” (volume, velocidade evariedade),
muitos adicionam, ainda, o quesito veracidade como
uma das características do
big data
, que se traduz em
“como realmente confiar nas informações que se utili-
zampara a tomada de decisão nas organizações”. Mais
de 90% dos executivos acreditam que o conhecimento
podesermaisbemaproveitado. Issoporqueapenas1%dos
dados corporativos é usado, efetivamente, para análise
nas grandes corporações. Logo, cerca de 90% das estra-
tégias corporativas fracassam. Adiciona-se a isso o fato
de que não conseguimos controlar as informações que
consultamos na internet — não sabemos se há notícias
falsas ou verdadeiras transitando, e comodiferenciá-las.
Averacidade se confunde comoquinto “V” do
big data
:
valor. Qual é o valor real que conseguimos adicionar aos
negócios quando trabalhamos no contexto do
big data
?
Comoinferirrelevânciaemumavastidãodeinformações?
Como saber, em uma busca de informações no Google,
que traz 538mil referências, quais realmente sãoasmais
relevantes para mim? Nem sempre as mais referencia-
das (que se encontramno topo “não promocional” da sua
lista de respostas) são as que realmenteme beneficiarão.
A tecnologia que suporta o
big data
, atualmente, deve
cuidar dedois grandesprocessos: oqueorganizaoacesso
a essas informações e o que organiza a análise das infor-
mações — essa tambémconhecida como analytics ou
big
data analytics
.
Armazenar os dados do
big data
não é uma tarefa fácil
—eles estãoconvivendoe se reinventandoa todo instante
na já famosa
cloud
. E talvez não sejamuito inteligente, ou
pelomenos é altamente custoso tentar replicá-lo estru-
turalmente emalgumoutro lugar da redemundial. Como
os peta, exa e zettabytes de dados são tipicamente não
estruturados, os bancos de dados batizados de NoSQL
(contração de “
Not only SQL
”) permitiramque os dados
fossem organizados ou pelo menos referenciados.
Oartifício técnico que permitiu que os dados continu-
assemonde estão e fossemrapidamente consultados foi
o algoritmo denominado MapReduce, que baseia, atu-
almente, o buscador do Google. Ele é composto de duas
Emumminuto, awebmovimenta 204
milhões de e-mails,mais de 2milhões de
consultas no google.com, 278mil tweets
e 1,8milhãode curtidas noFacebook
shutterstock
latinstock