Revista da ESPM
| setembro/outubrode 2014
18
panorama
Outros detalhes dessa arquitetura estão disponíveis
no artigo
Building Watson: an overview of the DeepQA
Project
, de David Ferrucci e colaboradores. Ferrucci é
tido como o cientista que liderou o projeto de pesquisa
que resultou no Sistema Watson, assim denominado
emhomenagemao fundador da IBM, Thomas J. Watson.
Desde os resultados bem-sucedidos no Jeopardy, um
processo evolutivo de aproveitamento comercial da
computação cognitiva foi conduzidona IBM. Até que, em
janeirode2014, foi anunciadaacriaçãodoWatsonGroup,
uma divisão dedicada exclusivamente à comercializa-
ção das soluções de computação cognitiva ao abrigo da
marcaWatson.
Como funciona a computação cognitiva?
No segmentodestinadoà explicaçãodoque sejaumdado
estruturado e um dado desestruturado, procuramos
deixar claro que a quantidade de dados e informações
acumulados nomundo todo cresce exponencialmente,
eprincipalmente, àcustadocomponentedesestruturado
— ou incerto, como prefere a literatura inglesa. A neces-
sidade de se explorar essa nova massa de dados para
extrair dela a informação sobre a qual nasce o conhe-
cimento, exigia uma nova abordagem para a cognição.
Assim, usandoelementosdeumaáreadaTI denominada
deAprendizado deMáquina —que inclui processamento
semântico —, é possível fazer com que um computador
seja capaz demanipular um texto e extrair dele respos-
tas a perguntas específicas. Exatamente como faria um
ser humano. No entanto, note que enquanto o aumento
da velocidade de leitura e absorção de um ser humano
é limitado, a máquina amplia a sua capacidade de “lei-
tura” quase que sem limites. É verdade que, para poder
“ler” e “entender” um texto, ele deverá ter certasmarca-
ções que irão facilitar para a máquina a identificação,
por exemplo, do que é o sujeito, o predicado e o comple-
mento de uma determinada frase. Tambémé necessário
que essa frase esteja em um texto que tenha começo e
fim. Portanto, algum grau de organização.
A esse textominimamente organizado, dá-se o nome
de
corpus
. E se o
corpus
contém marcações facilita-
doras para a identificação sintática do seu conteúdo,
ele receberá o nome de
corpus
anotado. As marcações
podemser feitas pormeio de “tags” — etiquetas, jámuito
CONHECIMENTO
| Arquitetura simplificada – de alto nível –
do Sistema ”Deep Q’s & A’s” usado no programa de tv jeopardy
Evidence
sources
Support
evidence
retrieval
Trained
models
Primary
search
Synthesis
Finalmerging
andranking
Sort
filtering
Sort
filtering
Candidate
answer
generation
Deep
evidence
scoring
Question
Answerand
confidence
Query
decomposition
Question
analysis
Hypothesis
generation
Hypothesis
generation
Hypothesisand
evidencescoring
Hypothesisand
evidencescoring
Answer
sources