Análise de sentimentos é novo campo na web
Alex Wright
Computadores podem ser competentes no cálculo de números, mas será que conseguem calcular sentimentos?
» Vitória de Obama foi dia mais feliz para internautas
A ascensão dos blogs e redes sociais criou uma alta no mercado de opiniões pessoais: resenhas, classificações, recomendações e outras formas de expressão online. Para os cientistas da computação, essa montanha crescente de dados oferece um vislumbre fascinante da consciência coletiva dos usuários de internet.
Um campo emergente conhecido como análise de sentimentos está se desenvolvendo em torno de uma das fronteiras inexploradas do mundo da computação: traduzir as incertezas da emoção humana em forma de dados sólidos.
Isso é mais que apenas um exercício interessante de programação. Para muitas empresas, as opiniões online se transformaram em uma espécie de moeda virtual que pode determinar o sucesso ou fracasso de um produto no mercado.
Mas muitas empresas enfrentam dificuldades para compreender o burburinho de queixas e elogios que existem na internet com relação aos seus produtos. À medida que as ferramentas de análise de sentimentos começam a tomar forma, elas podem não só ajudar as empresas a melhorar sua lucratividade mas também resultar em uma transformação na maneira pela qual usuários buscam informações online.
Diversas novas empresas surgiram no ramo de análise de sentimentos e estão tentando aproveitar o crescente interesse empresarial por aquilo que se diz online.
"A mídia social costumava ser um projeto fofinho para consultores de 25 anos de idade", diz Margaret Francis, vice-presidente de produtos na Scout Labs, de San Francisco. Agora, ela diz, executivos importantes "a estão reconhecendo como um veio incrivelmente rico de informações de mercado".
A Scout Labs, que conta com capital do fundo de capital para empreendimentos criado por Halsey Minor, fundador da CNet, introduziu um serviço por assinatura que permite que seus clientes acompanhem blogs, artigos noticiosos e sites de redes sociais, para determinar tendências de opinião sobre produtos, serviços ou temas noticiosos.
No começo de maio, o StubHub, um serviço online de venda de ingressos, usou a ferramenta de monitoração da Scout Labs a fim de identificar um sentimento negativo súbito que surgiu na Web depois que a chuva forçou o adiamento de uma partida de beisebol entre o New York Yankees e o Boston Red Sox.
Funcionários do estádio informaram erroneamente a centenas de torcedores que o jogo havia sido cancelado, e a StubHub negou os pedidos de restituição de dinheiro dos espectadores, alegando que o jogo havia sido realizado. Mas, depois de perceber o começo de uma tendência negativa na Internet, a empresa ofereceu descontos e créditos aos torcedores afetados pelos problemas, e está reavaliando suas normas quanto a eventos cancelados devido ao mau tempo.
"Para nós, o serviço serviu como primeiro alerta", disse John Whelan, diretor de atendimento ao consumidor da StubHub.
A Jodange, de Yonkers, Nova York, oferece um serviço dirigido a editoras online, que permite a elas incorporar correntes de opinião extraídas de mais de 450 mil fontes, entre as quais empresas noticiosas convencionais, blogs e o Twitter.
Com base em pesquisa de Claire Cardie, ex-professora de Ciência da Computação, e Jan Wiebe, da Universidade de Pittsburgh, o serviço utiliza um sofisticado algoritmo que não só avalia os sentimentos sobre assuntos específicos como também identifica os formadores de opinião mais influentes.
A Jodange, que inclui entre seus investidores iniciais a Fundação Nacional de Ciências dos Estados Unidos, está desenvolvendo um novo algoritmo que poderia usar dados de opinião a fim de prever futuros desdobramentos, como o efeito de editorais de jornal sobre os preços das ações de uma empresa.
Com intenções semelhantes, o jornal Financial Times introduziu em março o "Newssift", programa experimental que rastreia os sentimentos quanto a assuntos empresariais que surjam nas notícias, acoplado a um serviço especializado de buscas que organiza as buscas por tópico, instituição, local, pessoa e tema.
Usando o Newssift, uma busca pelo termo "Wal-Mart" revela que nas últimas semanas o sentimento sobre a empresa vem sendo favorável à razão de dois para um ou pouco melhor. Caso a busca seja refinada com o acréscimo do termo "força de trabalho e sindicatos", no entanto, a relação entre opiniões positivas e negativas cai para perto de um para um.
Ferramentas como essas podem ajudar empresas a identificar o efeito de questões específicas sobre o comportamento dos consumidores, ajudando-as a responder com medidas de marketing e estratégias de relações públicas apropriadas.
Embora os algoritmos avançados da Scout Labs, Jodange e Newssift utilizem métodos avançados, nenhum dos serviços funciona com perfeição. Francis afirma que "nosso algoritmo tem precisão da ordem de 70% a 80%", acrescentando que os usuários podem reclassificar resultados manualmente, o que permite que o sistema aprenda com seus erros.
Mas traduzir a escorregadia linguagem humana para valores binários será sempre uma ciência inexata. "Sentimentos são muito diferentes dos fatos convencionais", disse Seth Grimes, fundador da consultoria Alta Plana. Ele aponta para diversos fatores culturais e nuanças linguísticas que tornam difícil transformar textos escritos em uma simples classificação de "pró" e "contra". Por exemplo, "um pecado" é termo elogioso se o objeto do texto é um bolo de chocolate, ele diz.
Os algoritmos mais simples trabalham analisando palavras-chave que podem caracterizar uma declaração como positiva ou negativa - "amor" é positivo, "ódio" é negativo. Mas essa abordagem não conseguem capturar as sutilezas que iluminam a linguagem humana: ironia, sarcasmo, gírias e outras formas de expressão. A análise confiável de sentimentos requer a capacidade de distinguir entre múltiplos tons de cinza.
"Lidamos com sentimentos que podem ser expressos de forma sutil", diz Bo Pang, pesquisador do Yahoo e especialista em análise de sentimentos. Ele desenvolveu um software que inclui diversos filtros de polaridade, intensidade e subjetividade.
Por exemplo, presença forte de adjetivos muitas vezes sinaliza alta subjetividade, enquanto mais substantivos e verbos tendem a indicar uma maior neutralidade.
Pang quer criar um serviço de busca que ordene resultados com base em sentimentos - isso poderia afetar a ordem de retornos em buscas como "melhor hotel de San Antonio".
Com a incorporação de mais dados de opinião aos resultados de busca, a distinção entre fato e opinião pode começar a se perder, até o momento em que, como afirmou David Byrne em uma canção, "os fatos todos venham equipados com pontos de vista".
Tradução: Paulo Migliacci ME
Fonte: terra
Minha vida na Coréia: mestrado, viagens, enfim, meus pensamentos com muito café e kimchi. ^^
Itens compartilhados de Juliano
quarta-feira, 26 de agosto de 2009
Para quem ainda não entendeu minha pesquisa, aí vai uma explicação:
Pois é. Eu faço isso aqui embaixo, mas em coreano...
Assinar:
Postar comentários (Atom)
Um comentário:
Ah, agora entendi. Sua pesquisa vai tornar o Futurama possível! :D
Postar um comentário