Análise de sentimentos é novo campo na web
Alex Wright
Computadores podem ser competentes no cálculo de números, mas será que conseguem calcular sentimentos?
» Vitória de Obama foi dia mais feliz para internautas
A ascensão dos blogs e redes sociais criou uma alta no mercado de opiniões pessoais: resenhas, classificações, recomendações e outras formas de expressão online. Para os cientistas da computação, essa montanha crescente de dados oferece um vislumbre fascinante da consciência coletiva dos usuários de internet.
Um campo emergente conhecido como análise de sentimentos está se desenvolvendo em torno de uma das fronteiras inexploradas do mundo da computação: traduzir as incertezas da emoção humana em forma de dados sólidos.
Isso é mais que apenas um exercício interessante de programação. Para muitas empresas, as opiniões online se transformaram em uma espécie de moeda virtual que pode determinar o sucesso ou fracasso de um produto no mercado.
Mas muitas empresas enfrentam dificuldades para compreender o burburinho de queixas e elogios que existem na internet com relação aos seus produtos. À medida que as ferramentas de análise de sentimentos começam a tomar forma, elas podem não só ajudar as empresas a melhorar sua lucratividade mas também resultar em uma transformação na maneira pela qual usuários buscam informações online.
Diversas novas empresas surgiram no ramo de análise de sentimentos e estão tentando aproveitar o crescente interesse empresarial por aquilo que se diz online.
"A mídia social costumava ser um projeto fofinho para consultores de 25 anos de idade", diz Margaret Francis, vice-presidente de produtos na Scout Labs, de San Francisco. Agora, ela diz, executivos importantes "a estão reconhecendo como um veio incrivelmente rico de informações de mercado".
A Scout Labs, que conta com capital do fundo de capital para empreendimentos criado por Halsey Minor, fundador da CNet, introduziu um serviço por assinatura que permite que seus clientes acompanhem blogs, artigos noticiosos e sites de redes sociais, para determinar tendências de opinião sobre produtos, serviços ou temas noticiosos.
No começo de maio, o StubHub, um serviço online de venda de ingressos, usou a ferramenta de monitoração da Scout Labs a fim de identificar um sentimento negativo súbito que surgiu na Web depois que a chuva forçou o adiamento de uma partida de beisebol entre o New York Yankees e o Boston Red Sox.
Funcionários do estádio informaram erroneamente a centenas de torcedores que o jogo havia sido cancelado, e a StubHub negou os pedidos de restituição de dinheiro dos espectadores, alegando que o jogo havia sido realizado. Mas, depois de perceber o começo de uma tendência negativa na Internet, a empresa ofereceu descontos e créditos aos torcedores afetados pelos problemas, e está reavaliando suas normas quanto a eventos cancelados devido ao mau tempo.
"Para nós, o serviço serviu como primeiro alerta", disse John Whelan, diretor de atendimento ao consumidor da StubHub.
A Jodange, de Yonkers, Nova York, oferece um serviço dirigido a editoras online, que permite a elas incorporar correntes de opinião extraídas de mais de 450 mil fontes, entre as quais empresas noticiosas convencionais, blogs e o Twitter.
Com base em pesquisa de Claire Cardie, ex-professora de Ciência da Computação, e Jan Wiebe, da Universidade de Pittsburgh, o serviço utiliza um sofisticado algoritmo que não só avalia os sentimentos sobre assuntos específicos como também identifica os formadores de opinião mais influentes.
A Jodange, que inclui entre seus investidores iniciais a Fundação Nacional de Ciências dos Estados Unidos, está desenvolvendo um novo algoritmo que poderia usar dados de opinião a fim de prever futuros desdobramentos, como o efeito de editorais de jornal sobre os preços das ações de uma empresa.
Com intenções semelhantes, o jornal Financial Times introduziu em março o "Newssift", programa experimental que rastreia os sentimentos quanto a assuntos empresariais que surjam nas notícias, acoplado a um serviço especializado de buscas que organiza as buscas por tópico, instituição, local, pessoa e tema.
Usando o Newssift, uma busca pelo termo "Wal-Mart" revela que nas últimas semanas o sentimento sobre a empresa vem sendo favorável à razão de dois para um ou pouco melhor. Caso a busca seja refinada com o acréscimo do termo "força de trabalho e sindicatos", no entanto, a relação entre opiniões positivas e negativas cai para perto de um para um.
Ferramentas como essas podem ajudar empresas a identificar o efeito de questões específicas sobre o comportamento dos consumidores, ajudando-as a responder com medidas de marketing e estratégias de relações públicas apropriadas.
Embora os algoritmos avançados da Scout Labs, Jodange e Newssift utilizem métodos avançados, nenhum dos serviços funciona com perfeição. Francis afirma que "nosso algoritmo tem precisão da ordem de 70% a 80%", acrescentando que os usuários podem reclassificar resultados manualmente, o que permite que o sistema aprenda com seus erros.
Mas traduzir a escorregadia linguagem humana para valores binários será sempre uma ciência inexata. "Sentimentos são muito diferentes dos fatos convencionais", disse Seth Grimes, fundador da consultoria Alta Plana. Ele aponta para diversos fatores culturais e nuanças linguísticas que tornam difícil transformar textos escritos em uma simples classificação de "pró" e "contra". Por exemplo, "um pecado" é termo elogioso se o objeto do texto é um bolo de chocolate, ele diz.
Os algoritmos mais simples trabalham analisando palavras-chave que podem caracterizar uma declaração como positiva ou negativa - "amor" é positivo, "ódio" é negativo. Mas essa abordagem não conseguem capturar as sutilezas que iluminam a linguagem humana: ironia, sarcasmo, gírias e outras formas de expressão. A análise confiável de sentimentos requer a capacidade de distinguir entre múltiplos tons de cinza.
"Lidamos com sentimentos que podem ser expressos de forma sutil", diz Bo Pang, pesquisador do Yahoo e especialista em análise de sentimentos. Ele desenvolveu um software que inclui diversos filtros de polaridade, intensidade e subjetividade.
Por exemplo, presença forte de adjetivos muitas vezes sinaliza alta subjetividade, enquanto mais substantivos e verbos tendem a indicar uma maior neutralidade.
Pang quer criar um serviço de busca que ordene resultados com base em sentimentos - isso poderia afetar a ordem de retornos em buscas como "melhor hotel de San Antonio".
Com a incorporação de mais dados de opinião aos resultados de busca, a distinção entre fato e opinião pode começar a se perder, até o momento em que, como afirmou David Byrne em uma canção, "os fatos todos venham equipados com pontos de vista".
Tradução: Paulo Migliacci ME
Fonte: terra
Minha vida na Coréia: mestrado, viagens, enfim, meus pensamentos com muito café e kimchi. ^^
Itens compartilhados de Juliano
Mostrando postagens com marcador tecnologia. Mostrar todas as postagens
Mostrando postagens com marcador tecnologia. Mostrar todas as postagens
quarta-feira, 26 de agosto de 2009
Para quem ainda não entendeu minha pesquisa, aí vai uma explicação:
Pois é. Eu faço isso aqui embaixo, mas em coreano...
terça-feira, 16 de setembro de 2008
Ai, ai, Brasil, Brasil...
15/09/2008 - 10h50
Banda larga no Brasil é uma das piores do mundo
da Folha de S.Paulo
A qualidade da internet banda larga (rápida) no Brasil está entre as piores no mundo e é insuficiente para atender as necessidades dos usuários que usam hoje os aplicativos da web. Segundo estudo com 42 países, a internet brasileira só é melhor que o serviço de quatro nações. Somente Chipre, México, Índia e China oferecem um serviço inferior ao brasileiro.
A internet rápida no Brasil não é considerada adequada hoje para ver vídeos em sites como YouTube, baixar pequenos arquivos e navegar pela rede, mostra a pesquisa feita para a Cisco pelas universidades de Oxford (Reino Unido) e Oviedo (Espanha). O estudo, publicado ontem no exterior, deve ser divulgado com mais detalhes sobre o Brasil na segunda-feira.
A pesquisa leva em conta a velocidade do acesso, os atrasos na rede e a perda de dados e, a partir desses dados, dá uma nota para o serviço de banda larga de cada país. "Nós estamos olhando para a qualidade, não para a penetração", afirmou, em nota, Fernando Gil de Bernabé, diretor da Cisco.
O estudo afirma, por exemplo, que a velocidade mínima adequada para baixar arquivos na internet é de 3,75 Mbps (megabits por segundo). No Brasil, pesquisa da própria Cisco, considera banda larga a internet com velocidade de 128 kbps (muito inferior ao desejado). O levantamento mais recente da empresa diz que existiam 10 milhões de conexões de alta velocidade no Brasil no final de junho, 48,3% mais que no mesmo período do ano passado.
De acordo com os pesquisadores, a internet em um período de três a cinco anos exigirá uma velocidade de download ainda maior, de pelo menos 11,25 Mbps, para que o usuário consiga ter boa qualidade ao assistir a vídeos de alta definição, por exemplo.
"As velocidades médias de download são adequadas [em 23 países] para navegar pela rede, trocar e-mails e para baixar e fazer "streaming" [transmissão direta pela internet] de vídeos básicos, mas estamos vendo cada vez mais aplicativos interativos, mais conteúdo gerado pelos usuários sendo colocado na rede e compartilhado, e uma quantidade crescente de serviços de vídeos de alta qualidade tornada disponível", afirmou Alastair Nicholson, pesquisador de Oxford.
Pela pesquisa, somente o Japão --que tem o melhor serviço no momento-- já tem uma internet com qualidade suficiente para atender as necessidades dos usuários daqui a cinco anos. Depois da internet japonesa, os melhores serviços são oferecidos por Suécia, Holanda e Estônia. Outro país báltico, a Lituânia, aparece na sétima colocação no levantamento.
Banda larga no Brasil é uma das piores do mundo
da Folha de S.Paulo
A qualidade da internet banda larga (rápida) no Brasil está entre as piores no mundo e é insuficiente para atender as necessidades dos usuários que usam hoje os aplicativos da web. Segundo estudo com 42 países, a internet brasileira só é melhor que o serviço de quatro nações. Somente Chipre, México, Índia e China oferecem um serviço inferior ao brasileiro.
A internet rápida no Brasil não é considerada adequada hoje para ver vídeos em sites como YouTube, baixar pequenos arquivos e navegar pela rede, mostra a pesquisa feita para a Cisco pelas universidades de Oxford (Reino Unido) e Oviedo (Espanha). O estudo, publicado ontem no exterior, deve ser divulgado com mais detalhes sobre o Brasil na segunda-feira.
A pesquisa leva em conta a velocidade do acesso, os atrasos na rede e a perda de dados e, a partir desses dados, dá uma nota para o serviço de banda larga de cada país. "Nós estamos olhando para a qualidade, não para a penetração", afirmou, em nota, Fernando Gil de Bernabé, diretor da Cisco.
O estudo afirma, por exemplo, que a velocidade mínima adequada para baixar arquivos na internet é de 3,75 Mbps (megabits por segundo). No Brasil, pesquisa da própria Cisco, considera banda larga a internet com velocidade de 128 kbps (muito inferior ao desejado). O levantamento mais recente da empresa diz que existiam 10 milhões de conexões de alta velocidade no Brasil no final de junho, 48,3% mais que no mesmo período do ano passado.
De acordo com os pesquisadores, a internet em um período de três a cinco anos exigirá uma velocidade de download ainda maior, de pelo menos 11,25 Mbps, para que o usuário consiga ter boa qualidade ao assistir a vídeos de alta definição, por exemplo.
"As velocidades médias de download são adequadas [em 23 países] para navegar pela rede, trocar e-mails e para baixar e fazer "streaming" [transmissão direta pela internet] de vídeos básicos, mas estamos vendo cada vez mais aplicativos interativos, mais conteúdo gerado pelos usuários sendo colocado na rede e compartilhado, e uma quantidade crescente de serviços de vídeos de alta qualidade tornada disponível", afirmou Alastair Nicholson, pesquisador de Oxford.
Pela pesquisa, somente o Japão --que tem o melhor serviço no momento-- já tem uma internet com qualidade suficiente para atender as necessidades dos usuários daqui a cinco anos. Depois da internet japonesa, os melhores serviços são oferecidos por Suécia, Holanda e Estônia. Outro país báltico, a Lituânia, aparece na sétima colocação no levantamento.
Assinar:
Postagens (Atom)