Itens compartilhados de Juliano

Mostrando postagens com marcador tese. Mostrar todas as postagens
Mostrando postagens com marcador tese. Mostrar todas as postagens

sexta-feira, 2 de julho de 2010

Recebi alta! :)

Parece até gente... 아저씨...

Continuando a novela de ontem: notícias.

Recebi alta da banca examinadora! :)

Examinaram minha tese e disseram-me que, no meu caso, comparado com o do outro carinha que fez sua defesa hoje também, não será necessária uma segunda sessão. Minha tese está defendida e ponto.

Contanto, no entanto, entretando, todavia... tenho que fazer grandes correções tanto na estrutura da dissertação quanto no conteúdo. Nada de muito grave, mas que dará um certo trabalhinho. Tudo deverá estar pronto até no máximo em duas semanas, com uma versão de rascunho a ser entregue a meu orientador na próxima sexta.

O chefe(?) da banca (não me lembro qual a palavra que usamos em português para 위원장/委員長), o qual nunca é o orientador (o orientador é sempre o vice 부위원장/副委員長), primeiro me perguntou qual era a minha tese (pergunta mais do que retórica) ao que dei as explicações (em coreano!, apesar de ter escrito a tese em inglês). Em seguida ele me disse: então por que é que você escreveu isto, isso e aquilo aqui, ali e lá? Dei toda a razão a ele e disse-lhe que eu também havia pensado nisso, mas que não sabia exatamente o que fazer já que minha pesquisa era assim-assado e o achava que o que esperavam de mim era assado-assim. Explicando melhor. Meu curso é de linguística: linguística computacional. Minha pesquisa é sobre um programa de auxílio à pesquisa de língua natural focado em dados sobre a língua coreana. Tem a ver... mas é algo que as pessoas não fazem muito por aqui: produção de software. Por aqui o software é sempre secundário, até mesmo terciário, o importante é a hipótese levantada e a prova de que ela não seja refutada (pelo menos, não neste trabalho). O negócio é que minha tese era a criação de um programa (na verdade, uma biblioteca de software) que ajudará em futuras pesquisas linguísticas. Não tenho como apresentar experimentos, pelo menos não experimentos similares aos quais o pessoal daqui está acostumado. Meu programa está pronto, e há muito tempo, diga-se de passagem, mas os dados que ele necessita para poder funcionar ainda estão sendo processados e analizados. Com isso, não posso fazer milagre. Meu programa funciona, e bem (diga-se de passagem de novo), com o que ele tem e com o que ele terá assim que o trabalho de criação dos dados termine (o que levará muuuito tempo ainda, na minha opinião).

Voltando à vaca congelada, o chefe da banca me perguntou o seguinte: "Então, meu filho, por que é que, se você criou um programa para o auxílio à pesquisa linguística da língua coreana, você não escreveu detalhadamente sobre isso? Por que é que você não exemplicou o funcionamento do programa na sua tese? Por que é que não há menções do funcionamento técnico e nem capturas de tela do software? Nessa hora, eu quis virar para o meu (des)orientador e fazer uma cara bem feia (para não dizer que eu queria mesmo era esguelá-lo), e virar de volta ao chefe da banca e informar-lhe que fiz isso por orientação do (des)orientador. Este último me mandou escrever sobre a construção dos dados, sobre comparação dos dados por nós conseguidos com os dados de trabalhos anteriores, sobre o trabalho de checagem dos dados, sobre os resultados obtidos por outras pessoas que fizeram experimentos usando os dados... Enfim, ele me mandou escrever tudo o que não tinha muito a ver com a minha pesquisa em si. E, na hora da defesa, vem alguém com uma luz de sabedoria e me diz que eu estava certo e que deveria ter ficado nesse meu rumo mesmo.

Isso que disse sobre ter de ficar no rumo que eu estava seguindo é porque quando comecei a escrever minha tese de verdade, nos idos de abril, eu estava seguindo exatamente esse caminho. A explicação da minha pesquisa, do meu programa, do trabalho que eu havia vindo feito por mais de um ano (Quem acompanha o blogue sabe do que estou falando). E quando mostrei isso ao profe e em duas apresentações a pessoas do departamento, todos estes me disseram que isso não trazia quase nada de contribuição à pesquisa linguística, que era apenas um monte de software que ninguém nunca vai usar, perguntavam-me por que é que eu estava fazendo isso ao invés de fazer algo que prestasse... claro que não com essas mesmas palavras, mas com esse sentido. Eu me desanimei de forma absurda, não acreditava que iria ser possível escrever nada que prestasse já que o trabalho que eu havia vindo fazendo há mais de um ano não era bom o suficiente para o departamento de linguística, já tinha me conformado em ficar mais um semestre por aqui (sem bolsa e me virando!) para poder ter a chance de mudar meu tópico e descobrir algo que fosse de interesse... Foi aí quando "ele" me disse: "Tudo bem... É só escrever sobre isto aqui, deste jeito assim, que sai uma tese... Além disso, aproveita e pega os "dados" e descobre um jeito de fazer "assim-assim" com eles pra ver se dá pra fazer "um negócio assim"..." (Tradução literal de "seu" modo de falar.) E não é que eu ainda saí com mais coisa ainda pra fazer além do meu tópico inicial? Ele fez que fez para que eu botasse o raio dos dados no meio e escrever algo muito parecido com um artigo que ele já tinha escrito há um ano atrás. Me pareceu que o que ele queria uma confirmação desse artigo por meio da minha tese. Coisas estranhas.

De qualquer forma, agora, posso seguir meu rumo, o qual havia traçado há tempos, e que agora sei que era o rumo correto a seguir. Devo fazer minhas correções e acréscimos no período de uma semana, e ao fim de mais uma semana, receber o carimbo (literalmente, já que no oriente o carimbo é mais importante que a assinatura) de aprovação dos três componentes da banca. Daí é só partir pro abraço, imprimindo as teses e enviando os livros e o PDF para a biblioteca para poder ser registrada e publicada.

Alívio.

Mais notícias na semana que vem.

Hoje, agora, é só curtir o fim de semana sem preocupações e torcer para o Brasil na noite de hoje, 11 horas da noite, barzinho, amigos e... vitória da nossa seleção? Espero que sim! Senão vai ficar feio aqui pro meu lado, já que todo coreano que eu conheço vai ficar cobrando: "Pô! Mas é Brasil? Como é que foi perder???" Aí, Dunga! Me dá uma mão nessa aí, viu?

Abraços.

quarta-feira, 26 de agosto de 2009

Para quem ainda não entendeu minha pesquisa, aí vai uma explicação:

Pois é. Eu faço isso aqui embaixo, mas em coreano...

Análise de sentimentos é novo campo na web

Alex Wright
Computadores podem ser competentes no cálculo de números, mas será que conseguem calcular sentimentos?

» Vitória de Obama foi dia mais feliz para internautas

A ascensão dos blogs e redes sociais criou uma alta no mercado de opiniões pessoais: resenhas, classificações, recomendações e outras formas de expressão online. Para os cientistas da computação, essa montanha crescente de dados oferece um vislumbre fascinante da consciência coletiva dos usuários de internet.

Um campo emergente conhecido como análise de sentimentos está se desenvolvendo em torno de uma das fronteiras inexploradas do mundo da computação: traduzir as incertezas da emoção humana em forma de dados sólidos.

Isso é mais que apenas um exercício interessante de programação. Para muitas empresas, as opiniões online se transformaram em uma espécie de moeda virtual que pode determinar o sucesso ou fracasso de um produto no mercado.

Mas muitas empresas enfrentam dificuldades para compreender o burburinho de queixas e elogios que existem na internet com relação aos seus produtos. À medida que as ferramentas de análise de sentimentos começam a tomar forma, elas podem não só ajudar as empresas a melhorar sua lucratividade mas também resultar em uma transformação na maneira pela qual usuários buscam informações online.

Diversas novas empresas surgiram no ramo de análise de sentimentos e estão tentando aproveitar o crescente interesse empresarial por aquilo que se diz online.

"A mídia social costumava ser um projeto fofinho para consultores de 25 anos de idade", diz Margaret Francis, vice-presidente de produtos na Scout Labs, de San Francisco. Agora, ela diz, executivos importantes "a estão reconhecendo como um veio incrivelmente rico de informações de mercado".

A Scout Labs, que conta com capital do fundo de capital para empreendimentos criado por Halsey Minor, fundador da CNet, introduziu um serviço por assinatura que permite que seus clientes acompanhem blogs, artigos noticiosos e sites de redes sociais, para determinar tendências de opinião sobre produtos, serviços ou temas noticiosos.

No começo de maio, o StubHub, um serviço online de venda de ingressos, usou a ferramenta de monitoração da Scout Labs a fim de identificar um sentimento negativo súbito que surgiu na Web depois que a chuva forçou o adiamento de uma partida de beisebol entre o New York Yankees e o Boston Red Sox.

Funcionários do estádio informaram erroneamente a centenas de torcedores que o jogo havia sido cancelado, e a StubHub negou os pedidos de restituição de dinheiro dos espectadores, alegando que o jogo havia sido realizado. Mas, depois de perceber o começo de uma tendência negativa na Internet, a empresa ofereceu descontos e créditos aos torcedores afetados pelos problemas, e está reavaliando suas normas quanto a eventos cancelados devido ao mau tempo.

"Para nós, o serviço serviu como primeiro alerta", disse John Whelan, diretor de atendimento ao consumidor da StubHub.

A Jodange, de Yonkers, Nova York, oferece um serviço dirigido a editoras online, que permite a elas incorporar correntes de opinião extraídas de mais de 450 mil fontes, entre as quais empresas noticiosas convencionais, blogs e o Twitter.

Com base em pesquisa de Claire Cardie, ex-professora de Ciência da Computação, e Jan Wiebe, da Universidade de Pittsburgh, o serviço utiliza um sofisticado algoritmo que não só avalia os sentimentos sobre assuntos específicos como também identifica os formadores de opinião mais influentes.

A Jodange, que inclui entre seus investidores iniciais a Fundação Nacional de Ciências dos Estados Unidos, está desenvolvendo um novo algoritmo que poderia usar dados de opinião a fim de prever futuros desdobramentos, como o efeito de editorais de jornal sobre os preços das ações de uma empresa.

Com intenções semelhantes, o jornal Financial Times introduziu em março o "Newssift", programa experimental que rastreia os sentimentos quanto a assuntos empresariais que surjam nas notícias, acoplado a um serviço especializado de buscas que organiza as buscas por tópico, instituição, local, pessoa e tema.

Usando o Newssift, uma busca pelo termo "Wal-Mart" revela que nas últimas semanas o sentimento sobre a empresa vem sendo favorável à razão de dois para um ou pouco melhor. Caso a busca seja refinada com o acréscimo do termo "força de trabalho e sindicatos", no entanto, a relação entre opiniões positivas e negativas cai para perto de um para um.

Ferramentas como essas podem ajudar empresas a identificar o efeito de questões específicas sobre o comportamento dos consumidores, ajudando-as a responder com medidas de marketing e estratégias de relações públicas apropriadas.

Embora os algoritmos avançados da Scout Labs, Jodange e Newssift utilizem métodos avançados, nenhum dos serviços funciona com perfeição. Francis afirma que "nosso algoritmo tem precisão da ordem de 70% a 80%", acrescentando que os usuários podem reclassificar resultados manualmente, o que permite que o sistema aprenda com seus erros.

Mas traduzir a escorregadia linguagem humana para valores binários será sempre uma ciência inexata. "Sentimentos são muito diferentes dos fatos convencionais", disse Seth Grimes, fundador da consultoria Alta Plana. Ele aponta para diversos fatores culturais e nuanças linguísticas que tornam difícil transformar textos escritos em uma simples classificação de "pró" e "contra". Por exemplo, "um pecado" é termo elogioso se o objeto do texto é um bolo de chocolate, ele diz.

Os algoritmos mais simples trabalham analisando palavras-chave que podem caracterizar uma declaração como positiva ou negativa - "amor" é positivo, "ódio" é negativo. Mas essa abordagem não conseguem capturar as sutilezas que iluminam a linguagem humana: ironia, sarcasmo, gírias e outras formas de expressão. A análise confiável de sentimentos requer a capacidade de distinguir entre múltiplos tons de cinza.

"Lidamos com sentimentos que podem ser expressos de forma sutil", diz Bo Pang, pesquisador do Yahoo e especialista em análise de sentimentos. Ele desenvolveu um software que inclui diversos filtros de polaridade, intensidade e subjetividade.

Por exemplo, presença forte de adjetivos muitas vezes sinaliza alta subjetividade, enquanto mais substantivos e verbos tendem a indicar uma maior neutralidade.

Pang quer criar um serviço de busca que ordene resultados com base em sentimentos - isso poderia afetar a ordem de retornos em buscas como "melhor hotel de San Antonio".

Com a incorporação de mais dados de opinião aos resultados de busca, a distinção entre fato e opinião pode começar a se perder, até o momento em que, como afirmou David Byrne em uma canção, "os fatos todos venham equipados com pontos de vista".

Tradução: Paulo Migliacci ME

Fonte: terra

Pesquisar em blogues de brasileiros na Coreia

Resultado da pesquisa