Itens compartilhados de Juliano

quarta-feira, 26 de novembro de 2008

Gente do céu!

Que coisa de louco! Os finais de semestre estão ficando cada vez mais apertados por aqui.
Estamos com um projeto novo desde setembro, como já havia comentado no post anterior, e hoje apareceu mais um, e este é só para mim: os coreanos estão fazendo um corpus multi-lingüístico e precisam de alguém para fazer a parte do português. Ainda não tenho detalhes de nada, acabei de mandar meu curriculinho para eles e nem sei se vou ser aceito, mas tudo foi feito no mais típico modelo coreano: ppalli-ppalli. Meu professor falou comigo sobre isso do nada hoje pouco antes das 7 da noite, falei que poderia fazer, ele ligou (ou escreveu) para o sujeito encarregado disso e o sujeito me mandou um e-mail explicando que eu teria que mandar um currículo até amanhã às 8 da manhã. Do nada se fez o tudo, como é de praxe aqui na Terra da Manhã Tranqüila (o que é a única coisa tranqüila que tem no país, o apelido do próprio, só).
Pois bem, além disso, ele ainda me disse que conseguiu um analisador morfológico (morphological parser) escrito em Java e que era pra eu dar uma olhada de como botar o trem pra andar, já que o parser que estamos usando não está funcionando tão bem quanto deveria. Eles conseguiram um projeto open-source de um parser cujo desenvolvedor sumiu em 2006 e nunca mais entrou em sua página depois disso e nem terminou o programa que estava desenvolvendo. Mesmo assim, eu me virei e acabei botando o treco pra funcionar e até fiz uma "roumepeigizinha" pra ele no servidor aqui do laboratório. Se alguém quiser ver o negócio funcionando (ou não... depende do que for escrito pra ele analisar... só funciona com coreano tá?), pode dar uma passada no seguinte endereço: http://word.snu.ac.kr/kts ou clique aqui. Se não tiver o que escrever, pode só copiar e colar o que está escrito acima da caixa de texto e clicar no botão que ele faz o resto.
Além disso, se tiver alguém interessado, acho que vou colocar um outro programinha que fiz que faz a transliteração das letrinhas coreanas. Isso fica muito aquém do que é realmente pronunciado, já que é apenas uma transliteração (representação fonológica) e não uma representação fonética do que é realmente pronunciado. De qualquer forma, se der certo, esse programinha ficará em http://word.snu.ac.kr/han2alph ou aqui.

Como não posso escrever muito, vou deixá-los por aqui.

Um abraço,
Juliano

segunda-feira, 3 de novembro de 2008

Kimchi com Café de volta com a programação normal

Pois bem... Tem muita gente que está me cobrando (e já faz tempo) por que é que eu não estou mais escrevendo no blog. E alguns destes já até deram a resposta e acertaram: eu estou hiper-ocupado.

Desde que escrevi pela última vez, minha vida acadêmica se tornou um inferno na terra quanto a "tempo". Nosso professor inventou de fazer um grupo de estudos, juntamente com o professor de semântica, para criar um sistema baseado no TARSQI (Temporal Awareness and Reasoning Systems for Question Interpretation; em tradução mais do que livre: Sistemas de Reconhecimento e Raciocínio Temporal para Interpretação de Perguntas) dos EUA. Esse sistema TARSQI, pra encurtar a história, é um sistema de programas que lêem textos e conseguem encontrar, marcar e relacionar (quase) toda a informação temporal contida nos textos e ajudar a formar um sistema maior de perguntas e respostas automatizado. (Se não fizer muito sentido, não tem problema...)

Com isso, nós nos reunimos uma vez por semana para discutir nosso progresso e marcar metas para a próxima reunião da semana vindoura. A mim me coube a reconstrução e o retrofite (gambiarra) do programa que lida com a língua inglesa, para fazer com que ele funcione com a língua coreana. E não preciso dizer que não quer funcionar direito, né? Mas, mesmo assim, vamos tentando. Um dia sai.

Além disso, tenho minha aula de "Línguas Altaicas", matéria que não tem nada a ver com meu campo de estudo, já que sou de lingüística computacional, mas que me atrai por ser uma mistura de lingüística histórica, sócio-lingüística e fala de línguas de verdade. É bem interessante e é toda ministrada em coreano 100%. Isso é o que me atrapalha. Como é em coreano, eu tenho que dedicar mais tempo pelo problema da língua em si. Ainda mais quando tenho que escrever algum trabalho ou coisa parecida. Aí é a cobra fumando.

No mais, não tenho mais nenhuma novidade. Toda minha vida atualmente só gira em torno do TARSQI e das línguas altaicas. De domingo a domingo, quase 24 horas por dia. O restinho que sobra, é hora de dormir um pouco. Quando dá...

Um abraço, e desejem-me sorte...

Pesquisar em blogues de brasileiros na Coreia

Resultado da pesquisa