Que coisa de louco! Os finais de semestre estão ficando cada vez mais apertados por aqui.
Estamos com um projeto novo desde setembro, como já havia comentado no post anterior, e hoje apareceu mais um, e este é só para mim: os coreanos estão fazendo um corpus multi-lingüístico e precisam de alguém para fazer a parte do português. Ainda não tenho detalhes de nada, acabei de mandar meu curriculinho para eles e nem sei se vou ser aceito, mas tudo foi feito no mais típico modelo coreano: ppalli-ppalli. Meu professor falou comigo sobre isso do nada hoje pouco antes das 7 da noite, falei que poderia fazer, ele ligou (ou escreveu) para o sujeito encarregado disso e o sujeito me mandou um e-mail explicando que eu teria que mandar um currículo até amanhã às 8 da manhã. Do nada se fez o tudo, como é de praxe aqui na Terra da Manhã Tranqüila (o que é a única coisa tranqüila que tem no país, o apelido do próprio, só).
Pois bem, além disso, ele ainda me disse que conseguiu um analisador morfológico (morphological parser) escrito em Java e que era pra eu dar uma olhada de como botar o trem pra andar, já que o parser que estamos usando não está funcionando tão bem quanto deveria. Eles conseguiram um projeto open-source de um parser cujo desenvolvedor sumiu em 2006 e nunca mais entrou em sua página depois disso e nem terminou o programa que estava desenvolvendo. Mesmo assim, eu me virei e acabei botando o treco pra funcionar e até fiz uma "roumepeigizinha" pra ele no servidor aqui do laboratório. Se alguém quiser ver o negócio funcionando (ou não... depende do que for escrito pra ele analisar... só funciona com coreano tá?), pode dar uma passada no seguinte endereço: http://word.snu.ac.kr/kts ou clique aqui. Se não tiver o que escrever, pode só copiar e colar o que está escrito acima da caixa de texto e clicar no botão que ele faz o resto.
Além disso, se tiver alguém interessado, acho que vou colocar um outro programinha que fiz que faz a transliteração das letrinhas coreanas. Isso fica muito aquém do que é realmente pronunciado, já que é apenas uma transliteração (representação fonológica) e não uma representação fonética do que é realmente pronunciado. De qualquer forma, se der certo, esse programinha ficará em http://word.snu.ac.kr/han2alph ou aqui.
Como não posso escrever muito, vou deixá-los por aqui.
Um abraço,
Juliano
Minha vida na Coréia: mestrado, viagens, enfim, meus pensamentos com muito café e kimchi. ^^
Itens compartilhados de Juliano
quarta-feira, 26 de novembro de 2008
segunda-feira, 3 de novembro de 2008
Kimchi com Café de volta com a programação normal
Pois bem... Tem muita gente que está me cobrando (e já faz tempo) por que é que eu não estou mais escrevendo no blog. E alguns destes já até deram a resposta e acertaram: eu estou hiper-ocupado.
Desde que escrevi pela última vez, minha vida acadêmica se tornou um inferno na terra quanto a "tempo". Nosso professor inventou de fazer um grupo de estudos, juntamente com o professor de semântica, para criar um sistema baseado no TARSQI (Temporal Awareness and Reasoning Systems for Question Interpretation; em tradução mais do que livre: Sistemas de Reconhecimento e Raciocínio Temporal para Interpretação de Perguntas) dos EUA. Esse sistema TARSQI, pra encurtar a história, é um sistema de programas que lêem textos e conseguem encontrar, marcar e relacionar (quase) toda a informação temporal contida nos textos e ajudar a formar um sistema maior de perguntas e respostas automatizado. (Se não fizer muito sentido, não tem problema...)
Com isso, nós nos reunimos uma vez por semana para discutir nosso progresso e marcar metas para a próxima reunião da semana vindoura. A mim me coube a reconstrução e o retrofite (gambiarra) do programa que lida com a língua inglesa, para fazer com que ele funcione com a língua coreana. E não preciso dizer que não quer funcionar direito, né? Mas, mesmo assim, vamos tentando. Um dia sai.
Além disso, tenho minha aula de "Línguas Altaicas", matéria que não tem nada a ver com meu campo de estudo, já que sou de lingüística computacional, mas que me atrai por ser uma mistura de lingüística histórica, sócio-lingüística e fala de línguas de verdade. É bem interessante e é toda ministrada em coreano 100%. Isso é o que me atrapalha. Como é em coreano, eu tenho que dedicar mais tempo pelo problema da língua em si. Ainda mais quando tenho que escrever algum trabalho ou coisa parecida. Aí é a cobra fumando.
No mais, não tenho mais nenhuma novidade. Toda minha vida atualmente só gira em torno do TARSQI e das línguas altaicas. De domingo a domingo, quase 24 horas por dia. O restinho que sobra, é hora de dormir um pouco. Quando dá...
Um abraço, e desejem-me sorte...
Desde que escrevi pela última vez, minha vida acadêmica se tornou um inferno na terra quanto a "tempo". Nosso professor inventou de fazer um grupo de estudos, juntamente com o professor de semântica, para criar um sistema baseado no TARSQI (Temporal Awareness and Reasoning Systems for Question Interpretation; em tradução mais do que livre: Sistemas de Reconhecimento e Raciocínio Temporal para Interpretação de Perguntas) dos EUA. Esse sistema TARSQI, pra encurtar a história, é um sistema de programas que lêem textos e conseguem encontrar, marcar e relacionar (quase) toda a informação temporal contida nos textos e ajudar a formar um sistema maior de perguntas e respostas automatizado. (Se não fizer muito sentido, não tem problema...)
Com isso, nós nos reunimos uma vez por semana para discutir nosso progresso e marcar metas para a próxima reunião da semana vindoura. A mim me coube a reconstrução e o retrofite (gambiarra) do programa que lida com a língua inglesa, para fazer com que ele funcione com a língua coreana. E não preciso dizer que não quer funcionar direito, né? Mas, mesmo assim, vamos tentando. Um dia sai.
Além disso, tenho minha aula de "Línguas Altaicas", matéria que não tem nada a ver com meu campo de estudo, já que sou de lingüística computacional, mas que me atrai por ser uma mistura de lingüística histórica, sócio-lingüística e fala de línguas de verdade. É bem interessante e é toda ministrada em coreano 100%. Isso é o que me atrapalha. Como é em coreano, eu tenho que dedicar mais tempo pelo problema da língua em si. Ainda mais quando tenho que escrever algum trabalho ou coisa parecida. Aí é a cobra fumando.
No mais, não tenho mais nenhuma novidade. Toda minha vida atualmente só gira em torno do TARSQI e das línguas altaicas. De domingo a domingo, quase 24 horas por dia. O restinho que sobra, é hora de dormir um pouco. Quando dá...
Um abraço, e desejem-me sorte...
Assinar:
Postagens (Atom)