Itens compartilhados de Juliano

quarta-feira, 26 de novembro de 2008

Gente do céu!

Que coisa de louco! Os finais de semestre estão ficando cada vez mais apertados por aqui.
Estamos com um projeto novo desde setembro, como já havia comentado no post anterior, e hoje apareceu mais um, e este é só para mim: os coreanos estão fazendo um corpus multi-lingüístico e precisam de alguém para fazer a parte do português. Ainda não tenho detalhes de nada, acabei de mandar meu curriculinho para eles e nem sei se vou ser aceito, mas tudo foi feito no mais típico modelo coreano: ppalli-ppalli. Meu professor falou comigo sobre isso do nada hoje pouco antes das 7 da noite, falei que poderia fazer, ele ligou (ou escreveu) para o sujeito encarregado disso e o sujeito me mandou um e-mail explicando que eu teria que mandar um currículo até amanhã às 8 da manhã. Do nada se fez o tudo, como é de praxe aqui na Terra da Manhã Tranqüila (o que é a única coisa tranqüila que tem no país, o apelido do próprio, só).
Pois bem, além disso, ele ainda me disse que conseguiu um analisador morfológico (morphological parser) escrito em Java e que era pra eu dar uma olhada de como botar o trem pra andar, já que o parser que estamos usando não está funcionando tão bem quanto deveria. Eles conseguiram um projeto open-source de um parser cujo desenvolvedor sumiu em 2006 e nunca mais entrou em sua página depois disso e nem terminou o programa que estava desenvolvendo. Mesmo assim, eu me virei e acabei botando o treco pra funcionar e até fiz uma "roumepeigizinha" pra ele no servidor aqui do laboratório. Se alguém quiser ver o negócio funcionando (ou não... depende do que for escrito pra ele analisar... só funciona com coreano tá?), pode dar uma passada no seguinte endereço: http://word.snu.ac.kr/kts ou clique aqui. Se não tiver o que escrever, pode só copiar e colar o que está escrito acima da caixa de texto e clicar no botão que ele faz o resto.
Além disso, se tiver alguém interessado, acho que vou colocar um outro programinha que fiz que faz a transliteração das letrinhas coreanas. Isso fica muito aquém do que é realmente pronunciado, já que é apenas uma transliteração (representação fonológica) e não uma representação fonética do que é realmente pronunciado. De qualquer forma, se der certo, esse programinha ficará em http://word.snu.ac.kr/han2alph ou aqui.

Como não posso escrever muito, vou deixá-los por aqui.

Um abraço,
Juliano

Um comentário:

Gustavo Teles disse...

ou, que pythonzin que carrega rapido, hein! E o outro, pra quem falou que estah escrito em Java, ateh que vai "rapidao"... =P
Ou serah que antes desse meu notebook meu PC era tao imprestavel que ficava tudo lento, independente de ser Java, Python ou C? =D
Gostei.. acho que voce nao tah fazendo linguistica nao, meu amigo... acho que seu negocio eh programacao! Huahuahua

Pesquisar em blogues de brasileiros na Coreia

Resultado da pesquisa