Que coisa de louco! Os finais de semestre estão ficando cada vez mais apertados por aqui.
Estamos com um projeto novo desde setembro, como já havia comentado no post anterior, e hoje apareceu mais um, e este é só para mim: os coreanos estão fazendo um corpus multi-lingüístico e precisam de alguém para fazer a parte do português. Ainda não tenho detalhes de nada, acabei de mandar meu curriculinho para eles e nem sei se vou ser aceito, mas tudo foi feito no mais típico modelo coreano: ppalli-ppalli. Meu professor falou comigo sobre isso do nada hoje pouco antes das 7 da noite, falei que poderia fazer, ele ligou (ou escreveu) para o sujeito encarregado disso e o sujeito me mandou um e-mail explicando que eu teria que mandar um currículo até amanhã às 8 da manhã. Do nada se fez o tudo, como é de praxe aqui na Terra da Manhã Tranqüila (o que é a única coisa tranqüila que tem no país, o apelido do próprio, só).
Pois bem, além disso, ele ainda me disse que conseguiu um analisador morfológico (morphological parser) escrito em Java e que era pra eu dar uma olhada de como botar o trem pra andar, já que o parser que estamos usando não está funcionando tão bem quanto deveria. Eles conseguiram um projeto open-source de um parser cujo desenvolvedor sumiu em 2006 e nunca mais entrou em sua página depois disso e nem terminou o programa que estava desenvolvendo. Mesmo assim, eu me virei e acabei botando o treco pra funcionar e até fiz uma "roumepeigizinha" pra ele no servidor aqui do laboratório. Se alguém quiser ver o negócio funcionando (ou não... depende do que for escrito pra ele analisar... só funciona com coreano tá?), pode dar uma passada no seguinte endereço: http://word.snu.ac.kr/kts ou clique aqui. Se não tiver o que escrever, pode só copiar e colar o que está escrito acima da caixa de texto e clicar no botão que ele faz o resto.
Além disso, se tiver alguém interessado, acho que vou colocar um outro programinha que fiz que faz a transliteração das letrinhas coreanas. Isso fica muito aquém do que é realmente pronunciado, já que é apenas uma transliteração (representação fonológica) e não uma representação fonética do que é realmente pronunciado. De qualquer forma, se der certo, esse programinha ficará em http://word.snu.ac.kr/han2alph ou aqui.
Como não posso escrever muito, vou deixá-los por aqui.
Um abraço,
Juliano
Um comentário:
ou, que pythonzin que carrega rapido, hein! E o outro, pra quem falou que estah escrito em Java, ateh que vai "rapidao"... =P
Ou serah que antes desse meu notebook meu PC era tao imprestavel que ficava tudo lento, independente de ser Java, Python ou C? =D
Gostei.. acho que voce nao tah fazendo linguistica nao, meu amigo... acho que seu negocio eh programacao! Huahuahua
Postar um comentário