sábado, 26 de setembro de 2009

Queijos e vinhos da união européia...

Festival de queijos e vinhos no Tesco:
Vinhos franceses, italianos, espanhóis, alemães.
Queijos suíços, franceses, italianos e gregos (brie, grana padano, gruyere, emmental, gorgonzola, Feta, Boursin, etc.).
E tudo a preço de vinhos e queijos nacionais. Acho que vou sentir saudades da Europa... Esse luxo, no Brasil, nem pensar!

quarta-feira, 23 de setembro de 2009

Avançando no GATE

Após o curso em Sheffield, ganhei muito mais expertise no GATE. Estou usando ontologias e outros intrumentos para fazer extração de informações em bases de dados de arqueologia.


terça-feira, 15 de setembro de 2009

OGMA X: versão gráfica

Está disponível para a comunidade de CI do Brasil o OGMA, extrator de sintagmas nominais que desenvolvemos eu e o Luiz Maia, sob os auspícios do CNPq.



Este pode ser baixado aqui

sexta-feira, 11 de setembro de 2009

Research update

Após terminar o tesauro terminológico, mais uma missão:

Vou agora examinar os campos (pseudo) controlados das bases de dados LEAP, MOLAS e RAUNDS, e tentar associar as ocorrências (os termos em si, suas variações, suas raízes sintáticas, o núcleo de seus sintagmas nominais) aos termos relacionados nos tesauro e glossários do CIDOC CRM e CRM-EH, usando o GATE.

Portuguese parsing: now with GATE

Com ajuda de René Witte, e usando os parâmetros disponibilizados na página do Pablo Gamallo, consegui fazer funcionar o GATE para o parsing do português!

Isso abre caminho para que eu desenvolva algumas das metodologias do STAR para a língua portuguesa, assim como explorar o mundo de possibilidades da NLP em português.

Agora vou tentar adaptar o Noun Chunking do Espanhol para conseguir extrair sintagmas nominais do português.

quarta-feira, 9 de setembro de 2009

Tesauro terminológico para Arqueologia

Terminei ontem um produto que me deu muito trabalho: um tesauro terminológico para o domínio da arqueologia baseado em frequências de ocorrências.



A partir deste, a interface de busca do projeto STAR (baseada em SPARQL vai permitir que, na busca pelas triplas de RDF com a compilação das informações dos bancos de dados, apresente sugestões de consultas (no estilo do Google Suggest).

sexta-feira, 4 de setembro de 2009

Corvos

Estes são, hoje, nossos animais de estimação.



São, aqui, como os pombos no Brasil: estão por toda parte.

quinta-feira, 3 de setembro de 2009


Tenho que conseguir financiamento para o congresso de Roma... o artigo já foi aceito e finalizado!