Outros formatos da Floresta Sintá(c)tica

Nesta página estão disponíveis outros formatos para os quais a Floresta Sintáctica foi exportada, mantidos originalmente pelo pólo de Braga.

O esquema do formato Tiger-XML foi desenvolvido pelo Projecto Tiger como linguagem de interface para o TIGERSearch. A sua especificação pode ser consultada no capítulo V do Manual do TIGERSearch 2.1.

O formato Penn Treebank é uma linguagem de anotação sintáctica, desenvolvido pelo Peen Treebank Project.

A Floresta Sintáctica é convertida para os formatos Tiger-XML e Penn Treebank, por scripts originalmente desenvolvidos por Eckhard Bick do projecto VISL, modificados pelo pólo de Braga da Linguateca.

O formato SQL da Floresta Sintáctica está em fase experimental. O código SQL é compatível com o PostgreSQL, em qualquer outra base de dados poderá ser necessário alterar ligeiramente a definição das tabelas.

O formato SimTreeML é XML. O formato Perl é uma Hash para programação sobre programas perl. Ambos os formatos são obtidos a partir de scripts desenvolvidos pelo José João Almeida do projecto Natura.

Penn Treebank

CETEMPúblico: Bosque_CP_7.6.PennTreebank.ptb.gz (1.1 MB)

CETENFolha: Bosque_CF_7.6.PennTreebank.ptb.gz (0.7 MB)

Tiger-XML

CETEMPúblico : Bosque_CP_7.6.TigerXML.xml.gz (3.0 MB)

CETENFolha : Bosque_CF_7.6.TigerXML.xml.gz (1.8 MB)

SQL

CETENFolha : Bosque_CF_7.6.sql.gz (1.8 MB)

CETEMPúblico : Bosque_CP_7.6.sql.gz (3.0 MB)

SimTreeML

CETEMPúblico : Bosque_CP_7.6.SimTreeML.xml.gz (1.6 MB)

CETENFolha : Bosque_CF_7.6.SimTreeML.xml.gz (0.9 MB)

Perl

CETEMPúblico : Bosque_CP_7.6.Perl.txt.gz (1.5 MB)

CETENFolha : Bosque_CF_7.6.Perl.txt.gz (0.8 MB)

Ferramentas para a Floresta Sintá(c)tica

Para o formato em Tiger-XML, está disponível o TIGERSearch, poderá fazer o download gratuito desta ferramenta gráfica, se estiver de acordo com a licença. Ver Screenshot de uma árvore da floresta.

O principal sistema de busca para a Floresta Sintá(c)tica é o Milhafre.

Existem outros dois sistemas de interrogação disponíveis para a FS na Linguateca: o Águia e o Corpuseye.

As ferramentas utilizadas estão disponíveis em CVS

Validar bosques da Floresta Sintá(c)tica

Validação automática das árvores : Validar bosques (para versões do Bosque anteriores à 7.4)


Comentários, sugestões e perguntas sobre a Floresta Sintá(c)tica
Actualizada a 30 de Setembro de 2008