Como Ler Arquivos do OpenOffice com java?

16 respostas
R

Olá amigos,

estou a 2 dias pesquisando no google uma api pra ler arquivos do broffice por exemplo odt, mas não acho nada que me agrade, encontrei um tal de JOpenDocument e ODFDom mas ambos parecem ser pra criar arquivos, o contrário do que eu preciso. Quero alguma ferramenta parecida com Apache-POI para arquivos do ms office.

Alguém aqui ja se deparou com tal problema e encontrou soluçao, aguardo ajuda, desde já muito obrigado

16 Respostas

B

Já viu este link?
http://weblogs.java.net/blog/tchangu/archive/2005/12/open_office_jav_1.html
Espero que ajude.

M

[color=darkblue] Depende o tipo de arquivos que você deseja ler, por exemplo se você deja ler algum arquivo do tipo Excel, você terá que usar algo do tipo : [/color]

Java Excel API
POI

[color=darkblue] O próprio OpenOffice tem como exportar para .xls, agora se for outro tipo de arquivos: [/color]

ler arquivos pdf e doc

[color=darkblue] Que você pode converter da mesma forma.[/color]

R

entao metaleiro a questão é que nós temos um aplicativo rodando na web que é acessado por leigos da empresa toda que enviam arquivos pro servidor por meio desse aplicativo. No momento nosso programa suporta os seguintes formatos xml, html, doc, pdf e xls.
Usando POI, JDOM, PDFBOX…

No entanto, existem pessoas que não salvam os arquivos no formato da ms e querem subir os arquivos pro servidor e nosso aplicativo ainda nao suporta formatos odf. A solução seria integrar ao sistema as extensoes comuns do openoffice também.

E bruno, ja encontrei esse link e estou estudando ele, mas com muito pouca esperança de me servir, eu precisava de algo que conseguisse extrair o texto de um arquivo odt por exemplo para que eu pudesse indexar esse conteudo com o uso de Lucene.

M

ramonpm:
entao metaleiro a questão é que nós temos um aplicativo rodando na web que é acessado por leigos da empresa toda que enviam arquivos pro servidor por meio desse aplicativo. No momento nosso programa suporta os seguintes formatos xml, html, doc, pdf e xls.
Usando POI, JDOM, PDFBOX…

No entanto, existem pessoas que não salvam os arquivos no formato da ms e querem subir os arquivos pro servidor e nosso aplicativo ainda nao suporta formatos odf. A solução seria integrar ao sistema as extensoes comuns do openoffice também.

E bruno, ja encontrei esse link e estou estudando ele, mas com muito pouca esperança de me servir, eu precisava de algo que conseguisse extrair o texto de um arquivo odt por exemplo para que eu pudesse indexar esse conteudo com o uso de Lucene.

[color=darkblue]Não sei se seria a melhor solução, mas nesse cenário seria bom pensar em outra solução, porque não converter os arquivos para formatos com maior facilidade de manipulação ? um exemplo:[/color]

Converter arquivos ODS ou XLS para PDF

R

Metaleiro:
ramonpm:
entao metaleiro a questão é que nós temos um aplicativo rodando na web que é acessado por leigos da empresa toda que enviam arquivos pro servidor por meio desse aplicativo. No momento nosso programa suporta os seguintes formatos xml, html, doc, pdf e xls.
Usando POI, JDOM, PDFBOX…

No entanto, existem pessoas que não salvam os arquivos no formato da ms e querem subir os arquivos pro servidor e nosso aplicativo ainda nao suporta formatos odf. A solução seria integrar ao sistema as extensoes comuns do openoffice também.

E bruno, ja encontrei esse link e estou estudando ele, mas com muito pouca esperança de me servir, eu precisava de algo que conseguisse extrair o texto de um arquivo odt por exemplo para que eu pudesse indexar esse conteudo com o uso de Lucene.

[color=darkblue]Não sei se seria a melhor solução, mas nesse cenário seria bom pensar em outra solução, porque não converter os arquivos para formatos com maior facilidade de manipulação ? um exemplo:[/color]

Converter arquivos ODS ou XLS para PDF

seria uma solução, mas ai eu preciso saber qual biblioteca java que consegue converter arquivos odt em pdf por exemplo

M

[color=darkblue]Dá uma olhada nisso aqui : [/color]

OpenOffice

R

Metaleiro:
[color=darkblue]Dá uma olhada nisso aqui : [/color]

OpenOffice

Ja tinha me deparado com isso também, então eu fui tentar usar uma biblioteca java que manipula xml, ai encontrei um grande problema: “é preciso informar nomes de raiz e filho para acessar um conteudo de um xml”.

Por causa disso não pude nem testar, pois imagine um arquivo odt com o seguinte texto “Texto para teste”, qual seria a raiz e o filho para esse exemplo ?

M

ramonpm:
Metaleiro:
[color=darkblue]Dá uma olhada nisso aqui : [/color]

OpenOffice

Ja tinha me deparado com isso também, então eu fui tentar usar uma biblioteca java que manipula xml, ai encontrei um grande problema: “é preciso informar nomes de raiz e filho para acessar um conteudo de um xml”.

Por causa disso não pude nem testar, pois imagine um arquivo odt com o seguinte texto “Texto para teste”, qual seria a raiz e o filho para esse exemplo ?

[color=darkblue]Dê uma olhada aqui, usei uma vez, fiz exatamente esse processo, segui esse tutorial : [/color]

jexcelapi-tutorial

R

Esse tutorial é pra arquivo do excel, isso eu ja resolvi eu preciso trabalhar com arquivos do openoffice

M

[color=darkblue] A idéia era tentar responder a isso, tenho exemplos de como fiz, mas acho que não vai poder te ajudar, mas se quiser envio mas é para .xls[/color]

O

odfdom

L

Olá

ramonpm:
entao metaleiro a questão é que nós temos um aplicativo rodando na web que é acessado por leigos da empresa toda que enviam arquivos pro servidor por meio desse aplicativo. No momento nosso programa suporta os seguintes formatos xml, html, doc, pdf e xls.
Usando POI, JDOM, PDFBOX…

Use o Apache Tika que lê todos estes formatos (inclusive Open Documento do Open Office) de um jeito só. O Tika deve lançar ainda neste fim de semana a versão 0.4 (veja no mailing list que o lançamento já foi aprovado).

Para mim, o grande problema de quem pretende escarafunchar documentos para retirar informações para um índice do Lucene são os novos formatos de arquivo do Word. O Rian Ackley, que era o cara que fazia isto no POI, saiu do POI e deixou a coisa meio incompleta. Ele agora tem o projeto Text Mining mas que também ainda não parseia corretamente arquivos .docx

PS: Se usar POI e Text Mining no mesmo projeto, fique esperto com o que está em http://code.google.com/p/text-mining/issues/detail?id=5 (veja também os demais issues)

[]s
Luca

D

pessoal estou com a mesma dificuldade

como posso ler um pdf dentro de um jpanel?

M

debug:
pessoal estou com a mesma dificuldade

como posso ler um pdf dentro de um jpanel?

[color=darkblue]Não entendi bem o que você quer, mas no jasper existe o JasperViewer, que faz algo parecido com o que você quer, estou enviando um tópico que tem uma dúvida diferente do que você deseja, mas possui um código funcionando, dê uma olhada: [/color]

[RESOLVIDO] Dúvida com uso de Bean no IReport ?

D

obrigado pelo retorno…
vou analisar o link.

só para efeitos de esclarecimentos o que eu preciso he abrir um pdf dentro da minha aplicação desktop, de preferencia dentro do jpanel.
Por que desejo abrir dentro do jframe/jpanel?

Simplesmente porque teria um panel tabulado para quando abrir o jframe na verdade abriria 4 pdfs um em cada jpanel e o usuario selecionaria que deseja visualizar.

vou tentar aproveitar o link.

caso tenha qq sugestao agraceco .
tks!

D

rapaz, vis seu exemplo porem nao conseguir resolver minha situacao

de qq forma obrigado pela dica.

Alguma outra sugestao? hhehe

Criado 24 de julho de 2009
Ultima resposta 31 de ago. de 2009
Respostas 16
Participantes 6