Pessoal,
Apesar de já ter visto diversos tópicos sobre o assunto de conversão de formatos, geração de pdf , entre outros, não consegui encontrar uma solução para este problema.
Preciso pegar uma string contendo html e transformá-la em documento no formato .doc (MSWORD) ou rtf, ou ainda, algum formato que seja editável no word.
Consegui, com ajuda de um tópico deste fórum, gerar um pdf a partir do html contido uma string utilizando o Jtidy e xhtmlrenderer. Logo, se alguém também souber uma forma de transformar o pdf em doc ou rtf também será de grande ajuda.
Vi o PDFtoolbox da apache para extração do texto de documentos pdf, só que aí perco a formatação e as imagens, o que não resolve o problema.
Sei que talvez exista uma forma de fazer isso com a API do OpenOffice, só que como não teremos controle sobre a maquina hospedeira, não temos como deixar em execução o processo soffice.bin na porta 8100 que a api utiliza para geração dos documentos.( Mesmo assim, se alguém já tiver um exemplo, também seria bem-vido)
Alguém saberia de alguma forma?
Desde já, agradeço.