Ler dados do site da Receita Federal

8 respostas
F

Bom dia !

Gostaria de saber como ler dados do site da Receita federal em Java, tipo quero obter um valor de um determinado campo, exemplo: O valor do “id” do campo “imgcaptcha”, consegui um exemplo em php (abaixo), alguém teria alguma ideia de como fazer em java ??? vlw a todos

<?
require("config.php");
							
$Request            	= new HttpRequest( "http://www.receita.fazenda.gov.br/pessoajuridica/cnpj/cnpjreva/Cnpjreva_Solicitacao2.asp", array(), "flag=0" );
$Retorno       			= $Request->Retorno;

#############

$dom           	 		= new DomDocument();
@$dom->loadHTML($Retorno);

$xpath          		= new DOMXPath($dom);

#############

$q              		= $xpath->query("//img[@id='imgcaptcha']");

$SRC					= "http://www.receita.fazenda.gov.br" . trim($q->item(0)->getAttribute('src'));

#############

$q              		= $xpath->query("//input[@id='viewstate']");

$_SESSION["viewstate"]	= trim($q->item(0)->getAttribute('value'));

#############

echo $SRC;
?>

8 Respostas

U

Se existe um captcha nessa página, é justamente para evitar que pessoas criarem rotinas para ficarem pesquisando na base deles diretamente… hehe

Ou você só quer replicar o form de consulta no seu sistema?

F

ul1sses:
Se existe um captcha nessa página, é justamente para evitar que pessoas criarem rotinas para ficarem pesquisando na base deles diretamente… hehe

Ou você só quer replicar o form de consulta no seu sistema?

Você não entendeu, eu não quero criar um robô, quero apenas pegar o valor do campo, pode ser qualquer outro campo, ex: input name=“testeteste” id=“teste”. Quero pegar o id do input testeteste, ou seja quero pegar o valor: “teste”.

M

procure no forum sobre REGEX…
ou expressão regular

F

mark_domi:
procure no forum sobre REGEX…
ou expressão regular

Você também não entendeu rsrs, vou explicar melhor, eu quero pegar o “id” de um “input” qualquer, de um site qualquer, ex:“www.google.com”. Não quero tratar string.

U

Quando você fala em Java, eu entendo que tens um programa que pega o código-fonte da pagina solicitada, e dela você quer pegar o ID de um campo com nome especifico.
Pra fazer isso você está tratando strings… Regex é excelente pra isso.
Agora se você quer algo como XPath para buscar dados no HTML eu não conheço, nem bibliotecas de terceiros.

F

Conseguir achar uma forma, porém está gerando um erro na saida: “http://www.guj.com.br/java/281184-htmlunit—problema-com-webclient

E

É assim. Quando você puxa uma página da Receita, ela tem um JavaScript que gera um pedaço da página no browser. Como seu programa Java não tem um interpretador JavaScript incorporado, então você vai tomar um erro de JavaScript mesmo.

F

entanglement:
É assim. Quando você puxa uma página da Receita, ela tem um JavaScript que gera um pedaço da página no browser. Como seu programa Java não tem um interpretador JavaScript incorporado, então você vai tomar um erro de JavaScript mesmo.

Entendi, conhece alguma outra forma ??? vlwwwww

Criado 29 de agosto de 2012
Ultima resposta 29 de ago. de 2012
Respostas 8
Participantes 4