Estou em busca de informações para realizar uma prospecção de clientes, e achei um site com uma boa quantia de informações para futuros clientes:
Porém, entrei em contato com a empresa responsável, e eles não disponibilizam essas informações em arquivos para que eu possa fazer leituras automáticas… eles só disponibilizam o serviço para consulta manual… Tem como eu fazer um bot para ler essas páginas e armazenar as informações em um banco de dados? ( eu não estaria infringindo nenhuma lei? )
================================
Sou leigo no assunto, mas sei que as páginas precisam ter um padrão para eu extrair informacoes.
Pelo que eu pude observar eu teria que dar um endereço inicial de uma categoria, no código fonte da página de cada categoria tem uma tabela com 40 links de empresas.
Como eu faço para “achar” esses links no meio do código HTML?
