Eu teria que pegar os dados pelo html da página ? ai no caso se a empresa mudar a estrutura do html dela eu perco o acesso aos dados ? é assim que o trivago faz ? se for assim fica meio inviável pra ficar sempre verificando se o html dos outros sites mudaram. ou tem alguma forma mais eficiente ?
Como fazer um site que reune informações de outros sites?
D
2 Respostas
R
Cara, eu vi sobre isso uma vez, mas faz um tempinho… Eu lembro que isso é feito por metasearch
Esse repositorio vai te ajudar a iniciar suas pesquisas
R
O nome disso é scraping, e sim toda vez que a estrutura do HTML é alterada você tem que mudar a forma como você faz. Já existem bibliotecas que tentam identificar as informações baseadas no contexto semântico das informações, mas em geral é o que você vai ter que fazer.
O framework que eu conheço melhor pra fazer isso é o Scrapy, que é em Python.
Criado 11 de janeiro de 2021
Ultima resposta 11 de jan. de 2021
Respostas 2
Participantes 3