🎯

Como Extrair Dados com WebScraping + Claude Code

Documento de origem do desafio e perguntas levantadas
Abril 2026 · Origem do projeto

Desafio: Extrair de forma automatica um conjunto especifico de comentarios (avaliacoes) do site TripAdvisor para trata-los com modelos de IA.

Metodologia

Perguntas Levantadas

  1. Entender quais webscrapers podem funcionar no site TripAdvisor
    • Extensoes do Google?
    • Scraper do Apify?
    • Algum repo open-source no github.com?
  2. Definir quais sao os criterios para a extracao das avaliacoes
    • Quais sao os links (filtros) nos quais precisamos raspar?
    • Queremos raspar apenas avaliacoes com determinada palavra-chave?
  3. Apos responder as perguntas acima, utilizar o Claude Code c/ Opus 4.6 para escrever um prompt solicitando pro Claude construir o sistema que ira raspar e tratar o dado que precisamos, solicitando exatamente o output que desejamos.

Origem

Audio da Aline Apresentando o Desafio

Transcricao do audio (WhatsApp) Eu nem tive tempo de ver ainda, mas eu vou ver tudo, juro. Eee, eu cheguei em casa hoje, aqui em Madri, seis da manha, sao nove da noite e eu fiquei fazendo TCC o dia inteiro, quase, que eu to superatrasada. So que eu preciso fazer uma coisa e eu nao tenho nem ideia, e eu acho que voce e a unica pessoa que podera me ajudar. Eu preciso fazer tipo uuum, uma avaliacao da reputacao, sabe? De varios tours assim de favela, tipo do GetYourGuide, do, do TripAdvisor, dessas plataformas assim. E tipo, so tem mil avaliacoes. Eu queria pegar tipo um pattern, um padrao, uma repeticao de comentarios, de palavras. E eu vi que tem algumas extensoes que podem me ajudar a pegar esses negocios mais faceis, porque, tipo, eu sinto que eu nao to sendo nada eficiente lendo uma por uma, sabe? Ce sabe alguma coisa? Nao sei-- acho que deu pra entender, ne? Mas nao sei se ce sabe alguma coisa que possa me ajudar com isso

Contexto

Perfil da Aline Jamas

Aline Jamas

Formacao: Dual degree in Business/Commerce and Tourism — Universidad Complutense de Madrid (2021–2026)

Atual: Treasury Intern na Schneider Electric, Madri

Anterior: Revenue Management Intern na XOTELS (set–nov 2025)

Anterior: Global Markets Analyst na UCM Finance Society

Anterior: Commercial Consulting Intern na Accsys.tech

Anterior: Project Analyst no Instituto Social Jeje de Oya

Contexto academico: Aline esta escrevendo seu TCC (Trabajo de Fin de Carrera) sobre analise de reputacao de favela tours no Rio de Janeiro. O objetivo e identificar padroes nos comentarios de turistas em plataformas como TripAdvisor, Google Maps e GetYourGuide, usando tecnicas de NLP.