🔍

Favela Tour Reputation Analysis

Web Scraping + NLP pipeline para analise de reputacao de favela tours no Rio de Janeiro
Caio Ferreira para Aline Jamas · Abril 2026 · TCC UCM Madrid
WEB-SCRAPING NLP PYTHON TOURISM ARCHIVED
Download Repositorio Completo (.zip)
Documentos

Conteudo do Projeto

HTML · HERO

Solving the Favela Tour Reputation Analysis Challenge

Documento principal do processo: metodologia, descobertas, arquitetura do pipeline, e proximos passos para Aline. O entregavel central do projeto.

MARKDOWN

Favela Tour Scraper — Project Overview

Visao geral do projeto: objetivo, status de cada milestone, contexto, plataformas-alvo, tours identificados, e duas vias para Aline finalizar o TCC.

MARKDOWN

Como Extrair Dados com WebScraping + Claude Code

Documento de origem do desafio: perguntas levantadas, audio da Aline apresentando o problema, e perfil profissional/academico.


Recursos

Links Uteis

Video Explicativo (Loom): Assistir video com explicacao completa do projeto

Apify TripAdvisor Scraper: Console do Apify

omkarcloud/tripadvisor-scraper: Repositorio GitHub


Estrutura

Arquivos do Repositorio

Ver arvore de arquivos completa
aline-favela-reviews/
├── scrapers/
│   ├── config.py              (2 KB)  Configuracao dos scrapers
│   ├── tripadvisor_scraper.py (13 KB)  Scraper TripAdvisor + Playwright
│   ├── google_maps_scraper.py  (9 KB)  Scraper Google Maps
│   ├── getyourguide_scraper.py (9 KB)  Scraper GetYourGuide
│   ├── run_all.py              (3 KB)  Runner principal (3 scrapers)
│   ├── debug_tripadvisor.py    (2 KB)  Script de debug
│   └── quick_test_scraper.py   (9 KB)  Script de teste rapido
├── analysis/
│   ├── nlp.py                  (8 KB)  Funcoes NLP (VADER, LDA, TF-IDF)
│   └── pipeline.py             (9 KB)  Pipeline principal de analise
├── data/
│   └── raw/
│       ├── test_reviews.json    (7 KB)  18 reviews (proof of concept)
│       └── tripadvisor_reviews.json
├── output/
│   └── process_document.html  (30 KB)  Documento do processo
├── favela-tour-scraper.md          (8 KB)  Overview do projeto
├── Como extrair...md               (6 KB)  Tutorial de extracao
└── requirements.txt               (<1 KB) Dependencias Python