QORIHUATA CAPITAL PERU SAC

Servicios Financieros (Banca, Finanzas, Inversiones) San Isidro, Lima, Lima, Perú

Desarrollador Backend Python | Especialista en Scraping - QORIHUATA CAPITAL PERU SAC - Lima

Publicado el 8 de Jun, 2026

Detalles

Tipo de oferta Empleo de tiempo completo
Ubicación Presencial; Lima, Lima, Perú
Área de trabajo Consultoría
Tipo de cargo Especialista
Jornada No definido
Contrato Indefinido

Requisitos

Experiencia: Junior (de 2 a 5 años de experiencia)
Carrera(s): Ingeniería de Sistemas Ingeniería de Sistemas Computacionales

Descripción del puesto

1. Objetivo del Puesto
Desarrollar y mantener soluciones de extracción, transformación y carga de datos (ETL) mediante técnicas avanzadas de web scraping y automatización. El profesional será responsable de construir pipelines robustos que alimenten los sistemas de información del Proyecto TI y de sus clientes en los sectores definidos por el proyecto.
2. Responsabilidades Principales
• Diseñar y desarrollar scrapers escalables usando Python (Scrapy, Playwright, Selenium, BeautifulSoup, httpx).
• Construir pipelines ETL para extracción, limpieza y normalización de datos desde múltiples fuentes web.
• Gestionar proxies, rotación de user-agents y estrategias anti-detección (CAPTCHA solving, fingerprinting).
• Integrar datos extraídos con bases de datos relacionales (PostgreSQL) y servicios cloud de Google Cloud Platform.
• Desarrollar APIs REST con FastAPI o Django REST Framework para exponer datos procesados.
• Implementar tareas programadas con Celery + Redis o Google Cloud Scheduler.
• Monitorear y mantener la salud de los scrapers ante cambios en estructuras de sitios web.
• Documentar el código y los flujos de datos de forma clara y reproducible.
• Apoyar en la automatización de procesos internos y flujos de datos del proyecto.
3. Habilidades Técnicas Requeridas
Lenguajes y Frameworks
Tecnología Nivel Requerido
Python 3.x Avanzado
Scrapy / Playwright / Selenium Avanzado
BeautifulSoup / httpx / aiohttp Intermedio - Avanzado
FastAPI / Django REST Framework Intermedio
PostgreSQL / SQLite Intermedio
Redis / Celery Intermedio
Docker Básico - Intermedio
Google Cloud Platform (GCS, Cloud Run) Básico

4. Conocimientos Específicos de Scraping
• Técnicas de evasión: rotación de proxies, manejo de cookies, headers personalizados.
• Scraping de sitios con JavaScript dinámico (SPA, React, Angular) usando Playwright o Selenium.
• Resolución de CAPTCHAs (2Captcha, Anti-Captcha) y bypass de Cloudflare.
• Parsing de HTML, XML y JSON; extracción con XPath y CSS Selectors.
• Almacenamiento eficiente: estructuras de datos en CSV, JSON, bases de datos relacionales.
• Manejo de paginación, sesiones autenticadas y formularios dinámicos.
• Rate limiting y respeto de robots.txt para scraping ético y legal.
5. Perfil y Competencias Blandas
• Capacidad de análisis y resolución de problemas ante sitios con estructuras complejas.
• Autonomía para investigar y adaptar soluciones ante cambios inesperados en sitios objetivo.
• Comunicación clara del avance y los bloqueos al equipo técnico.
• Orientación a la calidad y entrega de datos limpios y confiables.
• Proactividad para sugerir mejoras en los pipelines existentes.
6. Formación Académica
• Bachiller o Titulado en Ingeniería de Sistemas, Computación, Ciencias de la Computación o afines.
• Estudios técnicos superiores con experiencia demostrable también serán considerados.
• Cursos o certificaciones en Python, Data Engineering o Cloud son valorados.
7. Experiencia Requerida
Mínimo: 2 años en desarrollo backend con Python
Scraping: 1 año mínimo con proyectos comprobables (portfolio o repos)
Deseable: Experiencia en integración con APIs de terceros y automatización de procesos de negocio
8. Stack de Referencia del Proyecto TI

Python 3.x Scrapy Playwright FastAPI

PostgreSQL Redis Docker Google Cloud

Beneficios:
Ingreso a planilla.

Postular

Ingrese o cree su cuenta en Empléate UPN para postular

Iniciar sesión
Contáctanos