Descripción del puesto
Descripción del puesto vacante
Buscamos un Científico de Datos Senior con una sólida formación estadística y experiencia práctica en proyectos de ciencia de datos en entornos empresariales. El/La candidato/a debe ser capaz de plantear problemas complejos como problemas de modelado, ejecutar ciclos de investigación rigurosos y ofrecer soluciones reproducibles que puedan ser integradas por los equipos de ingeniería.
Este puesto implica una estrecha colaboración con un equipo de Ingeniería de Aprendizaje Automático.
Se espera que el/la candidato/a tenga un criterio claro sobre sus responsabilidades dentro de ese ecosistema y la disciplina necesaria para trabajar con estándares de ingeniería de software, no solo con estándares de análisis.
Requisitos y calificaciones
Fundamentos técnicos
Dominio avanzado de Python como lenguaje de desarrollo principal y único.
Sólido conocimiento de bibliotecas de ciencia de datos y aprendizaje automático: Scikit-learn, XGBoost, LightGBM, Pandas, Polars, Statsmodels, SciPy.
Experiencia con modelos de aprendizaje profundo (TensorFlow o PyTorch) cuando el problema lo justifique.
Capacidad para trabajar con datos a gran escala: SQL avanzado, PySpark para exploración y transformación.
Acceso y gestión de datos en entornos de nube (GCS, Azure Blob Storage).
Rigor estadístico
Diseño experimental y pruebas de hipótesis aplicadas a problemas de negocio.
Comprensión de la causalidad: no solo correlación, sino la capacidad de distinguir y aplicar las técnicas adecuadas.
Validación robusta de modelos: más allá de la precisión, métricas de negocio, análisis de sesgos y comportamiento de subgrupos.
Disciplina de desarrollo
Uso profesional de Git como parte del flujo de trabajo habitual, no como una mera formalidad en el momento de la entrega.
Código Python organizado y modular: el candidato debe producir código entregable, no solo cuadernos de exploración.
Familiaridad con herramientas de seguimiento de experimentos (MLflow o equivalente) para la trazabilidad de los experimentos.
Capacidad para documentar modelos de forma estructurada: qué resuelve, con qué datos, con qué limitaciones.
Experiencia trabajando bajo estándares de equipo: manejo seguro de credenciales, control de versiones de datos, estructura del proyecto.
Evaluación de la IA
Uso responsable de herramientas de IA generativa como asistentes: con la capacidad crítica de revisar y validar sus resultados.
Capacidad para evaluar cuándo los sistemas de agentes o los modelos de aprendizaje automático (LLM) son la herramienta adecuada y cuándo no lo son.
Información adicional
Máster o Doctorado en: Matemáticas, Estadística, Ciencias Actuariales, Física, Informática o campos afines.
La experiencia en investigación académica o aplicada es un factor diferenciador.
Notas para la búsqueda
El proceso de selección incluye una evaluación técnica práctica y una revisión del trabajo previo del candidato.
Se valorará la capacidad de razonamiento y el criterio por encima de la velocidad de producción de código.
No buscamos perfiles que utilicen herramientas sin comprenderlas: buscamos candidatos que puedan justificar sus decisiones técnicas y estadísticas.
El candidato trabajará bajo los estándares de ingeniería definidos por el equipo; se espera su disposición y capacidad para adoptarlos desde el inicio de cualquier proyecto.
Ofrecemos:
Planilla