quartz/content/03-ciencia-de-dados/index.md
2025-11-21 22:10:40 -03:00

2.0 KiB
Raw Blame History

title
Ciência de dados

Warning

Se você é membro da dev e quer contribuir com algum material, se liga no Guia do Hub disponível na barra lateral: ../05-guiahub/01-guia-onboarding-hub

O que é a trilha de Ciência de Dados?

A trilha de Ciência de Dados é o eixo do Hub dedicado à coleta, organização, tratamento e análise de dados, com foco em construir pipelines robustos, reprodutíveis e bem documentados.
Aqui integramos de forma estruturada:

  • ETL / ELT e engenharia de dados “de base”
    (ingestão de arquivos, APIs, bancos de dados; limpeza, transformação e padronização)
  • Web Scraping e automação
    (requests, parsing de HTML/JSON, agendamento de rotinas, respeito a limites e boas práticas)
  • Análise exploratória e visualização
    (EDA, estatísticas descritivas, gráficos, identificação de outliers e data quality)
  • Boas práticas de código e organização de projeto
    (estrutura de pastas, funções reutilizáveis, logging, testes básicos, versionamento com Git)

O objetivo é dar visibilidade aos projetos criados internamente e organizar materiais que mostrem como se projeta e implementa um fluxo de dados de ponta a ponta desde a captura da informação até a entrega de tabelas, relatórios e bases prontas para modelos de IA, finanças quantitativas ou análises aplicadas.


Pra quem é essa trilha?

👇 Se você se identificou com pelo menos um ponto, essa trilha é pra você:

  • Quer aprender ETL, Web Scraping e manipulação de dados em Python/SQL
  • Gosta de automatizar tarefas repetitivas (coleta de dados, relatórios, atualizações de planilhas)
  • Quer entender como cientistas de dados e engenheiros de dados preparam bases antes da modelagem
  • Está se preparando para estágios/trainees em dados, BI, analytics, engenharia de dados ou áreas quantitativas

Como navegar pela trilha?

Use o menu à baixo para acessar os conteúdos de cada semestre: