2.2 KiB
| title |
|---|
| Ciência de dados |
Warning
Se você é membro da dev e quer contribuir com algum material, se liga no Guia do Hub disponível na seção Extras: ../05-guiahub/01-guia-onboarding-hub
O que é a trilha de Ciência de Dados?
A trilha de Ciência de Dados é o eixo do Hub dedicado à coleta, organização, tratamento e análise de dados, com foco em construir pipelines robustos, reprodutíveis e bem documentados.
Aqui integramos de forma estruturada:
- ETL / ELT e engenharia de dados “de base”
(ingestão de arquivos, APIs, bancos de dados; limpeza, transformação e padronização) - Web Scraping e automação
(requests, parsing de HTML/JSON, agendamento de rotinas, respeito a limites e boas práticas) - Análise exploratória e visualização
(EDA, estatísticas descritivas, gráficos, identificação de outliers e data quality) - Boas práticas de código e organização de projeto
(estrutura de pastas, funções reutilizáveis, logging, testes básicos, versionamento com Git)
O objetivo é dar visibilidade aos projetos criados internamente e organizar materiais que mostrem como se projeta e implementa um fluxo de dados de ponta a ponta – desde a captura da informação até a entrega de tabelas, relatórios e bases prontas para modelos de IA, finanças quantitativas ou análises aplicadas.
Pra quem é essa trilha?
👇 Se você se identificou com pelo menos um ponto, essa trilha é pra você:
- Quer aprender ETL, Web Scraping e manipulação de dados em Python/SQL
- Gosta de automatizar tarefas repetitivas (coleta de dados, relatórios, atualizações de planilhas)
- Quer entender como cientistas de dados e engenheiros de dados preparam bases antes da modelagem
- Está se preparando para estágios/trainees em dados, BI, analytics, engenharia de dados ou áreas quantitativas
Não precisa já dominar tudo – o importante é estar disposto a estruturar melhor seus códigos, se preocupar com qualidade de dados e compartilhar boas práticas.
Como navegar pela trilha
Use o menu à baixo para acessar os conteúdos de cada semestre: