Tutoriais de Ciência de Dados
Desenvolva suas habilidades em ciência de dados com tutoriais em nosso blog. Cobrimos tudo, desde visualizações de dados complexas no Tableau até funções de controle de versões no Git.
Encontre categorias
Treinar 2 ou mais pessoas?Experimentar DataCamp for Business
Estimativa de densidade por kernel: da teoria à prática
A estimativa de densidade por kernel é um método não paramétrico para estimar o formato de uma distribuição de dados sem assumir um modelo fixo. Aprenda a fórmula, a seleção de largura de banda e a implementação prática em Python e R.
Dario Radečić
16 de junho de 2026
Previsão do campeão da Copa do Mundo 2026: um guia de MLOps
Veja como uma pipeline de MLOps ponta a ponta prevê os resultados da Copa do Mundo 2026, do retreinamento automático e DVC a uma simulação de Monte Carlo com 10.000 execuções do chaveamento.
Tom Farnschläder
16 de junho de 2026
Regressão spline: um guia prático com Python e R
Um guia prático sobre regressão spline, cobrindo como polinômios por partes e nós modelam relações não lineares, os principais tipos de spline e como ajustá-los em Python e R.
Dario Radečić
15 de junho de 2026
Pressupostos da regressão logística: o que você precisa checar antes de modelar
Um passo a passo prático dos pressupostos por trás da regressão logística, dos diagnósticos que detectam violações em Python e R e das alternativas quando os pressupostos não se sustentam.
Dario Radečić
15 de junho de 2026
Overfitting vs. Underfitting: um guia prático de diagnóstico de modelos
Um passo a passo detalhado sobre overfitting e underfitting em machine learning: como identificar cada falha, por que acontecem e como corrigi-las via trade-off viés-variância.
Dario Radečić
12 de junho de 2026
Modelo linear generalizado (GLM): guia para iniciantes de teoria e código
Um guia prático de GLMs — o que são, como seus três componentes funcionam juntos e como ajustá-los e interpretá-los em Python e R.
Dario Radečić
12 de junho de 2026
Classificação zero-shot: como funciona e quando usar
Entenda o que é classificação zero-shot, como ela funciona por baixo dos panos com modelos de NLI, como se compara a few-shot e fine-tuning, e como aplicá-la com Hugging Face Transformers.
Dario Radečić
11 de junho de 2026
Markov Chain Monte Carlo (MCMC): amostre distribuições de probabilidade complexas
Um guia sobre Markov Chain Monte Carlo — como funciona, por que é usado, os algoritmos mais comuns e como aplicar em Python para inferência bayesiana.
Dario Radečić
10 de junho de 2026
Gradient clipping: como evitar gradientes explosivos
Gradient clipping é um ajuste de uma linha no treino que impede gradientes explosivos de arruinarem o treinamento de redes neurais profundas. Este guia explica como funciona, os dois principais métodos, como escolher o limiar e como implementar no PyTorch e no TensorFlow.
Dario Radečić
10 de junho de 2026
Tutorial de agent swarm: coordene agentes de IA com CrewAI
Crie um agent swarm no CrewAI com Gemini 3.5 Flash, busca ao vivo na web via Olostep e delegação hierárquica de tarefas para um fluxo multiagente de pesquisa e redação.
Abid Ali Awan
9 de junho de 2026
Support Vector Regression (SVR): como funciona e quando usar
Support Vector Regression é um método de regressão baseado em margem que ignora pequenos erros de propósito, lida com relações não lineares via kernels e se mantém firme em dados reais com ruído, onde a regressão padrão fica devendo.
Dario Radečić
4 de junho de 2026
Como usar a função SQL REPLACE()
Aprenda a usar a função SQL REPLACE() para localizar e substituir substrings no seu banco de dados. Cobre sintaxe, sensibilidade a maiúsculas/minúsculas, remoção de caracteres, tratamento de NULL e dicas de performance.
Allan Ouko
3 de junho de 2026