Tutoriais de Ciência de Dados

Desenvolva suas habilidades em ciência de dados com tutoriais em nosso blog. Cobrimos tudo, desde visualizações de dados complexas no Tableau até funções de controle de versões no Git.

Encontre categorias

Treinar 2 ou mais pessoas?Experimentar DataCamp for Business

Estimativa de densidade por kernel: da teoria à prática

A estimativa de densidade por kernel é um método não paramétrico para estimar o formato de uma distribuição de dados sem assumir um modelo fixo. Aprenda a fórmula, a seleção de largura de banda e a implementação prática em Python e R.

Dario Radečić

16 de junho de 2026

Previsão do campeão da Copa do Mundo 2026: um guia de MLOps

Veja como uma pipeline de MLOps ponta a ponta prevê os resultados da Copa do Mundo 2026, do retreinamento automático e DVC a uma simulação de Monte Carlo com 10.000 execuções do chaveamento.

Tom Farnschläder

16 de junho de 2026

Regressão spline: um guia prático com Python e R

Um guia prático sobre regressão spline, cobrindo como polinômios por partes e nós modelam relações não lineares, os principais tipos de spline e como ajustá-los em Python e R.

Dario Radečić

15 de junho de 2026

Pressupostos da regressão logística: o que você precisa checar antes de modelar

Um passo a passo prático dos pressupostos por trás da regressão logística, dos diagnósticos que detectam violações em Python e R e das alternativas quando os pressupostos não se sustentam.

Dario Radečić

15 de junho de 2026

Overfitting vs. Underfitting: um guia prático de diagnóstico de modelos

Um passo a passo detalhado sobre overfitting e underfitting em machine learning: como identificar cada falha, por que acontecem e como corrigi-las via trade-off viés-variância.

Dario Radečić

12 de junho de 2026

Modelo linear generalizado (GLM): guia para iniciantes de teoria e código

Um guia prático de GLMs — o que são, como seus três componentes funcionam juntos e como ajustá-los e interpretá-los em Python e R.

Dario Radečić

12 de junho de 2026

Classificação zero-shot: como funciona e quando usar

Entenda o que é classificação zero-shot, como ela funciona por baixo dos panos com modelos de NLI, como se compara a few-shot e fine-tuning, e como aplicá-la com Hugging Face Transformers.

Dario Radečić

11 de junho de 2026

Markov Chain Monte Carlo (MCMC): amostre distribuições de probabilidade complexas

Um guia sobre Markov Chain Monte Carlo — como funciona, por que é usado, os algoritmos mais comuns e como aplicar em Python para inferência bayesiana.

Dario Radečić

10 de junho de 2026

Gradient clipping: como evitar gradientes explosivos

Gradient clipping é um ajuste de uma linha no treino que impede gradientes explosivos de arruinarem o treinamento de redes neurais profundas. Este guia explica como funciona, os dois principais métodos, como escolher o limiar e como implementar no PyTorch e no TensorFlow.

Dario Radečić

10 de junho de 2026

Tutorial de agent swarm: coordene agentes de IA com CrewAI

Crie um agent swarm no CrewAI com Gemini 3.5 Flash, busca ao vivo na web via Olostep e delegação hierárquica de tarefas para um fluxo multiagente de pesquisa e redação.

Abid Ali Awan

9 de junho de 2026

Support Vector Regression (SVR): como funciona e quando usar

Support Vector Regression é um método de regressão baseado em margem que ignora pequenos erros de propósito, lida com relações não lineares via kernels e se mantém firme em dados reais com ruído, onde a regressão padrão fica devendo.

Dario Radečić

4 de junho de 2026

Como usar a função SQL REPLACE()

Aprenda a usar a função SQL REPLACE() para localizar e substituir substrings no seu banco de dados. Cobre sintaxe, sensibilidade a maiúsculas/minúsculas, remoção de caracteres, tratamento de NULL e dicas de performance.

Allan Ouko

3 de junho de 2026