Muitas vezes, em estatística, queremos recolher dados para que possamos responder a certas questões de investigação. Por exemplo, podemos querer responder às seguintes perguntas: 1. Qual é a renda familiar média em Cincinnati, Ohio? 2. Qual é o peso médio de...
A regressão linear é um método que podemos usar para compreender a relação entre uma ou mais variáveis preditoras e uma variável de resposta . Normalmente, quando realizamos regressão linear, queremos estimar o valor médio da variável resposta. No entanto, poderíamos,...
A regressão linear é um método que podemos usar para compreender a relação entre uma ou mais variáveis preditoras e uma variável de resposta . Normalmente, quando realizamos regressão linear, queremos estimar o valor médio da variável resposta. No entanto, poderíamos,...
Uma média móvel é simplesmente a média de vários períodos anteriores em uma série temporal. Para calcular a média móvel de uma ou mais colunas em um DataFrame do pandas, podemos usar a seguinte sintaxe: df[' column_name ']. rolling ( rolling_window...
Você pode exibir várias linhas em um único gráfico Matplotlib usando a seguinte sintaxe: import matplotlib. pyplot as plt plt. plot (df[' column1 ']) plt. plot (df[' column2 ']) plt. plot (df[' column3 ']) ... plt. show () Este tutorial fornece...
Dois eventos são mutuamente exclusivos se não puderem ocorrer ao mesmo tempo. Por exemplo, suponha que o evento A seja o evento em que um dado caia em um número par e o evento B seja o evento em que um...
Uma variável dicotômica é um tipo de variável que assume apenas dois valores possíveis. Aqui estão alguns exemplos de variáveis dicotômicas: Gênero: Masculino ou Feminino Coin Flip: cara ou coroa Tipo de imóvel: Residencial ou Comercial Status do atleta: Profissional ou...
Existem duas maneiras de criar uma nuvem de pontos usando dados de um DataFrame do pandas: 1. Use pandas.DataFrame.plot.scatter Uma maneira de criar um gráfico de dispersão é usar a função plot.scatter() integrada do pandas: import pandas as pd df. plot...
Um experimento é um estudo científico controlado. Em estatística, frequentemente realizamos experimentos para entender como a mudança de uma variável afeta outra variável. Uma variável manipulada é aquela que alteramos ou “manipulamos” para ver como essa mudança afeta outra variável. Uma...
Uma das principais suposições da regressão linear é que os resíduos são distribuídos com variância igual em cada nível da variável preditora. Essa suposição é conhecida como homocedasticidade . Quando esta suposição não é respeitada, diz-se que a heterocedasticidade está presente...