“Retirar a tendência” dos dados de séries temporais significa remover uma tendência subjacente nos dados. A principal razão pela qual queremos fazer isso é visualizar mais facilmente as tendências subjacentes em dados sazonais ou cíclicos. Por exemplo, considere os seguintes dados...
Podemos usar a seguinte sintaxe para traçar uma linha de regressão de grupo usando o pacote de visualização R ggplot2 : ggplot(df, aes (x = x_variable, y = y_variable, color = group_variable)) + geom_point() + geom_smooth(method = " lm ", fill...
Um dos principais pressupostos da regressão linear é que não há correlação entre resíduos consecutivos. Em outras palavras, assumimos que os resíduos são independentes. Quando esta suposição é violada, é provável que os erros padrão dos coeficientes num modelo de regressão...
Nas estatísticas, a variância do cluster refere-se simplesmente à média de duas ou mais variâncias do cluster. Usamos a palavra “agrupado” para indicar que estamos “agrupando” duas ou mais variações de grupo para obter um único número para a variação comum...
Winsorizar dados significa definir valores discrepantes extremos iguais a um percentil especificado dos dados. Por exemplo, uma winsorização de 90% define todas as observações acima do percentil 95 iguais ao valor no percentil 95 e todas as observações abaixo do percentil...
Winsorizar dados significa definir valores discrepantes extremos iguais a um percentil especificado dos dados. Por exemplo, uma winsorização de 90% define todas as observações acima do percentil 95 iguais ao valor no percentil 95 e todas as observações abaixo do percentil...
Um gráfico de pontos empilhados é um tipo de gráfico que exibe frequências usando pontos. Existem dois métodos que você pode usar para criar um gráfico de pontos empilhados em R: Método 1: A função stripchart() na base R. Método 2:...
Centralizar um conjunto de dados significa subtrair o valor médio de cada observação individual no conjunto de dados. Por exemplo, suponha que temos o seguinte conjunto de dados: Acontece que o valor médio é 14. Portanto, para centralizar este conjunto de...
Podemos usar a seguinte sintaxe para adicionar linhas específicas de um quadro de dados em R: with (df, sum (column_1[column_2 == ' some value '])) Esta sintaxe encontra a soma das linhas da coluna 1 em que a coluna 2 é...
A função ifelse() na base R pode ser usada para escrever instruções if-else rápidas. Esta função usa a seguinte sintaxe: ifelse(teste, sim, não) Ouro: teste: um teste lógico sim: o valor a ser retornado se o teste lógico for True não:...