O V de Cramer é uma medida da força da associação entre duas variáveis nominais. Vai de 0 a 1 onde: 0 indica nenhuma associação entre as duas variáveis. 1 indica forte associação entre as duas variáveis. É calculado da seguinte...
Um teste F parcial é usado para determinar se há ou não uma diferença estatisticamente significativa entre um modelo de regressão e uma versão aninhada do mesmo modelo. Um modelo aninhado é simplesmente um modelo que contém um subconjunto de variáveis...
Você pode usar a seguinte sintaxe para remover linhas contendo uma determinada string em um quadro de dados em R: df[!grepl(' string ', df$column),] Este tutorial fornece vários exemplos de uso prático desta sintaxe com o seguinte quadro de dados em...
Muitos testes estatísticos assumem que os conjuntos de dados são normalmente distribuídos . No entanto, esta suposição é frequentemente violada na prática. Uma maneira de resolver esse problema é transformar os valores no conjunto de dados usando uma das três transformações...
Uma transformação box-cox é um método comumente usado para transformar um conjunto de dados distribuído não normalmente em um conjunto distribuído mais normalmente . A ideia básica é encontrar um valor para λ tal que os dados transformados estejam o mais...
Muitas vezes você pode querer ajustar uma curva a um conjunto de dados em Python. O exemplo passo a passo a seguir explica como ajustar curvas aos dados em Python usando a função numpy.polyfit() e como determinar qual curva melhor se...
Um gráfico log-log é um gráfico que usa escalas logarítmicas no eixo x e no eixo y. Este tipo de gráfico é útil para visualizar duas variáveis quando a verdadeira relação entre elas segue algum tipo de lei de potência. Este...
Muitas vezes você pode querer contar apenas o número de linhas em um DataFrame do pandas que atende a determinados critérios. Felizmente, isso é fácil de fazer usando a seguinte sintaxe básica: sum(df. column_name == some_value ) Os exemplos a seguir...
A distribuição normal é a distribuição de probabilidade mais comumente usada em estatísticas. Possui as seguintes propriedades: Simétrico Em forma de sino A média e a mediana são iguais; ambos localizados no centro da distribuição A média da distribuição normal determina...
Um gráfico semilogarítmico é um tipo de gráfico que usa uma escala logarítmica no eixo y e uma escala linear no eixo x. Este tipo de gráfico é frequentemente utilizado quando os valores da variável y apresentam variabilidade muito maior do...