{"id":916,"date":"2023-07-28T08:02:55","date_gmt":"2023-07-28T08:02:55","guid":{"rendered":"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/"},"modified":"2023-07-28T08:02:55","modified_gmt":"2023-07-28T08:02:55","slug":"rimuovere-i-valori-anomali-r","status":"publish","type":"post","link":"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/","title":{"rendered":"Come rimuovere gli outlier in r"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Un <strong>valore anomalo<\/strong> \u00e8 un&#8217;osservazione anormalmente distante da altri valori in un set di dati. I valori anomali possono essere problematici perch\u00e9 possono influenzare i risultati di un&#8217;analisi.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Questo tutorial spiega come identificare e rimuovere i valori anomali in R.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Come identificare i valori anomali in R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Prima di poter rimuovere i valori anomali, \u00e8 necessario decidere cosa considerare come valore anomalo. Esistono due modi comuni per eseguire questa operazione:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Utilizzare l&#8217;intervallo interquartile.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">L&#8217;intervallo interquartile (IQR) \u00e8 la differenza tra il 75\u00b0 percentile (Q3) e il 25\u00b0 percentile (Q1) in un set di dati. Misura la distribuzione media del 50% dei valori.<\/span><\/p>\n<p> <span style=\"color: #000000;\">\u00c8 possibile definire un&#8217;osservazione come valore anomalo se \u00e8 1,5 volte l&#8217;intervallo interquartile al di sopra del terzo quartile (Q3) o 1,5 volte l&#8217;intervallo interquartile al di sotto del primo quartile (Q1).<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Valori anomali = Osservazioni &gt; Q3 + 1,5*IQR o &lt; Q1 \u2013 1,5*IQR<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2. Usa i punteggi z.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Un <a href=\"https:\/\/statorials.org\/it\/punteggio-zr\/\" target=\"_blank\" rel=\"noopener noreferrer\">punteggio z<\/a> ti dice quante deviazioni standard un dato valore \u00e8 dalla media. Usiamo la seguente formula per calcolare uno z-score:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>z<\/strong> = (X \u2013 \u03bc) \/ \u03c3<\/span><\/p>\n<p> <span style=\"color: #000000;\">Oro:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">X \u00e8 un singolo valore di dati grezzi<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03bc \u00e8 la media della popolazione<\/span><\/li>\n<li> <span style=\"color: #000000;\">\u03c3 \u00e8 la deviazione standard della popolazione<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">\u00c8 possibile definire un&#8217;osservazione come un valore anomalo se il suo punteggio z \u00e8 inferiore a -3 o superiore a 3.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Valori anomali = Osservazioni con punteggi z &gt; 3 o &lt; -3<\/strong><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Come rimuovere gli outlier in R<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Una volta deciso cosa considerare un valore anomalo, \u00e8 possibile identificarlo e rimuoverlo da un set di dati. Per illustrare come eseguire questa operazione, utilizzeremo il seguente frame di dati:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#make this example reproducible<\/span> \nset.seed(0)\n\n<span style=\"color: #008080;\">#create data frame with three columns A', 'B', 'C'<\/span> \ndf &lt;- data.frame(A=rnorm(1000, mean=10, sd=3),\n                 B=rnorm(1000, mean=20, sd=3),\n                 C=rnorm(1000, mean=30, sd=3))\n\n<span style=\"color: #008080;\">#view first six rows of data frame<\/span>\nhead(df)\n         ABC\n1 13.78886 19.13945 31.33304\n2 9.02130 25.52332 30.03579\n3 13.98940 19.52971 29.97216\n4 13.81729 15.83059 29.09287\n5 11.24392 15.58069 31.47707\n6 5.38015 19.79144 28.19184\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Possiamo quindi definire e rimuovere i valori anomali utilizzando il metodo z-score o il metodo dell&#8217;intervallo interquartile:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Metodo del punteggio Z:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Il codice seguente mostra come calcolare il punteggio z di ciascun valore in ciascuna colonna del frame di dati e quindi rimuovere le righe che hanno almeno un punteggio z con un valore assoluto maggiore di 3:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find absolute value of z-score for each value in each column<\/span>\nz_scores &lt;- <span style=\"color: #3366ff;\">as.data.frame<\/span> (sapply(df, function(df) (abs(df-mean(df))\/sd(df))))\n\n<span style=\"color: #008080;\">#view first six rows of z_scores data frame\n<\/span>head(z_scores)\n\n          ABC\n1 1.2813403 0.25350805 0.39419878\n2 0.3110243 1.80496734 0.05890232\n3 1.3483190 0.12766847 0.08112630\n4 1.2908343 1.32044506 0.38824414\n5 0.4313316 1.40102642 0.44450451\n6 1.5271674 0.04327186 0.70295309\n\n<span style=\"color: #008080;\">#only keep rows in dataframe with all z-scores less than absolute value of 3<\/span> \nno_outliers &lt;- z_scores[!rowSums(z_scores&gt;3), ]\n\n<span style=\"color: #008080;\">#view row and column count of new data frame<\/span>\ndim(no_outliers)\n\n[1] 994 3\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Il frame di dati originale aveva 1000 righe e 3 colonne. Il nuovo frame di dati ha 994 righe e 3 colonne, il che ci dice che 6 righe sono state rimosse perch\u00e9 avevano almeno un punteggio z con un valore assoluto maggiore di 3 in una delle colonne.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Metodo dell&#8217;intervallo interquartile:<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">In alcuni casi, potremmo voler identificare solo i valori anomali in una colonna di un frame di dati. Ad esempio, supponiamo di voler rimuovere solo le righe con un valore anomalo nella colonna &#8220;A&#8221; del nostro frame di dati.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Il codice seguente mostra come rimuovere le righe dal frame di dati il cui valore nella colonna &#8220;A&#8221; \u00e8 1,5 volte l&#8217;intervallo interquartile sopra il terzo quartile (Q3) o 1,5 volte l&#8217;intervallo interquartile sotto il primo quartile (Q1). .<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#find Q1, Q3, and interquartile range for values in column A<\/span>\nQ1 &lt;- quantile(df$A, .25)\nQ3 &lt;- quantile(df$A, .75)\nIQR &lt;- IQR(df$A)\n\n<span style=\"color: #008080;\">#only keep rows in dataframe that have values within 1.5*IQR of Q1 and Q3<\/span>\nno_outliers &lt;- subset(df, df$A&gt; (Q1 - 1.5*IQR) &amp; df$A&lt; (Q3 + 1.5*IQR))\n\n<span style=\"color: #008080;\">#view row and column count of new data frame\n<\/span>dim(no_outliers) \n\n[1] 994 3<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Il frame di dati originale aveva 1000 righe e 3 colonne. Il nuovo frame di dati ha 994 righe e 3 colonne, il che ci dice che 6 righe sono state rimosse perch\u00e9 contenevano almeno un valore anomalo nella colonna A.<\/span><\/p>\n<h3> <strong>Quando rimuovere i valori anomali<\/strong><\/h3>\n<p> <span style=\"color: #000000;\">Se sono presenti uno o pi\u00f9 valori anomali, \u00e8 necessario innanzitutto verificare che non siano il risultato di un errore di immissione dei dati. A volte un individuo inserisce semplicemente il valore dei dati errato durante il salvataggio dei dati.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Se l&#8217;outlier risulta essere il risultato di un errore di immissione dei dati, puoi decidere di assegnargli un nuovo valore come <a href=\"https:\/\/statorials.org\/it\/misura-la-tendenza-centrale\/\" target=\"_blank\" rel=\"noopener noreferrer\">la media o la mediana<\/a> del set di dati.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Se il valore \u00e8 davvero un valore anomalo, puoi scegliere di rimuoverlo se avr\u00e0 un impatto significativo sull&#8217;analisi complessiva. Assicurati solo di menzionare nel rapporto finale o nell&#8217;analisi che hai rimosso un valore anomalo.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Risorse addizionali<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">In questo tutorial, abbiamo utilizzato <strong>rnorm()<\/strong> per generare vettori di variabili casuali normalmente distribuite data una lunghezza del vettore <em>n<\/em> , una media della popolazione <em>\u03bc<\/em> e una deviazione standard della popolazione <em>\u03c3<\/em> . Puoi saperne di pi\u00f9 su questa funzionalit\u00e0 <a href=\"https:\/\/statorials.org\/it\/dnorm-pnorm-rnorm-qnorm-nella-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">qui<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Abbiamo anche utilizzato <strong>sapply()<\/strong> per applicare una funzione a ciascuna colonna in un frame di dati che calcolava i punteggi z. Puoi saperne di pi\u00f9 su questa funzionalit\u00e0 <a href=\"https:\/\/statorials.org\/it\/una-guida-per-applicare-lapply-sapply-e-tapply-in-r\/\" target=\"_blank\" rel=\"noopener noreferrer\">qui<\/a> .<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un valore anomalo \u00e8 un&#8217;osservazione anormalmente distante da altri valori in un set di dati. I valori anomali possono essere problematici perch\u00e9 possono influenzare i risultati di un&#8217;analisi. Questo tutorial spiega come identificare e rimuovere i valori anomali in R. Come identificare i valori anomali in R Prima di poter rimuovere i valori anomali, \u00e8 [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Come rimuovere i valori anomali in R - Stology<\/title>\n<meta name=\"description\" content=\"Una semplice spiegazione di come rimuovere i valori anomali in R, inclusi diversi esempi.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Come rimuovere i valori anomali in R - Stology\" \/>\n<meta property=\"og:description\" content=\"Una semplice spiegazione di come rimuovere i valori anomali in R, inclusi diversi esempi.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-28T08:02:55+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/\",\"url\":\"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/\",\"name\":\"Come rimuovere i valori anomali in R - Stology\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/it\/#website\"},\"datePublished\":\"2023-07-28T08:02:55+00:00\",\"dateModified\":\"2023-07-28T08:02:55+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\"},\"description\":\"Una semplice spiegazione di come rimuovere i valori anomali in R, inclusi diversi esempi.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Casa\",\"item\":\"https:\/\/statorials.org\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Come rimuovere gli outlier in r\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/it\/#website\",\"url\":\"https:\/\/statorials.org\/it\/\",\"name\":\"Statorials\",\"description\":\"La tua guida all&#039;alfabetizzazione statistica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/it\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9\",\"sameAs\":[\"https:\/\/statorials.org\/it\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Come rimuovere i valori anomali in R - Stology","description":"Una semplice spiegazione di come rimuovere i valori anomali in R, inclusi diversi esempi.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/","og_locale":"it_IT","og_type":"article","og_title":"Come rimuovere i valori anomali in R - Stology","og_description":"Una semplice spiegazione di come rimuovere i valori anomali in R, inclusi diversi esempi.","og_url":"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/","og_site_name":"Statorials","article_published_time":"2023-07-28T08:02:55+00:00","author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Benjamin anderson","Est. reading time":"4 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/","url":"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/","name":"Come rimuovere i valori anomali in R - Stology","isPartOf":{"@id":"https:\/\/statorials.org\/it\/#website"},"datePublished":"2023-07-28T08:02:55+00:00","dateModified":"2023-07-28T08:02:55+00:00","author":{"@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae"},"description":"Una semplice spiegazione di come rimuovere i valori anomali in R, inclusi diversi esempi.","breadcrumb":{"@id":"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/it\/rimuovere-i-valori-anomali-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Casa","item":"https:\/\/statorials.org\/it\/"},{"@type":"ListItem","position":2,"name":"Come rimuovere gli outlier in r"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/it\/#website","url":"https:\/\/statorials.org\/it\/","name":"Statorials","description":"La tua guida all&#039;alfabetizzazione statistica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/it\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9","sameAs":["https:\/\/statorials.org\/it"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/916"}],"collection":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/comments?post=916"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/916\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/media?parent=916"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/categories?post=916"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/tags?post=916"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}