{"id":1784,"date":"2023-07-25T00:23:37","date_gmt":"2023-07-25T00:23:37","guid":{"rendered":"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/"},"modified":"2023-07-25T00:23:37","modified_gmt":"2023-07-25T00:23:37","slug":"i-panda-diventano-modelli","status":"publish","type":"post","link":"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/","title":{"rendered":"Come utilizzare pandas get dummies \u2013 pd.get_dummies"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Spesso nelle statistiche i set di dati con cui lavoriamo includono <a href=\"https:\/\/statorials.org\/it\/categorico-vs.-quantitativo\/\" target=\"_blank\" rel=\"noopener\">variabili categoriali<\/a> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Queste sono variabili che prendono nomi o etichette. Esempi inclusi:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Stato civile (\u201csposato\u201d, \u201ccelibe\u201d, \u201cdivorziato\u201d)<\/span><\/li>\n<li> <span style=\"color: #000000;\">Stato di fumatore (\u201cfumatore\u201d, \u201cnon fumatore\u201d)<\/span><\/li>\n<li> <span style=\"color: #000000;\">Colore degli occhi (\u201cblu\u201d, \u201cverde\u201d, \u201cnocciola\u201d)<\/span><\/li>\n<li> <span style=\"color: #000000;\">Livello di istruzione (es. \u201cscuola superiore\u201d, \u201claurea\u201d, \u201claurea magistrale\u201d)<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Quando ottimizziamo gli algoritmi di machine learning (come <a href=\"https:\/\/statorials.org\/it\/regressione-lineare-multipla\/\" target=\"_blank\" rel=\"noopener\">la regressione lineare<\/a> , <a href=\"https:\/\/statorials.org\/it\/regressione-logistica-1\/\" target=\"_blank\" rel=\"noopener\">la regressione logistica<\/a> , <a href=\"https:\/\/statorials.org\/it\/esercitazioni-casuali\/\" target=\"_blank\" rel=\"noopener\">le foreste casuali<\/a> e cos\u00ec via), spesso convertiamo le variabili categoriali in <strong>variabili fittizie<\/strong> , ovvero variabili numeriche utilizzate per rappresentare i dati categoriali.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ad esempio, supponiamo di avere un set di dati contenente la variabile categoriale <strong>Gender<\/strong> . Per utilizzare questa variabile come predittore in un modello di regressione, sarebbe prima necessario convertirla in una variabile fittizia.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Per creare questa variabile fittizia, possiamo scegliere uno dei valori (&#8220;Maschio&#8221;) per rappresentare 0 e l&#8217;altro valore (&#8220;Femmina&#8221;) per rappresentare 1:<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-13941 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin2.png\" alt=\"\" width=\"540\" height=\"312\" srcset=\"\" sizes=\"\"><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Come creare variabili fittizie in Pandas<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Per creare dei manichini per una variabile in un DataFrame pandas, possiamo utilizzare la funzione <a href=\"https:\/\/pandas.pydata.org\/docs\/reference\/api\/pandas.get_dummies.html\" target=\"_blank\" rel=\"noopener\">pandas.get_dummies()<\/a> , che utilizza la seguente sintassi di base:<\/span><\/p>\n<p> <strong><span style=\"color: #000000;\">pandas.get_dummies(dati, prefisso=Nessuno, colonne=Nessuno, drop_first=False)<\/span><\/strong><\/p>\n<p> <span style=\"color: #000000;\">Oro:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>data<\/strong> : il nome del DataFrame dei panda<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>prefisso<\/strong> : una stringa da aggiungere all&#8217;inizio della nuova colonna della variabile fittizia<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>colonne<\/strong> : il nome delle colonne da convertire in una variabile fittizia<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>drop_first<\/strong> : se eliminare o meno la prima colonna della variabile fittizia<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">I seguenti esempi mostrano come utilizzare questa funzione nella pratica.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Esempio 1: creare una singola variabile fittizia<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Supponiamo di avere i seguenti panda DataFrame:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> pandas <span style=\"color: #107d3f;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #ff0000;\">income<\/span> ': [45, 48, 54, 57, 65, 69, 78],\n                   ' <span style=\"color: #ff0000;\">age<\/span> ': [23, 25, 24, 29, 38, 36, 40],\n                   ' <span style=\"color: #ff0000;\">gender<\/span> ': ['M', 'F', 'M', 'F', 'F', 'F', 'M']})\n\n<span style=\"color: #008080;\">#view DataFrame\n<\/span>df\n\n        income age gender\n0 45 23 M\n1 48 25 F\n2 54 24 M\n3 57 29 F\n4 65 38 F\n5 69 36 F\n6 78 40 M<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Possiamo usare la funzione <strong>pd.get_dummies()<\/strong> per trasformare il genere in una variabile fittizia:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#convert gender to dummy variable<\/span>\np.d. <span style=\"color: #3366ff;\">get_dummies<\/span> (df, columns=[' <span style=\"color: #ff0000;\">gender<\/span> '], drop_first= <span style=\"color: #008000;\">True<\/span> )\n\n\tincome age gender_M\n0 45 23 1\n1 48 25 0\n2 54 24 1\n3 57 29 0\n4 65 38 0\n5 69 36 0\n6 78 40 1<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">La colonna sesso \u00e8 ora una variabile fittizia dove:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Un valore pari a <strong>0<\/strong> rappresenta &#8220;Femmina&#8221;<\/span><\/li>\n<li> <span style=\"color: #000000;\">Un valore pari a <strong>1<\/strong> rappresenta &#8220;Maschio&#8221;<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Esempio 2: creare pi\u00f9 variabili fittizie<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Supponiamo di avere i seguenti panda DataFrame:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> pandas <span style=\"color: #107d3f;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #ff0000;\">income<\/span> ': [45, 48, 54, 57, 65, 69, 78],\n                   ' <span style=\"color: #ff0000;\">age<\/span> ': [23, 25, 24, 29, 38, 36, 40],\n                   ' <span style=\"color: #ff0000;\">gender<\/span> ': ['M', 'F', 'M', 'F', 'F', 'F', 'M'],\n                   ' <span style=\"color: #ff0000;\">college<\/span> ': ['Y', 'N', 'N', 'N', 'Y', 'Y', 'Y']})\n\n<span style=\"color: #008080;\">#view DataFrame\n<\/span>df\n\n\tincome age gender college\n0 45 23 M Y\n1 48 25 F N\n2 54 24 M N\n3 57 29 F N\n4 65 38 F Y\n5 69 36 F Y\n6 78 40 M Y<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Possiamo usare la funzione <strong>pd.get_dummies()<\/strong> per convertire sesso e universit\u00e0 in variabili fittizie:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#convert gender to dummy variable<\/span>\np.d. <span style=\"color: #3366ff;\">get_dummies<\/span> (df, columns=[' <span style=\"color: #ff0000;\">gender<\/span> ', ' <span style=\"color: #ff0000;\">college<\/span> '], drop_first= <span style=\"color: #008000;\">True<\/span> )\n\n\n        income age gender_M college_Y\n0 45 23 1 1\n1 48 25 0 0\n2 54 24 1 0\n3 57 29 0 0\n4 65 38 0 1\n5 69 36 0 1\n6 78 40 1 1<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">La colonna sesso \u00e8 ora una variabile fittizia dove:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Un valore pari a <strong>0<\/strong> rappresenta &#8220;Femmina&#8221;<\/span><\/li>\n<li> <span style=\"color: #000000;\">Un valore pari a <strong>1<\/strong> rappresenta &#8220;Maschio&#8221;<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">E la colonna del college ora \u00e8 una variabile fittizia dove:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Un valore pari a <strong>0<\/strong> rappresenta l&#8217;universit\u00e0 &#8220;No&#8221;.<\/span><\/li>\n<li> <span style=\"color: #000000;\">Un valore pari a <strong>1<\/strong> rappresenta &#8220;S\u00ec&#8221; al college<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Risorse addizionali<\/strong><\/span><\/h3>\n<p> <a href=\"https:\/\/statorials.org\/it\/variabili-dummy-di-regressione\/\" target=\"_blank\" rel=\"noopener\">Come utilizzare le variabili fittizie nell&#8217;analisi di regressione<\/a><br \/> <a href=\"https:\/\/statorials.org\/it\/trappola-variabile-fittizia\/\" target=\"_blank\" rel=\"noopener\">Qual \u00e8 la trappola della variabile fittizia?<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Spesso nelle statistiche i set di dati con cui lavoriamo includono variabili categoriali . Queste sono variabili che prendono nomi o etichette. Esempi inclusi: Stato civile (\u201csposato\u201d, \u201ccelibe\u201d, \u201cdivorziato\u201d) Stato di fumatore (\u201cfumatore\u201d, \u201cnon fumatore\u201d) Colore degli occhi (\u201cblu\u201d, \u201cverde\u201d, \u201cnocciola\u201d) Livello di istruzione (es. \u201cscuola superiore\u201d, \u201claurea\u201d, \u201claurea magistrale\u201d) Quando ottimizziamo gli algoritmi di [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Come utilizzare Pandas Get Dummies - pd.get_dummies<\/title>\n<meta name=\"description\" content=\"Questo tutorial spiega come utilizzare la funzione pandas.get_dummies() in Python per creare rapidamente variabili fittizie in un set di dati.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Come utilizzare Pandas Get Dummies - pd.get_dummies\" \/>\n<meta property=\"og:description\" content=\"Questo tutorial spiega come utilizzare la funzione pandas.get_dummies() in Python per creare rapidamente variabili fittizie in un set di dati.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-25T00:23:37+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin2.png\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/\",\"url\":\"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/\",\"name\":\"Come utilizzare Pandas Get Dummies - pd.get_dummies\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/it\/#website\"},\"datePublished\":\"2023-07-25T00:23:37+00:00\",\"dateModified\":\"2023-07-25T00:23:37+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\"},\"description\":\"Questo tutorial spiega come utilizzare la funzione pandas.get_dummies() in Python per creare rapidamente variabili fittizie in un set di dati.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Casa\",\"item\":\"https:\/\/statorials.org\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Come utilizzare pandas get dummies \u2013 pd.get_dummies\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/it\/#website\",\"url\":\"https:\/\/statorials.org\/it\/\",\"name\":\"Statorials\",\"description\":\"La tua guida all&#039;alfabetizzazione statistica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/it\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9\",\"sameAs\":[\"https:\/\/statorials.org\/it\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Come utilizzare Pandas Get Dummies - pd.get_dummies","description":"Questo tutorial spiega come utilizzare la funzione pandas.get_dummies() in Python per creare rapidamente variabili fittizie in un set di dati.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/","og_locale":"it_IT","og_type":"article","og_title":"Come utilizzare Pandas Get Dummies - pd.get_dummies","og_description":"Questo tutorial spiega come utilizzare la funzione pandas.get_dummies() in Python per creare rapidamente variabili fittizie in un set di dati.","og_url":"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/","og_site_name":"Statorials","article_published_time":"2023-07-25T00:23:37+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/mannequin2.png"}],"author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Benjamin anderson","Est. reading time":"3 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/","url":"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/","name":"Come utilizzare Pandas Get Dummies - pd.get_dummies","isPartOf":{"@id":"https:\/\/statorials.org\/it\/#website"},"datePublished":"2023-07-25T00:23:37+00:00","dateModified":"2023-07-25T00:23:37+00:00","author":{"@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae"},"description":"Questo tutorial spiega come utilizzare la funzione pandas.get_dummies() in Python per creare rapidamente variabili fittizie in un set di dati.","breadcrumb":{"@id":"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/it\/i-panda-diventano-modelli\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Casa","item":"https:\/\/statorials.org\/it\/"},{"@type":"ListItem","position":2,"name":"Come utilizzare pandas get dummies \u2013 pd.get_dummies"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/it\/#website","url":"https:\/\/statorials.org\/it\/","name":"Statorials","description":"La tua guida all&#039;alfabetizzazione statistica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/it\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9","sameAs":["https:\/\/statorials.org\/it"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/1784"}],"collection":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/comments?post=1784"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/1784\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/media?parent=1784"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/categories?post=1784"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/tags?post=1784"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}