{"id":1432,"date":"2023-07-26T10:15:39","date_gmt":"2023-07-26T10:15:39","guid":{"rendered":"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/"},"modified":"2023-07-26T10:15:39","modified_gmt":"2023-07-26T10:15:39","slug":"dati-ad-alta-dimensionalita","status":"publish","type":"post","link":"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/","title":{"rendered":"Cosa sono i dati ad alta dimensione? (definizione ed esempi)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>I dati ad alta dimensionalit\u00e0<\/strong> si riferiscono a un set di dati in cui il numero di caratteristiche <em>p<\/em> \u00e8 maggiore del numero di <a href=\"https:\/\/statorials.org\/it\/osservazione-in-statistica\/\" target=\"_blank\" rel=\"noopener\">osservazioni<\/a> <em>N<\/em> , spesso scritto come<\/span> <span style=\"color: #000000;\"><em>p<\/em> &gt;&gt; <em>N.<\/em><\/span><\/p>\n<p> <span style=\"color: #000000;\">Ad esempio, un set di dati con <em>p<\/em> = 6 caratteristiche e solo <em>N<\/em> = 3 osservazioni verrebbe considerato dati ad alta dimensione perch\u00e9 il numero di caratteristiche \u00e8 maggiore del numero di osservazioni.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14165 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png\" alt=\"Dati ad alta dimensionalit\u00e0\" width=\"593\" height=\"154\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Un errore comune che le persone commettono \u00e8 presumere che \u201cdati ad alta dimensione\u201d significhi semplicemente un set di dati con molte caratteristiche. Tuttavia, ci\u00f2 non \u00e8 corretto. Un set di dati pu\u00f2 contenere 10.000 caratteristiche, ma se contiene 100.000 osservazioni, non \u00e8 ad alta dimensionalit\u00e0.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><em><strong>Nota:<\/strong> fare riferimento al capitolo 18 <a href=\"https:\/\/web.stanford.edu\/~hastie\/Papers\/ESLII.pdf\" target=\"_blank\" rel=\"noopener\">di Elementi di apprendimento statistico<\/a> per una discussione approfondita della matematica alla base dei dati ad alta dimensione.<\/em><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Perch\u00e9 i dati ad alta dimensione sono un problema?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Quando il numero di caratteristiche in un set di dati supera il numero di osservazioni, non avremo mai una risposta deterministica.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In altre parole, diventa impossibile trovare un modello in grado di descrivere la relazione tra le variabili predittive e la <a href=\"https:\/\/statorials.org\/it\/variabili-risposte-esplicative\/\" target=\"_blank\" rel=\"noopener\">variabile risposta<\/a> , perch\u00e9 non disponiamo di sufficienti osservazioni su cui addestrare il modello.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Esempi di dati ad alta dimensione<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Gli esempi seguenti illustrano set di dati ad alta dimensione in diversi domini.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Esempio 1: dati sanitari<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">I dati ad alta dimensione sono comuni nei set di dati sanitari in cui il numero di caratteristiche per un dato individuo pu\u00f2 essere enorme (ad esempio pressione sanguigna, frequenza cardiaca a riposo, stato del sistema immunitario, storia chirurgica, altezza, peso, condizioni esistenti, ecc.).<\/span><\/p>\n<p> <span style=\"color: #000000;\">In questi set di dati, \u00e8 comune che il numero di caratteristiche sia maggiore del numero di osservazioni.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14166 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim2.png\" alt=\"Esempio di dati ad alta dimensionalit\u00e0\" width=\"643\" height=\"140\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Esempio 2: dati finanziari<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">I dati ad alta dimensione sono comuni anche nei set di dati finanziari in cui il numero di caratteristiche per un dato titolo pu\u00f2 essere piuttosto elevato (ad esempio rapporto PE, capitalizzazione di mercato, volume degli scambi, tasso di dividendo, ecc.)<\/span><\/p>\n<p> <span style=\"color: #000000;\">In questi tipi di set di dati, \u00e8 normale che il numero di entit\u00e0 sia molto maggiore del numero di singole azioni.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14167 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim3.png\" alt=\"\" width=\"623\" height=\"125\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Esempio 3: Genomica<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">I dati ad alta dimensione sono comuni anche nel campo della genomica, dove il numero di caratteristiche genetiche di un dato individuo pu\u00f2 essere enorme.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14168 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim4.png\" alt=\"\" width=\"662\" height=\"117\" srcset=\"\" sizes=\"\"><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Come gestire dati di grandi dimensioni<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Esistono due modi comuni per elaborare dati ad alta dimensione:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Scegli di includere meno funzionalit\u00e0.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Il modo pi\u00f9 ovvio per evitare di gestire dati ad alta dimensione \u00e8 semplicemente includere meno funzionalit\u00e0 nel set di dati.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Esistono diversi modi per decidere quali funzionalit\u00e0 rimuovere da un set di dati, tra cui:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>Rimuovi funzionalit\u00e0 con molti valori mancanti:<\/strong> se una determinata colonna in un set di dati presenta molti valori mancanti, potresti essere in grado di rimuoverla completamente senza perdere molte informazioni.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Rimuovi funzionalit\u00e0 a bassa varianza:<\/strong> se una determinata colonna in un set di dati ha valori che cambiano molto poco, potresti essere in grado di rimuoverla perch\u00e9 \u00e8 improbabile che offra tante informazioni utili su una variabile di risposta rispetto ad altre funzionalit\u00e0.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Rimuovi funzionalit\u00e0 con una bassa correlazione con la variabile di risposta:<\/strong> se una determinata funzionalit\u00e0 non \u00e8 altamente correlata con la variabile di risposta che ti interessa, probabilmente puoi rimuoverla dal set di dati, poich\u00e9 \u00e8 improbabile che sia una funzionalit\u00e0 utile in un modello.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>2. Utilizzare un metodo di regolarizzazione.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Un altro modo per gestire dati ad alta dimensione senza rimuovere funzionalit\u00e0 dal set di dati \u00e8 utilizzare una tecnica di regolarizzazione come:<\/span><\/p>\n<ul>\n<li> <a href=\"https:\/\/statorials.org\/it\/analisi-delle-componenti-principali-in-r\/\" target=\"_blank\" rel=\"noopener\">Analisi del componente principale<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/it\/regressione-delle-componenti-principali\/\" target=\"_blank\" rel=\"noopener\">Regressione delle componenti principali<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/it\/regressione-della-cresta\/\" target=\"_blank\" rel=\"noopener\">Regressione di picco<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/it\/regressione-al-lazo\/\" target=\"_blank\" rel=\"noopener\">Regressione al lazo<\/a><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Ognuna di queste tecniche pu\u00f2 essere utilizzata per elaborare in modo efficiente dati ad alta dimensione.<\/span><\/p>\n<hr>\n<p> <span style=\"color: #000000;\"><em>Puoi trovare un elenco completo di tutti i tutorial sul machine learning statistico in questa pagina .<\/em><\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>I dati ad alta dimensionalit\u00e0 si riferiscono a un set di dati in cui il numero di caratteristiche p \u00e8 maggiore del numero di osservazioni N , spesso scritto come p &gt;&gt; N. Ad esempio, un set di dati con p = 6 caratteristiche e solo N = 3 osservazioni verrebbe considerato dati ad alta [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Cosa sono i dati ad alta dimensione? (Definizione ed esempi)<\/title>\n<meta name=\"description\" content=\"Questo tutorial fornisce una spiegazione dei dati ad alta dimensione, inclusa una definizione formale e diversi esempi.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Cosa sono i dati ad alta dimensione? (Definizione ed esempi)\" \/>\n<meta property=\"og:description\" content=\"Questo tutorial fornisce una spiegazione dei dati ad alta dimensione, inclusa una definizione formale e diversi esempi.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T10:15:39+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/\",\"url\":\"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/\",\"name\":\"Cosa sono i dati ad alta dimensione? (Definizione ed esempi)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/it\/#website\"},\"datePublished\":\"2023-07-26T10:15:39+00:00\",\"dateModified\":\"2023-07-26T10:15:39+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\"},\"description\":\"Questo tutorial fornisce una spiegazione dei dati ad alta dimensione, inclusa una definizione formale e diversi esempi.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Casa\",\"item\":\"https:\/\/statorials.org\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Cosa sono i dati ad alta dimensione? (definizione ed esempi)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/it\/#website\",\"url\":\"https:\/\/statorials.org\/it\/\",\"name\":\"Statorials\",\"description\":\"La tua guida all&#039;alfabetizzazione statistica!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/it\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9\",\"sameAs\":[\"https:\/\/statorials.org\/it\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Cosa sono i dati ad alta dimensione? (Definizione ed esempi)","description":"Questo tutorial fornisce una spiegazione dei dati ad alta dimensione, inclusa una definizione formale e diversi esempi.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/","og_locale":"it_IT","og_type":"article","og_title":"Cosa sono i dati ad alta dimensione? (Definizione ed esempi)","og_description":"Questo tutorial fornisce una spiegazione dei dati ad alta dimensione, inclusa una definizione formale e diversi esempi.","og_url":"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/","og_site_name":"Statorials","article_published_time":"2023-07-26T10:15:39+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png"}],"author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Benjamin anderson","Est. reading time":"3 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/","url":"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/","name":"Cosa sono i dati ad alta dimensione? (Definizione ed esempi)","isPartOf":{"@id":"https:\/\/statorials.org\/it\/#website"},"datePublished":"2023-07-26T10:15:39+00:00","dateModified":"2023-07-26T10:15:39+00:00","author":{"@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae"},"description":"Questo tutorial fornisce una spiegazione dei dati ad alta dimensione, inclusa una definizione formale e diversi esempi.","breadcrumb":{"@id":"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/it\/dati-ad-alta-dimensionalita\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Casa","item":"https:\/\/statorials.org\/it\/"},{"@type":"ListItem","position":2,"name":"Cosa sono i dati ad alta dimensione? (definizione ed esempi)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/it\/#website","url":"https:\/\/statorials.org\/it\/","name":"Statorials","description":"La tua guida all&#039;alfabetizzazione statistica!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/it\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/0896f191fb9fb019f2cd8623112cb3ae","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/statorials.org\/it\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/it\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di pi\u00f9","sameAs":["https:\/\/statorials.org\/it"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/1432"}],"collection":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/comments?post=1432"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/posts\/1432\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/media?parent=1432"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/categories?post=1432"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/it\/wp-json\/wp\/v2\/tags?post=1432"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}