{"id":1432,"date":"2023-07-26T10:15:39","date_gmt":"2023-07-26T10:15:39","guid":{"rendered":"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/"},"modified":"2023-07-26T10:15:39","modified_gmt":"2023-07-26T10:15:39","slug":"data-berdimensi-tinggi","status":"publish","type":"post","link":"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/","title":{"rendered":"Apa itu data berdimensi tinggi? (definisi &amp; contoh)"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Data berdimensi tinggi<\/strong> mengacu pada kumpulan data yang jumlah fitur <em>p<\/em> lebih besar daripada jumlah <a href=\"https:\/\/statorials.org\/id\/pengamatan-dalam-statistik\/\" target=\"_blank\" rel=\"noopener\">observasi<\/a> <em>N<\/em> , sering ditulis sebagai<\/span> <span style=\"color: #000000;\"><em>p<\/em> &gt;&gt; <em>N.<\/em><\/span><\/p>\n<p> <span style=\"color: #000000;\">Misalnya, kumpulan data dengan <em>p<\/em> = 6 fitur dan hanya <em>N<\/em> = 3 observasi akan dianggap data berdimensi tinggi karena jumlah fitur lebih banyak daripada jumlah observasi.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14165 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png\" alt=\"Data berdimensi tinggi\" width=\"593\" height=\"154\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\">Kesalahan umum yang dilakukan orang adalah berasumsi bahwa \u201cdata berdimensi tinggi\u201d berarti kumpulan data dengan banyak fitur. Namun, hal ini tidak benar. Sebuah kumpulan data mungkin berisi 10.000 fitur, tetapi jika berisi 100.000 observasi, maka data tersebut tidak berdimensi tinggi.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><em><strong>Catatan:<\/strong> Lihat Bab 18 <a href=\"https:\/\/web.stanford.edu\/~hastie\/Papers\/ESLII.pdf\" target=\"_blank\" rel=\"noopener\">Elemen Pembelajaran Statistik<\/a> untuk diskusi mendalam tentang matematika di balik data berdimensi tinggi.<\/em><\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Mengapa data berdimensi tinggi menjadi masalah?<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Ketika jumlah fitur dalam kumpulan data melebihi jumlah observasi, kita tidak akan pernah memiliki jawaban deterministik.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dengan kata lain, menjadi tidak mungkin menemukan model yang dapat menggambarkan hubungan antara variabel prediktor dan <a href=\"https:\/\/statorials.org\/id\/variabel-tanggapan-penjelas\/\" target=\"_blank\" rel=\"noopener\">variabel respon<\/a> , karena kita tidak memiliki cukup observasi untuk melatih model tersebut.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Contoh data berdimensi tinggi<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Contoh berikut mengilustrasikan kumpulan data berdimensi tinggi di domain berbeda.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Contoh 1: Data kesehatan<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Data berdimensi tinggi adalah hal yang umum dalam kumpulan data layanan kesehatan yang jumlah fiturnya untuk individu tertentu bisa sangat banyak (yaitu tekanan darah, detak jantung saat istirahat, status sistem kekebalan, riwayat bedah, tinggi badan, berat badan, kondisi yang ada, dll.).<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dalam kumpulan data ini, biasanya jumlah fitur lebih banyak daripada jumlah observasi.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14166 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim2.png\" alt=\"Contoh data berdimensi tinggi\" width=\"643\" height=\"140\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Contoh 2: data keuangan<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Data berdimensi tinggi juga umum terjadi pada kumpulan data keuangan yang jumlah fiturnya untuk suatu saham tertentu bisa sangat besar (yaitu rasio PE, kapitalisasi pasar, volume perdagangan, tingkat dividen, dll.)<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dalam jenis kumpulan data ini, biasanya jumlah entitas jauh lebih besar dibandingkan jumlah tindakan individual.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14167 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim3.png\" alt=\"\" width=\"623\" height=\"125\" srcset=\"\" sizes=\"\"><\/p>\n<p> <span style=\"color: #000000;\"><strong>Contoh 3: Genomik<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Data berdimensi tinggi juga umum terjadi di bidang genomik, di mana jumlah karakteristik genetik suatu individu bisa sangat banyak.<\/span> <\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14168 \" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim4.png\" alt=\"\" width=\"662\" height=\"117\" srcset=\"\" sizes=\"\"><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Cara menangani data berukuran besar<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Ada dua cara umum untuk memproses data berdimensi tinggi:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1. Pilih untuk menyertakan lebih sedikit fitur.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Cara paling jelas untuk menghindari berurusan dengan data berdimensi tinggi adalah dengan menyertakan lebih sedikit fitur dalam kumpulan data.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ada beberapa cara untuk memutuskan fitur mana yang akan dihapus dari kumpulan data, antara lain:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>Hapus fitur dengan banyak nilai yang hilang:<\/strong> Jika kolom tertentu dalam kumpulan data memiliki banyak nilai yang hilang, Anda mungkin dapat menghapusnya sepenuhnya tanpa kehilangan banyak informasi.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Hapus fitur varian rendah:<\/strong> Jika kolom tertentu dalam kumpulan data memiliki nilai yang sangat sedikit berubah, Anda mungkin dapat menghapusnya karena kolom tersebut kemungkinan tidak memberikan informasi berguna tentang variabel respons sebanyak fitur lainnya.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Hapus fitur dengan korelasi rendah dengan variabel respons:<\/strong> Jika fitur tertentu tidak berkorelasi tinggi dengan variabel respons yang Anda minati, Anda mungkin dapat menghapusnya dari kumpulan data, karena kemungkinan besar fitur tersebut tidak berguna dalam model.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\"><strong>2. Gunakan metode regularisasi.<\/strong><\/span><\/p>\n<p> <span style=\"color: #000000;\">Cara lain untuk menangani data berdimensi tinggi tanpa menghapus fitur dari kumpulan data adalah dengan menggunakan teknik regularisasi seperti:<\/span><\/p>\n<ul>\n<li> <a href=\"https:\/\/statorials.org\/id\/analisis-komponen-utama-di-r\/\" target=\"_blank\" rel=\"noopener\">Analisis komponen utama<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/id\/regresi-komponen-utama\/\" target=\"_blank\" rel=\"noopener\">Regresi komponen utama<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/id\/regresi-punggungan\/\" target=\"_blank\" rel=\"noopener\">Regresi puncak<\/a><\/li>\n<li> <a href=\"https:\/\/statorials.org\/id\/regresi-laso\/\" target=\"_blank\" rel=\"noopener\">Regresi laso<\/a><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Masing-masing teknik ini dapat digunakan untuk memproses data berdimensi tinggi secara efisien.<\/span><\/p>\n<hr>\n<p> <span style=\"color: #000000;\"><em>Anda dapat menemukan daftar lengkap semua tutorial pembelajaran mesin statistik di halaman ini .<\/em><\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Data berdimensi tinggi mengacu pada kumpulan data yang jumlah fitur p lebih besar daripada jumlah observasi N , sering ditulis sebagai p &gt;&gt; N. Misalnya, kumpulan data dengan p = 6 fitur dan hanya N = 3 observasi akan dianggap data berdimensi tinggi karena jumlah fitur lebih banyak daripada jumlah observasi. Kesalahan umum yang dilakukan [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Apa itu data berdimensi tinggi? (Definisi dan contoh)<\/title>\n<meta name=\"description\" content=\"Tutorial ini memberikan penjelasan tentang data berdimensi tinggi, termasuk definisi formal dan beberapa contoh.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/\" \/>\n<meta property=\"og:locale\" content=\"id_ID\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Apa itu data berdimensi tinggi? (Definisi dan contoh)\" \/>\n<meta property=\"og:description\" content=\"Tutorial ini memberikan penjelasan tentang data berdimensi tinggi, termasuk definisi formal dan beberapa contoh.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T10:15:39+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Ditulis oleh\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimasi waktu membaca\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 menit\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/\",\"url\":\"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/\",\"name\":\"Apa itu data berdimensi tinggi? (Definisi dan contoh)\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/id\/#website\"},\"datePublished\":\"2023-07-26T10:15:39+00:00\",\"dateModified\":\"2023-07-26T10:15:39+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\"},\"description\":\"Tutorial ini memberikan penjelasan tentang data berdimensi tinggi, termasuk definisi formal dan beberapa contoh.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/#breadcrumb\"},\"inLanguage\":\"id\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/statorials.org\/id\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Apa itu data berdimensi tinggi? (definisi &amp; contoh)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/id\/#website\",\"url\":\"https:\/\/statorials.org\/id\/\",\"name\":\"Statorials\",\"description\":\"Panduan anda untuk kompetensi statistik!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/id\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"id\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"id\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya\",\"sameAs\":[\"http:\/\/statorials.org\/id\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Apa itu data berdimensi tinggi? (Definisi dan contoh)","description":"Tutorial ini memberikan penjelasan tentang data berdimensi tinggi, termasuk definisi formal dan beberapa contoh.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/","og_locale":"id_ID","og_type":"article","og_title":"Apa itu data berdimensi tinggi? (Definisi dan contoh)","og_description":"Tutorial ini memberikan penjelasan tentang data berdimensi tinggi, termasuk definisi formal dan beberapa contoh.","og_url":"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/","og_site_name":"Statorials","article_published_time":"2023-07-26T10:15:39+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/hautedim1.png"}],"author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Ditulis oleh":"Benjamin anderson","Estimasi waktu membaca":"2 menit"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/","url":"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/","name":"Apa itu data berdimensi tinggi? (Definisi dan contoh)","isPartOf":{"@id":"https:\/\/statorials.org\/id\/#website"},"datePublished":"2023-07-26T10:15:39+00:00","dateModified":"2023-07-26T10:15:39+00:00","author":{"@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81"},"description":"Tutorial ini memberikan penjelasan tentang data berdimensi tinggi, termasuk definisi formal dan beberapa contoh.","breadcrumb":{"@id":"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/#breadcrumb"},"inLanguage":"id","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/id\/data-berdimensi-tinggi\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/statorials.org\/id\/"},{"@type":"ListItem","position":2,"name":"Apa itu data berdimensi tinggi? (definisi &amp; contoh)"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/id\/#website","url":"https:\/\/statorials.org\/id\/","name":"Statorials","description":"Panduan anda untuk kompetensi statistik!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/id\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"id"},{"@type":"Person","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"id","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya","sameAs":["http:\/\/statorials.org\/id"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1432"}],"collection":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/comments?post=1432"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/1432\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/media?parent=1432"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/categories?post=1432"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/tags?post=1432"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}