{"id":2170,"date":"2023-07-23T10:04:03","date_gmt":"2023-07-23T10:04:03","guid":{"rendered":"https:\/\/statorials.org\/id\/auc-dengan-python\/"},"modified":"2023-07-23T10:04:03","modified_gmt":"2023-07-23T10:04:03","slug":"auc-dengan-python","status":"publish","type":"post","link":"https:\/\/statorials.org\/id\/auc-dengan-python\/","title":{"rendered":"Cara menghitung auc (area di bawah kurva) dengan python"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><a href=\"https:\/\/statorials.org\/id\/regresi-logistik-1\/\" target=\"_blank\" rel=\"noopener noreferrer\">Regresi logistik<\/a> adalah metode statistik yang kami gunakan untuk menyesuaikan model regresi jika variabel responsnya biner.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Untuk mengevaluasi seberapa cocok model regresi logistik dengan kumpulan data, kita dapat melihat dua metrik berikut:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>Sensitivitas:<\/strong> probabilitas model memprediksi hasil positif untuk suatu observasi padahal hasilnya benar-benar positif. Ini juga disebut \u201ctingkat positif sebenarnya\u201d.<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>Kekhususan:<\/strong> probabilitas model memprediksi hasil negatif untuk suatu observasi padahal hasilnya sebenarnya negatif. Ini juga disebut \u201ctingkat negatif sebenarnya\u201d.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Salah satu cara untuk memvisualisasikan kedua pengukuran ini adalah dengan membuat <strong>kurva ROC<\/strong> , yang merupakan singkatan dari kurva \u201ckarakteristik pengoperasian penerima\u201d.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ini adalah grafik yang menampilkan sensitivitas sepanjang sumbu y dan (1 \u2013 spesifisitas) sepanjang sumbu x.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Salah satu cara untuk mengukur efektivitas model regresi logistik dalam mengklasifikasikan data adalah dengan menghitung <strong>AUC<\/strong> , yang merupakan singkatan dari &#8220;area di bawah kurva&#8221;.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Semakin dekat AUC ke 1, maka semakin baik model tersebut.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Contoh langkah demi langkah berikut menunjukkan cara menghitung AUC untuk model regresi logistik dengan Python.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Langkah 1: Impor paket<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Pertama, kita akan mengimpor paket yang diperlukan untuk melakukan regresi logistik dengan Python:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #107d3f;\">import<\/span> pandas <span style=\"color: #107d3f;\">as<\/span> pd\n<span style=\"color: #008000;\">import<\/span> numpy <span style=\"color: #008000;\">as<\/span> np\n<span style=\"color: #008000;\">from<\/span> sklearn. <span style=\"color: #3366ff;\">model_selection<\/span> <span style=\"color: #008000;\">import<\/span> train_test_split\n<span style=\"color: #008000;\">from<\/span> sklearn. <span style=\"color: #3366ff;\">linear_model<\/span> <span style=\"color: #008000;\">import<\/span> LogisticRegression\n<span style=\"color: #008000;\">from<\/span> sklearn <span style=\"color: #008000;\">import<\/span> metrics\n<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Langkah 2: Sesuaikan model regresi logistik<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Selanjutnya, kita akan mengimpor kumpulan data dan menyesuaikan model regresi logistik ke dalamnya:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008080;\">#import dataset from CSV file on Github\n<\/span>url = \"https:\/\/raw.githubusercontent.com\/Statorials\/Python-Guides\/main\/default.csv\"\ndata = pd. <span style=\"color: #3366ff;\">read_csv<\/span> (url)\n\n<span style=\"color: #008080;\">#define the predictor variables and the response variable\n<\/span>X = data[[' <span style=\"color: #ff0000;\">student<\/span> ',' <span style=\"color: #ff0000;\">balance<\/span> ',' <span style=\"color: #ff0000;\">income<\/span> ']]\ny = data[' <span style=\"color: #ff0000;\">default<\/span> ']\n\n<span style=\"color: #008080;\">#split the dataset into training (70%) and testing (30%) sets\n<\/span>X_train,X_test,y_train,y_test = train_test_split(X,y,test_size= <span style=\"color: #008000;\">0.3<\/span> ,random_state= <span style=\"color: #008000;\">0<\/span> ) \n\n<span style=\"color: #008080;\">#instantiate the model\n<\/span>log_regression = LogisticRegression()\n\n<span style=\"color: #008080;\">#fit the model using the training data\n<\/span>log_regression. <span style=\"color: #3366ff;\">fit<\/span> (X_train,y_train)<\/strong><\/span><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>Langkah 3: Hitung AUC<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Kita dapat menggunakan fungsi <strong>metrics.roc_auc_score()<\/strong> untuk menghitung AUC model:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <span style=\"color: #000000;\"><strong><span style=\"color: #008080;\">#use model to predict probability that given y value is 1\n<\/span>y_pred_proba = log_regression. <span style=\"color: #3366ff;\">predict_proba<\/span> (X_test)[::, <span style=\"color: #008000;\">1<\/span> ]\n\n<span style=\"color: #008080;\">#calculate AUC of model\n<\/span>auc = metrics. <span style=\"color: #3366ff;\">roc_auc_score<\/span> (y_test, y_pred_proba)\n\n<span style=\"color: #008080;\">#print AUC score\n<\/span><span style=\"color: #008000;\">print<\/span> (auc)\n\n0.5602104030579559\n<\/strong><\/span><\/pre>\n<p> <span style=\"color: #000000;\">AUC (area di bawah kurva) untuk model khusus ini adalah <strong>0,5602<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Ingatlah bahwa model dengan skor AUC <strong>0,5<\/strong> tidak lebih baik daripada model yang membuat tebakan acak.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jadi, dalam banyak kasus, model dengan skor AUC <strong>0,5602<\/strong> akan dianggap buruk dalam mengklasifikasikan observasi ke dalam kelas yang benar.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Sumber daya tambahan<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Tutorial berikut memberikan informasi tambahan tentang kurva ROC dan skor AUC:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/id\/menafsirkan-kurva-batuan\/\" target=\"_blank\" rel=\"noopener\">Cara Menafsirkan Kurva ROC (dengan Contoh)<\/a><br \/> <a href=\"https:\/\/statorials.org\/id\" target=\"_blank\" rel=\"noopener\">Apa yang dianggap sebagai skor AUC yang baik?<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Regresi logistik adalah metode statistik yang kami gunakan untuk menyesuaikan model regresi jika variabel responsnya biner. Untuk mengevaluasi seberapa cocok model regresi logistik dengan kumpulan data, kita dapat melihat dua metrik berikut: Sensitivitas: probabilitas model memprediksi hasil positif untuk suatu observasi padahal hasilnya benar-benar positif. Ini juga disebut \u201ctingkat positif sebenarnya\u201d. Kekhususan: probabilitas model memprediksi [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Cara menghitung AUC (Area Under Curve) dengan Python - Statologi<\/title>\n<meta name=\"description\" content=\"Tutorial ini menjelaskan cara menghitung AUC (area under curve) untuk model regresi logistik di R, termasuk contoh langkah demi langkah.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/id\/auc-dengan-python\/\" \/>\n<meta property=\"og:locale\" content=\"id_ID\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Cara menghitung AUC (Area Under Curve) dengan Python - Statologi\" \/>\n<meta property=\"og:description\" content=\"Tutorial ini menjelaskan cara menghitung AUC (area under curve) untuk model regresi logistik di R, termasuk contoh langkah demi langkah.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/id\/auc-dengan-python\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-23T10:04:03+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Ditulis oleh\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimasi waktu membaca\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 menit\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/id\/auc-dengan-python\/\",\"url\":\"https:\/\/statorials.org\/id\/auc-dengan-python\/\",\"name\":\"Cara menghitung AUC (Area Under Curve) dengan Python - Statologi\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/id\/#website\"},\"datePublished\":\"2023-07-23T10:04:03+00:00\",\"dateModified\":\"2023-07-23T10:04:03+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\"},\"description\":\"Tutorial ini menjelaskan cara menghitung AUC (area under curve) untuk model regresi logistik di R, termasuk contoh langkah demi langkah.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/id\/auc-dengan-python\/#breadcrumb\"},\"inLanguage\":\"id\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/id\/auc-dengan-python\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/id\/auc-dengan-python\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/statorials.org\/id\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Cara menghitung auc (area di bawah kurva) dengan python\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/id\/#website\",\"url\":\"https:\/\/statorials.org\/id\/\",\"name\":\"Statorials\",\"description\":\"Panduan anda untuk kompetensi statistik!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/id\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"id\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81\",\"name\":\"Benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"id\",\"@id\":\"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin anderson\"},\"description\":\"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya\",\"sameAs\":[\"http:\/\/statorials.org\/id\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Cara menghitung AUC (Area Under Curve) dengan Python - Statologi","description":"Tutorial ini menjelaskan cara menghitung AUC (area under curve) untuk model regresi logistik di R, termasuk contoh langkah demi langkah.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/id\/auc-dengan-python\/","og_locale":"id_ID","og_type":"article","og_title":"Cara menghitung AUC (Area Under Curve) dengan Python - Statologi","og_description":"Tutorial ini menjelaskan cara menghitung AUC (area under curve) untuk model regresi logistik di R, termasuk contoh langkah demi langkah.","og_url":"https:\/\/statorials.org\/id\/auc-dengan-python\/","og_site_name":"Statorials","article_published_time":"2023-07-23T10:04:03+00:00","author":"Benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Ditulis oleh":"Benjamin anderson","Estimasi waktu membaca":"2 menit"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/id\/auc-dengan-python\/","url":"https:\/\/statorials.org\/id\/auc-dengan-python\/","name":"Cara menghitung AUC (Area Under Curve) dengan Python - Statologi","isPartOf":{"@id":"https:\/\/statorials.org\/id\/#website"},"datePublished":"2023-07-23T10:04:03+00:00","dateModified":"2023-07-23T10:04:03+00:00","author":{"@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81"},"description":"Tutorial ini menjelaskan cara menghitung AUC (area under curve) untuk model regresi logistik di R, termasuk contoh langkah demi langkah.","breadcrumb":{"@id":"https:\/\/statorials.org\/id\/auc-dengan-python\/#breadcrumb"},"inLanguage":"id","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/id\/auc-dengan-python\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/id\/auc-dengan-python\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/statorials.org\/id\/"},{"@type":"ListItem","position":2,"name":"Cara menghitung auc (area di bawah kurva) dengan python"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/id\/#website","url":"https:\/\/statorials.org\/id\/","name":"Statorials","description":"Panduan anda untuk kompetensi statistik!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/id\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"id"},{"@type":"Person","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/3d17a1160dd2d052b7c78e502cb9ec81","name":"Benjamin anderson","image":{"@type":"ImageObject","inLanguage":"id","@id":"https:\/\/statorials.org\/id\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/id\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Benjamin anderson"},"description":"Halo, saya Benjamin, pensiunan profesor statistika yang menjadi guru Statorial yang berdedikasi. Dengan pengalaman dan keahlian yang luas di bidang statistika, saya ingin berbagi ilmu untuk memberdayakan mahasiswa melalui Statorials. Baca selengkapnya","sameAs":["http:\/\/statorials.org\/id"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/2170"}],"collection":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/comments?post=2170"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/posts\/2170\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/media?parent=2170"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/categories?post=2170"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/id\/wp-json\/wp\/v2\/tags?post=2170"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}