{"id":2460,"date":"2023-07-22T04:29:06","date_gmt":"2023-07-22T04:29:06","guid":{"rendered":"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/"},"modified":"2023-07-22T04:29:06","modified_gmt":"2023-07-22T04:29:06","slug":"bivariate-analyse-in-python","status":"publish","type":"post","link":"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/","title":{"rendered":"Bivariate analyse uitvoeren in python: met voorbeelden"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">De term <strong>bivariate analyse<\/strong> verwijst naar de analyse van twee variabelen. U kunt dit onthouden omdat het voorvoegsel \u201cbi\u201d \u201ctwee\u201d betekent.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het doel van bivariate analyse is om de relatie tussen twee variabelen te begrijpen<\/span><\/p>\n<p> <span style=\"color: #000000;\">Er zijn drie veelgebruikte manieren om bivariate analyses uit te voeren:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Puntenwolken<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Correlatieco\u00ebffici\u00ebnten<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Eenvoudige lineaire regressie<\/span><\/p>\n<p> <span style=\"color: #000000;\">Het volgende voorbeeld laat zien hoe u elk van deze soorten bivariate analyses in Python kunt uitvoeren met behulp van de volgende panda&#8217;s DataFrame die informatie bevat over twee variabelen: <strong>(1)<\/strong> Uren besteed aan studeren en <strong>(2)<\/strong> Examenscore behaald door 20 verschillende studenten:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> pandas <span style=\"color: #008000;\">as<\/span> pd\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd. <span style=\"color: #3366ff;\">DataFrame<\/span> ({' <span style=\"color: #ff0000;\">hours<\/span> ': [1, 1, 1, 2, 2, 2, 3, 3, 3, 3,\n                             3, 4, 4, 5, 5, 6, 6, 6, 7, 8],\n                   ' <span style=\"color: #ff0000;\">score<\/span> ': [75, 66, 68, 74, 78, 72, 85, 82, 90, 82,\n                             80, 88, 85, 90, 92, 94, 94, 88, 91, 96]})\n\n<span style=\"color: #008080;\">#view first five rows of DataFrame\n<\/span>df. <span style=\"color: #3366ff;\">head<\/span> ()\n\n\thours score\n0 1 75\n1 1 66\n2 1 68\n3 2 74\n4 2 78<\/strong><\/pre>\n<h3> <span style=\"color: #000000;\"><strong>1. Puntenwolken<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">We kunnen de volgende syntaxis gebruiken om een spreidingsdiagram te maken van de bestudeerde uren versus de examenresultaten:<\/span> <\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> matplotlib. <span style=\"color: #008000;\"><span style=\"color: #3366ff;\">pyplot<\/span> as<\/span> plt\n\n<span style=\"color: #008080;\">#create scatterplot of hours vs. score<\/span>\nplt. <span style=\"color: #3366ff;\">scatter<\/span> (df. <span style=\"color: #3366ff;\">hours<\/span> , df. <span style=\"color: #3366ff;\">score<\/span> )\nplt. <span style=\"color: #3366ff;\">title<\/span> (' <span style=\"color: #ff0000;\">Hours Studied vs. Exam Score<\/span> ')\nplt. <span style=\"color: #3366ff;\">xlabel<\/span> (' <span style=\"color: #ff0000;\">Hours Studied<\/span> ')\nplt. <span style=\"color: #3366ff;\">ylabel<\/span> (' <span style=\"color: #ff0000;\">Exam Score<\/span> ')\n<\/strong><\/pre>\n<p><img decoding=\"async\" loading=\"lazy\" class=\" wp-image-22049 aligncenter\" src=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/bivpython1.png\" alt=\"\" width=\"526\" height=\"365\" srcset=\"\" sizes=\"auto, \"><\/p>\n<p> <span style=\"color: #000000;\">Op de x-as staan de bestudeerde uren en op de y-as het behaalde cijfer voor het examen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Uit de grafiek blijkt dat er een positief verband bestaat tussen beide variabelen: naarmate het aantal studie-uren toeneemt, stijgen ook de examenscores.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>2. Correlatieco\u00ebffici\u00ebnten<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Een Pearson-correlatieco\u00ebffici\u00ebnt is een manier om de lineaire relatie tussen twee variabelen te kwantificeren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen de functie <strong>corr()<\/strong> in panda&#8217;s gebruiken om een correlatiematrix te maken:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#create correlation matrix\n<\/span>df. <span style=\"color: #3366ff;\">corr<\/span> ()\n\n\thours score\nhours 1.000000 0.891306\nscore 0.891306 1.000000<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">De correlatieco\u00ebffici\u00ebnt blijkt <strong>0,891<\/strong> te zijn. Dit<\/span> <span style=\"color: #000000;\">duidt op een sterke positieve correlatie tussen het aantal gestudeerde uren en het examencijfer.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>3. Eenvoudige lineaire regressie<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Eenvoudige lineaire regressie is een statistische methode die we kunnen gebruiken om de relatie tussen twee variabelen te kwantificeren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen de functie <strong>OLS()<\/strong> uit het statsmodels-pakket gebruiken om snel een <a href=\"https:\/\/statorials.org\/nl\/eenvoudige-lineaire-regressie-in-python\/\" target=\"_blank\" rel=\"noopener\">eenvoudig lineair regressiemodel<\/a> in te passen voor de bestudeerde uren en ontvangen examenresultaten:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008000;\">import<\/span> statsmodels. <span style=\"color: #3366ff;\">api<\/span> <span style=\"color: #008000;\">as<\/span> sm\n\n<span style=\"color: #008080;\">#define response variable\n<\/span>y = df[' <span style=\"color: #ff0000;\">score<\/span> ']\n\n<span style=\"color: #008080;\">#define explanatory variable\n<\/span>x = df[[' <span style=\"color: #ff0000;\">hours<\/span> ']]\n\n<span style=\"color: #008080;\">#add constant to predictor variables\n<\/span>x = sm. <span style=\"color: #3366ff;\">add_constant<\/span> (x)\n\n<span style=\"color: #008080;\">#fit linear regression model\n<\/span>model = sm. <span style=\"color: #3366ff;\">OLS<\/span> (y,x). <span style=\"color: #3366ff;\">fit<\/span> ()\n\n<span style=\"color: #008080;\">#view model summary\n<\/span><span style=\"color: #008000;\">print<\/span> ( <span style=\"color: #3366ff;\">model.summary<\/span> ())\n\n                            OLS Regression Results                            \n==================================================== ============================\nDept. Variable: R-squared score: 0.794\nModel: OLS Adj. R-squared: 0.783\nMethod: Least Squares F-statistic: 69.56\nDate: Mon, 22 Nov 2021 Prob (F-statistic): 1.35e-07\nTime: 16:15:52 Log-Likelihood: -55,886\nNo. Observations: 20 AIC: 115.8\nDf Residuals: 18 BIC: 117.8\nModel: 1                                         \nCovariance Type: non-robust                                         \n==================================================== ============================\n                 coef std err t P&gt;|t| [0.025 0.975]\n-------------------------------------------------- ----------------------------\nconst 69.0734 1.965 35.149 0.000 64.945 73.202\nhours 3.8471 0.461 8.340 0.000 2.878 4.816\n==================================================== ============================\nOmnibus: 0.171 Durbin-Watson: 1.404\nProb(Omnibus): 0.918 Jarque-Bera (JB): 0.177\nSkew: 0.165 Prob(JB): 0.915\nKurtosis: 2.679 Cond. No. 9.37\n==================================================== ============================\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">De gepaste regressievergelijking blijkt te zijn:<\/span><\/p>\n<p> <span style=\"color: #000000;\">Examenscore = 69.0734 + 3.8471*(uren gestudeerd)<\/span><\/p>\n<p> <span style=\"color: #000000;\">Dit vertelt ons dat elk extra uur dat wordt gestudeerd, gepaard gaat met een gemiddelde stijging van <strong>3,8471<\/strong> in de examenscore.<\/span><\/p>\n<p> <span style=\"color: #000000;\">We kunnen de gepaste regressievergelijking ook gebruiken om de score te voorspellen die een student zal behalen op basis van het totale aantal bestudeerde uren.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Een student die bijvoorbeeld 3 uur studeert, zou een score van <strong>81,6147<\/strong> moeten behalen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">Examenscore = 69.0734 + 3.8471*(uren gestudeerd)<\/span><\/li>\n<li> <span style=\"color: #000000;\">Examenscore = 69,0734 + 3,8471*(3)<\/span><\/li>\n<li> <span style=\"color: #000000;\">Examenresultaat = 81,6147<\/span><\/li>\n<\/ul>\n<h3> <span style=\"color: #000000;\"><strong>Aanvullende bronnen<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">De volgende tutorials bieden aanvullende informatie over bivariate analyse:<\/span><\/p>\n<p> <a href=\"https:\/\/statorials.org\/nl\/bivariate-analyse\/\" target=\"_blank\" rel=\"noopener\">Een inleiding tot bivariate analyse<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/bivariate-gegevens-echte-voorbeelden\/\" target=\"_blank\" rel=\"noopener\">5 voorbeelden van bivariate gegevens in het echte leven<\/a><br \/> <a href=\"https:\/\/statorials.org\/nl\/lineaire-regressie-1\/\" target=\"_blank\" rel=\"noopener\">Een inleiding tot eenvoudige lineaire regressie<\/a><br \/><a href=\"https:\/\/statorials.org\/nl\/pearson-correlatiecoefficient-1\/\" target=\"_blank\" rel=\"noopener\">Een inleiding tot de Pearson-correlatieco\u00ebffici\u00ebnt<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>De term bivariate analyse verwijst naar de analyse van twee variabelen. U kunt dit onthouden omdat het voorvoegsel \u201cbi\u201d \u201ctwee\u201d betekent. Het doel van bivariate analyse is om de relatie tussen twee variabelen te begrijpen Er zijn drie veelgebruikte manieren om bivariate analyses uit te voeren: 1. Puntenwolken 2. Correlatieco\u00ebffici\u00ebnten 3. Eenvoudige lineaire regressie Het [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-2460","post","type-post","status-publish","format-standard","hentry","category-gids"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Bivariate analyse uitvoeren in Python (met voorbeelden) - Statorials<\/title>\n<meta name=\"description\" content=\"In deze tutorial wordt uitgelegd hoe u bivariate analyses uitvoert in Python, met verschillende voorbeelden.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Bivariate analyse uitvoeren in Python (met voorbeelden) - Statorials\" \/>\n<meta property=\"og:description\" content=\"In deze tutorial wordt uitgelegd hoe u bivariate analyses uitvoert in Python, met verschillende voorbeelden.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-22T04:29:06+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/bivpython1.png\" \/>\n<meta name=\"author\" content=\"Dr.benjamin anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr.benjamin anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/\",\"url\":\"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/\",\"name\":\"Bivariate analyse uitvoeren in Python (met voorbeelden) - Statorials\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/nl\/#website\"},\"datePublished\":\"2023-07-22T04:29:06+00:00\",\"dateModified\":\"2023-07-22T04:29:06+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\"},\"description\":\"In deze tutorial wordt uitgelegd hoe u bivariate analyses uitvoert in Python, met verschillende voorbeelden.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Thuis\",\"item\":\"https:\/\/statorials.org\/nl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Bivariate analyse uitvoeren in python: met voorbeelden\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/nl\/#website\",\"url\":\"https:\/\/statorials.org\/nl\/\",\"name\":\"Statorials\",\"description\":\"Uw gids voor statistische competentie\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/nl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219\",\"name\":\"Dr.benjamin anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/\",\"url\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr.benjamin anderson\"},\"description\":\"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder\",\"sameAs\":[\"http:\/\/statorials.org\/nl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Bivariate analyse uitvoeren in Python (met voorbeelden) - Statorials","description":"In deze tutorial wordt uitgelegd hoe u bivariate analyses uitvoert in Python, met verschillende voorbeelden.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/","og_locale":"de_DE","og_type":"article","og_title":"Bivariate analyse uitvoeren in Python (met voorbeelden) - Statorials","og_description":"In deze tutorial wordt uitgelegd hoe u bivariate analyses uitvoert in Python, met verschillende voorbeelden.","og_url":"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/","og_site_name":"Statorials","article_published_time":"2023-07-22T04:29:06+00:00","og_image":[{"url":"https:\/\/statorials.org\/wp-content\/uploads\/2023\/08\/bivpython1.png"}],"author":"Dr.benjamin anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr.benjamin anderson","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/","url":"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/","name":"Bivariate analyse uitvoeren in Python (met voorbeelden) - Statorials","isPartOf":{"@id":"https:\/\/statorials.org\/nl\/#website"},"datePublished":"2023-07-22T04:29:06+00:00","dateModified":"2023-07-22T04:29:06+00:00","author":{"@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219"},"description":"In deze tutorial wordt uitgelegd hoe u bivariate analyses uitvoert in Python, met verschillende voorbeelden.","breadcrumb":{"@id":"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/nl\/bivariate-analyse-in-python\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Thuis","item":"https:\/\/statorials.org\/nl\/"},{"@type":"ListItem","position":2,"name":"Bivariate analyse uitvoeren in python: met voorbeelden"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/nl\/#website","url":"https:\/\/statorials.org\/nl\/","name":"Statorials","description":"Uw gids voor statistische competentie","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/nl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/d4b8842173cca1bb62cdec41860e4219","name":"Dr.benjamin anderson","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/statorials.org\/nl\/#\/schema\/person\/image\/","url":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","contentUrl":"http:\/\/statorials.org\/nl\/wp-content\/uploads\/2023\/10\/Dr.-Benjamin-Anderson-96x96.jpg","caption":"Dr.benjamin anderson"},"description":"Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder","sameAs":["http:\/\/statorials.org\/nl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/2460","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/comments?post=2460"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/posts\/2460\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/media?parent=2460"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/categories?post=2460"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/nl\/wp-json\/wp\/v2\/tags?post=2460"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}