{"id":1167,"date":"2023-07-27T10:21:17","date_gmt":"2023-07-27T10:21:17","guid":{"rendered":"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/"},"modified":"2023-07-27T10:21:17","modified_gmt":"2023-07-27T10:21:17","slug":"cluster-sampling-bei-pandas","status":"publish","type":"post","link":"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/","title":{"rendered":"Cluster-sampling bei pandas: mit beispielen"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\">Forscher entnehmen h\u00e4ufig <a href=\"https:\/\/statorials.org\/de\/probenahmemethoden\/\" target=\"_blank\" rel=\"noopener noreferrer\">Stichproben<\/a> aus einer Population und nutzen die Daten aus der Stichprobe, um R\u00fcckschl\u00fcsse auf die Population als Ganzes zu ziehen.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Eine h\u00e4ufig verwendete Stichprobenmethode ist die <strong>Cluster-Stichprobe<\/strong> , bei der eine Population in Cluster unterteilt wird und alle Mitglieder <em>bestimmter<\/em> Cluster f\u00fcr die Aufnahme in die Stichprobe ausgew\u00e4hlt werden.<\/span><\/p>\n<p> <span style=\"color: #000000;\">In diesem Tutorial wird erl\u00e4utert, wie Sie Cluster-Sampling f\u00fcr einen Pandas-DataFrame in Python durchf\u00fchren.<\/span><\/p>\n<h2> <strong>Beispiel: Cluster-Sampling in Pandas<\/strong><\/h2>\n<p> <span style=\"color: #000000;\">Nehmen wir an, ein Unternehmen, das Stadtrundfahrten anbietet, m\u00f6chte seine Kunden befragen. Aus zehn Touren, die sie pro Tag anbieten, w\u00e4hlen sie zuf\u00e4llig vier Touren aus und bitten jeden Kunden, sein Erlebnis auf einer Skala von 1 bis 10 zu bewerten.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Der folgende Code zeigt, wie man einen Pandas-DataFrame f\u00fcr die Arbeit erstellt:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\"><span style=\"color: #000000;\"><span style=\"color: #008000;\">import<\/span> pandas <span style=\"color: #008000;\">as<\/span> pd\n<span style=\"color: #008000;\">import<\/span> numpy <span style=\"color: #008000;\">as<\/span> np\n<\/span>\n#make this example reproducible<\/span>\nn.p. <span style=\"color: #3366ff;\">random<\/span> . <span style=\"color: #3366ff;\">seeds<\/span> (0)\n\n<span style=\"color: #008080;\">#createDataFrame<\/span>\ndf = pd.DataFrame({'tour': np. <span style=\"color: #3366ff;\">repeat<\/span> (np. <span style=\"color: #3366ff;\">arange<\/span> (1,11), 20),\n                   'experience': np. <span style=\"color: #3366ff;\">random<\/span> . <span style=\"color: #3366ff;\">normal<\/span> (loc=7, scale=1, size=200)})\n\n<span style=\"color: #008080;\">#view first six rows of DataFrame<\/span>\ndf. <span style=\"color: #3366ff;\">head<\/span> ()\n\n  tour experience\n1 1 6.373546\n2 1 7.183643\n3 1 6.164371\n4 1 8.595281\n5 1 7.329508\n6 1 6.179532\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Und der folgende Code zeigt, wie man eine Stichprobe von Kunden erh\u00e4lt, indem man vier Besuche zuf\u00e4llig ausw\u00e4hlt und jedes Mitglied dieser Besuche in die Stichprobe einbezieht:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong><span style=\"color: #008080;\">#randomly choose 4 tour groups out of the 10<\/span>\nclusters = np. <span style=\"color: #3366ff;\">random<\/span> . <span style=\"color: #3366ff;\">choice<\/span> (np. <span style=\"color: #3366ff;\">arange<\/span> (1,11), size=4, replace= <span style=\"color: #008000;\">False<\/span> )\n\n<span style=\"color: #008080;\">#define sample as all members who belong to one of the 4 tour groups<\/span>\ncluster_sample = df[df[' <span style=\"color: #008000;\">tour<\/span> ']. <span style=\"color: #3366ff;\">isin<\/span> (clusters)]\n\n<span style=\"color: #008080;\">#view first six rows of sample\n<\/span>cluster_sample. <span style=\"color: #3366ff;\">head<\/span> ()\n\ntour experience\n40 3 5.951447\n41 3 5.579982\n42 3 5.293730\n43 3 8.950775\n44 3 6.490348 \n\n<span style=\"color: #008080;\">#find how many observations came from each tour group\n<\/span>cluster_sample[' <span style=\"color: #008000;\">tour<\/span> ']. <span style=\"color: #3366ff;\">value_counts<\/span> ()\n\n10 20\n6 20\n5 20\n3 20\nName: tour, dtype: int64<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Aus dem Ergebnis k\u00f6nnen wir Folgendes erkennen:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\">In die Stichprobe wurden 20 Kunden der Reisegruppe Nr. 10 einbezogen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">In die Stichprobe wurden 20 Kunden der Touristengruppe Nr. 6 einbezogen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">In die Stichprobe wurden 20 Kunden der Touristengruppe Nr. 5 einbezogen.<\/span><\/li>\n<li> <span style=\"color: #000000;\">In die Stichprobe wurden 20 Kunden der Touristengruppe Nr. 3 einbezogen.<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Somit besteht diese Stichprobe aus insgesamt 80 Kunden aus 4 verschiedenen Touristengruppen.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Zus\u00e4tzliche Ressourcen<\/strong><\/span><\/h3>\n<p> <a href=\"https:\/\/statorials.org\/de\/probenahmemethoden\/\" target=\"_blank\" rel=\"noopener noreferrer\">Verst\u00e4ndnis der verschiedenen Arten von Probenahmemethoden<\/a><br \/> <a href=\"https:\/\/statorials.org\/de\/pandas-geschichtete-probenahme\/\" target=\"_blank\" rel=\"noopener noreferrer\">Geschichtete Probenahme bei Pandas<\/a><br \/> <a href=\"https:\/\/statorials.org\/de\/systematische-probenahme-von-pandas\/\" target=\"_blank\" rel=\"noopener noreferrer\">Systematische Probenahme von Pandas<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Forscher entnehmen h\u00e4ufig Stichproben aus einer Population und nutzen die Daten aus der Stichprobe, um R\u00fcckschl\u00fcsse auf die Population als Ganzes zu ziehen. Eine h\u00e4ufig verwendete Stichprobenmethode ist die Cluster-Stichprobe , bei der eine Population in Cluster unterteilt wird und alle Mitglieder bestimmter Cluster f\u00fcr die Aufnahme in die Stichprobe ausgew\u00e4hlt werden. In diesem Tutorial [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Cluster-Sampling bei Pandas: mit Beispielen<\/title>\n<meta name=\"description\" content=\"In diesem Tutorial wird anhand mehrerer Beispiele erl\u00e4utert, wie Cluster-Sampling in Pandas durchgef\u00fchrt wird.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Cluster-Sampling bei Pandas: mit Beispielen\" \/>\n<meta property=\"og:description\" content=\"In diesem Tutorial wird anhand mehrerer Beispiele erl\u00e4utert, wie Cluster-Sampling in Pandas durchgef\u00fchrt wird.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-27T10:21:17+00:00\" \/>\n<meta name=\"author\" content=\"Dr. Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Dr. Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/\",\"url\":\"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/\",\"name\":\"Cluster-Sampling bei Pandas: mit Beispielen\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/de\/#website\"},\"datePublished\":\"2023-07-27T10:21:17+00:00\",\"dateModified\":\"2023-07-27T10:21:17+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\"},\"description\":\"In diesem Tutorial wird anhand mehrerer Beispiele erl\u00e4utert, wie Cluster-Sampling in Pandas durchgef\u00fchrt wird.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Heim\",\"item\":\"https:\/\/statorials.org\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Cluster-sampling bei pandas: mit beispielen\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/de\/#website\",\"url\":\"https:\/\/statorials.org\/de\/\",\"name\":\"Statorials\",\"description\":\"Ihr Leitfaden f\u00fcr statistische Kompetenz !\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/de\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0\",\"name\":\"Dr. Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Dr. Benjamin Anderson\"},\"description\":\"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen\",\"sameAs\":[\"https:\/\/statorials.org\/de\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Cluster-Sampling bei Pandas: mit Beispielen","description":"In diesem Tutorial wird anhand mehrerer Beispiele erl\u00e4utert, wie Cluster-Sampling in Pandas durchgef\u00fchrt wird.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/","og_locale":"de_DE","og_type":"article","og_title":"Cluster-Sampling bei Pandas: mit Beispielen","og_description":"In diesem Tutorial wird anhand mehrerer Beispiele erl\u00e4utert, wie Cluster-Sampling in Pandas durchgef\u00fchrt wird.","og_url":"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/","og_site_name":"Statorials","article_published_time":"2023-07-27T10:21:17+00:00","author":"Dr. Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Dr. Benjamin Anderson","Gesch\u00e4tzte Lesezeit":"2 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/","url":"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/","name":"Cluster-Sampling bei Pandas: mit Beispielen","isPartOf":{"@id":"https:\/\/statorials.org\/de\/#website"},"datePublished":"2023-07-27T10:21:17+00:00","dateModified":"2023-07-27T10:21:17+00:00","author":{"@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0"},"description":"In diesem Tutorial wird anhand mehrerer Beispiele erl\u00e4utert, wie Cluster-Sampling in Pandas durchgef\u00fchrt wird.","breadcrumb":{"@id":"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/de\/cluster-sampling-bei-pandas\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Heim","item":"https:\/\/statorials.org\/de\/"},{"@type":"ListItem","position":2,"name":"Cluster-sampling bei pandas: mit beispielen"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/de\/#website","url":"https:\/\/statorials.org\/de\/","name":"Statorials","description":"Ihr Leitfaden f\u00fcr statistische Kompetenz !","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/de\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/ec75c4d6365f2708f8a0ad3a42121aa0","name":"Dr. Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/statorials.org\/de\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/de\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Dr. Benjamin Anderson"},"description":"Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu bef\u00e4higen. Mehr wissen","sameAs":["https:\/\/statorials.org\/de"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/1167"}],"collection":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/comments?post=1167"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/posts\/1167\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/media?parent=1167"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/categories?post=1167"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/de\/wp-json\/wp\/v2\/tags?post=1167"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}