{"id":1376,"date":"2023-07-26T15:27:32","date_gmt":"2023-07-26T15:27:32","guid":{"rendered":"https:\/\/statorials.org\/pl\/winsoryzacja\/"},"modified":"2023-07-26T15:27:32","modified_gmt":"2023-07-26T15:27:32","slug":"winsoryzacja","status":"publish","type":"post","link":"https:\/\/statorials.org\/pl\/winsoryzacja\/","title":{"rendered":"Jak winsorize dane: definicja i przyk\u0142ady"},"content":{"rendered":"<p><\/p>\n<hr>\n<p><span style=\"color: #000000;\"><strong>Winsoryzacja<\/strong> danych oznacza ustawienie skrajnych warto\u015bci odstaj\u0105cych r\u00f3wnych okre\u015blonemu percentylowi danych.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Na przyk\u0142ad 90% winsoryzacja ustawia wszystkie <a href=\"https:\/\/statorials.org\/pl\/obserwacja-w-statystyce\/\" target=\"_blank\" rel=\"noopener\">obserwacje<\/a> powy\u017cej 95. percentyla na warto\u015b\u0107 na 95. percentylu, a wszystkie obserwacje poni\u017cej 5. percentyla s\u0105 r\u00f3wne warto\u015bci na 5. percentylu.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Rzeczywi\u015bcie, wygrywanie danych oznacza zmian\u0119 ekstremalnych warto\u015bci zbioru danych na mniej ekstremalne warto\u015bci.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Przyk\u0142ad: Jak Winsorize danych<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Za\u0142\u00f3\u017cmy, \u017ce mamy nast\u0119puj\u0105cy zbi\u00f3r danych:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>3, 14, 16, 16, 17, 29, 34, 36, 39, 47, 59, 64, 65, 66, 68, 79, 91, 98\n<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Aby przeprowadzi\u0107 90% winsoryzacj\u0119 tego zbioru danych, najpierw znajdziemy 5. i 95. percentyl, kt\u00f3re okazuj\u0105 si\u0119 by\u0107 nast\u0119puj\u0105ce:<\/span><\/p>\n<ul>\n<li> <span style=\"color: #000000;\"><strong>5. percentyl:<\/strong> 12,35<\/span><\/li>\n<li> <span style=\"color: #000000;\"><strong>95. percentyl:<\/strong> 92,05<\/span><\/li>\n<\/ul>\n<p> <span style=\"color: #000000;\">Ustawiliby\u015bmy wtedy wszystkie warto\u015bci mniejsze ni\u017c 12,35 na 12,35, a wszystkie warto\u015bci wi\u0119ksze ni\u017c 92,05 na 92,05:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>12.35, 14, 16, 16, 17, 29, 34, 36, 39, 47, 59, 64, 65, 66, 68, 79, 91, 92.05<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">W tym przypadku warto\u015b\u0107 <strong>3<\/strong> sta\u0142a si\u0119 <strong>12,35<\/strong> , a warto\u015b\u0107 <strong>98<\/strong> sta\u0142a si\u0119 <strong>92,05<\/strong> .<\/span><\/p>\n<h3> <strong><span style=\"color: #000000;\">Dlaczego dane Winsorize?<\/span><\/strong><\/h3>\n<p> <span style=\"color: #000000;\">\u015arednia i odchylenie standardowe to dwie powszechne metody pomiaru, odpowiednio <a href=\"https:\/\/statorials.org\/pl\/mierzy-tendencje-centralna\/\" target=\"_blank\" rel=\"noopener\">, po\u0142o\u017cenia \u015brodka<\/a> zbioru danych i rozk\u0142adu obserwacji w zbiorze danych.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Jednak\u017ce na obie te miary mog\u0105 mie\u0107 wp\u0142yw skrajne warto\u015bci odstaj\u0105ce. Zatem winsoryzacja danych pozwala nam zdefiniowa\u0107 skrajne warto\u015bci odstaj\u0105ce r\u00f3wne mniej ekstremalnym warto\u015bciom.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Cz\u0119sto pozwala nam to uzyska\u0107 dok\u0142adniejszy obraz \u015bredniej i odchylenia standardowego zbioru danych.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Winsorize ze \u015bliwkowego z\u0142ota<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Innym powszechnym sposobem radzenia sobie z warto\u015bciami odstaj\u0105cymi jest <strong>usuni\u0119cie<\/strong> ich ze zbioru danych, co oznacza ich ca\u0142kowite usuni\u0119cie.<\/span><\/p>\n<p> <span style=\"color: #000000;\">Rozwa\u017cmy na przyk\u0142ad poprzedni zbi\u00f3r danych:<\/span><\/p>\n<pre style=\"background-color: #ececec; font-size: 15px;\"> <strong>3, 14, 16, 16, 17, 29, 34, 36, 39, 47, 59, 64, 65, 66, 68, 79, 91, 98<\/strong><\/pre>\n<p> <span style=\"color: #000000;\">Gdyby\u015bmy chcieli zmniejszy\u0107 warto\u015bci poni\u017cej 5. percentyla lub powy\u017cej 95. percentyla, po prostu usun\u0119liby\u015bmy warto\u015bci <strong>3<\/strong> i <strong>98<\/strong> .<\/span><\/p>\n<p> <span style=\"color: #000000;\">Oto kilka praktycznych zasad dotycz\u0105cych stosowania krojenia lub winsoryzacji:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Przycinanie:<\/strong> Przycinanie warto\u015bci danych ma sens wtedy, gdy niekt\u00f3re warto\u015bci wydaj\u0105 si\u0119 zupe\u0142nie nieuzasadnione, czyli s\u0105 wynikiem b\u0142\u0119du przy wprowadzaniu danych.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>Winsoryzacja:<\/strong> Winsoryzacja danych ma sens, gdy chcemy zachowa\u0107 obserwacje skrajne, ale nie chcemy ich bra\u0107 zbyt dos\u0142ownie.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>\u015arodki ostro\u017cno\u015bci dotycz\u0105ce winsoryzacji danych<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">Decyduj\u0105c si\u0119 na pozyskiwanie danych, nale\u017cy pami\u0119ta\u0107 o kilku kwestiach:<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>1.<\/strong> Je\u015bli nie ma skrajnych warto\u015bci odstaj\u0105cych, wygrywanie danych spowoduje tylko nieznaczn\u0105 zmian\u0119 najmniejszych i najwi\u0119kszych warto\u015bci. Generalnie nie jest to dobry pomys\u0142, poniewa\u017c oznacza, \u017ce po prostu zmieniamy warto\u015bci danych wy\u0142\u0105cznie w celu ich zmiany.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>2.<\/strong> Warto\u015bci odstaj\u0105ce mog\u0105 reprezentowa\u0107 interesuj\u0105ce przypadki graniczne w danych. Dlatego przed edycj\u0105 warto\u015bci odstaj\u0105cych warto przyjrze\u0107 si\u0119 im bli\u017cej, aby zobaczy\u0107, co mog\u0142o je spowodowa\u0107.<\/span><\/p>\n<p> <span style=\"color: #000000;\"><strong>3.<\/strong> Decyzj\u0119 o winsoryzacji danych powiniene\u015b podj\u0105\u0107 <em>po<\/em> ich zebraniu, a nie przed. Przed podj\u0119ciem decyzji o winsoryzacji powiniene\u015b sprawdzi\u0107, czy rzeczywi\u015bcie istniej\u0105 jakie\u015b skrajne warto\u015bci odstaj\u0105ce. Je\u015bli nie wyst\u0119puj\u0105 \u017cadne skrajne warto\u015bci odstaj\u0105ce, winsoryzacja mo\u017ce by\u0107 niepotrzebna.<\/span><\/p>\n<h3> <span style=\"color: #000000;\"><strong>Samouczek: Winsorize danych w Excelu<\/strong><\/span><\/h3>\n<p> <span style=\"color: #000000;\">W <a href=\"https:\/\/statorials.org\/pl\/winsorize-dane-excela\/\" target=\"_blank\" rel=\"noopener\">tym samouczku<\/a> znajdziesz przyk\u0142adowy krok po kroku spos\u00f3b Winsorize zestawu danych w programie Excel.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Winsoryzacja danych oznacza ustawienie skrajnych warto\u015bci odstaj\u0105cych r\u00f3wnych okre\u015blonemu percentylowi danych. Na przyk\u0142ad 90% winsoryzacja ustawia wszystkie obserwacje powy\u017cej 95. percentyla na warto\u015b\u0107 na 95. percentylu, a wszystkie obserwacje poni\u017cej 5. percentyla s\u0105 r\u00f3wne warto\u015bci na 5. percentylu. Rzeczywi\u015bcie, wygrywanie danych oznacza zmian\u0119 ekstremalnych warto\u015bci zbioru danych na mniej ekstremalne warto\u015bci. Przyk\u0142ad: Jak Winsorize danych [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-1376","post","type-post","status-publish","format-standard","hentry","category-przewodnik"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v21.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Jak winsorizowa\u0107 dane: definicja i przyk\u0142ady - Statologia<\/title>\n<meta name=\"description\" content=\"W tym samouczku wyja\u015bniono, jak i dlaczego Winsorize dane, z kilkoma przyk\u0142adami.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/statorials.org\/pl\/winsoryzacja\/\" \/>\n<meta property=\"og:locale\" content=\"pl_PL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Jak winsorizowa\u0107 dane: definicja i przyk\u0142ady - Statologia\" \/>\n<meta property=\"og:description\" content=\"W tym samouczku wyja\u015bniono, jak i dlaczego Winsorize dane, z kilkoma przyk\u0142adami.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/statorials.org\/pl\/winsoryzacja\/\" \/>\n<meta property=\"og:site_name\" content=\"Statorials\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-26T15:27:32+00:00\" \/>\n<meta name=\"author\" content=\"Benjamin Anderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Napisane przez\" \/>\n\t<meta name=\"twitter:data1\" content=\"Benjamin Anderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Szacowany czas czytania\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 minuty\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/statorials.org\/pl\/winsoryzacja\/\",\"url\":\"https:\/\/statorials.org\/pl\/winsoryzacja\/\",\"name\":\"Jak winsorizowa\u0107 dane: definicja i przyk\u0142ady - Statologia\",\"isPartOf\":{\"@id\":\"https:\/\/statorials.org\/pl\/#website\"},\"datePublished\":\"2023-07-26T15:27:32+00:00\",\"dateModified\":\"2023-07-26T15:27:32+00:00\",\"author\":{\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965\"},\"description\":\"W tym samouczku wyja\u015bniono, jak i dlaczego Winsorize dane, z kilkoma przyk\u0142adami.\",\"breadcrumb\":{\"@id\":\"https:\/\/statorials.org\/pl\/winsoryzacja\/#breadcrumb\"},\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/statorials.org\/pl\/winsoryzacja\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/statorials.org\/pl\/winsoryzacja\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Dom\",\"item\":\"https:\/\/statorials.org\/pl\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Jak winsorize dane: definicja i przyk\u0142ady\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/statorials.org\/pl\/#website\",\"url\":\"https:\/\/statorials.org\/pl\/\",\"name\":\"Statorials\",\"description\":\"Tw\u00f3j przewodnik po kompetencjach statystycznych!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/statorials.org\/pl\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pl-PL\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965\",\"name\":\"Benjamin Anderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\/\/statorials.org\/pl\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"contentUrl\":\"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg\",\"caption\":\"Benjamin Anderson\"},\"description\":\"Cze\u015b\u0107, jestem Benjamin i jestem emerytowanym profesorem statystyki, kt\u00f3ry zosta\u0142 oddanym nauczycielem Statorials. Dzi\u0119ki bogatemu do\u015bwiadczeniu i wiedzy specjalistycznej w dziedzinie statystyki ch\u0119tnie dziel\u0119 si\u0119 swoj\u0105 wiedz\u0105, aby wzmocni\u0107 pozycj\u0119 uczni\u00f3w za po\u015brednictwem Statorials. Wiedzie\u0107 wi\u0119cej\",\"sameAs\":[\"https:\/\/statorials.org\/pl\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Jak winsorizowa\u0107 dane: definicja i przyk\u0142ady - Statologia","description":"W tym samouczku wyja\u015bniono, jak i dlaczego Winsorize dane, z kilkoma przyk\u0142adami.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/statorials.org\/pl\/winsoryzacja\/","og_locale":"pl_PL","og_type":"article","og_title":"Jak winsorizowa\u0107 dane: definicja i przyk\u0142ady - Statologia","og_description":"W tym samouczku wyja\u015bniono, jak i dlaczego Winsorize dane, z kilkoma przyk\u0142adami.","og_url":"https:\/\/statorials.org\/pl\/winsoryzacja\/","og_site_name":"Statorials","article_published_time":"2023-07-26T15:27:32+00:00","author":"Benjamin Anderson","twitter_card":"summary_large_image","twitter_misc":{"Napisane przez":"Benjamin Anderson","Szacowany czas czytania":"2 minuty"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/statorials.org\/pl\/winsoryzacja\/","url":"https:\/\/statorials.org\/pl\/winsoryzacja\/","name":"Jak winsorizowa\u0107 dane: definicja i przyk\u0142ady - Statologia","isPartOf":{"@id":"https:\/\/statorials.org\/pl\/#website"},"datePublished":"2023-07-26T15:27:32+00:00","dateModified":"2023-07-26T15:27:32+00:00","author":{"@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965"},"description":"W tym samouczku wyja\u015bniono, jak i dlaczego Winsorize dane, z kilkoma przyk\u0142adami.","breadcrumb":{"@id":"https:\/\/statorials.org\/pl\/winsoryzacja\/#breadcrumb"},"inLanguage":"pl-PL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/statorials.org\/pl\/winsoryzacja\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/statorials.org\/pl\/winsoryzacja\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Dom","item":"https:\/\/statorials.org\/pl\/"},{"@type":"ListItem","position":2,"name":"Jak winsorize dane: definicja i przyk\u0142ady"}]},{"@type":"WebSite","@id":"https:\/\/statorials.org\/pl\/#website","url":"https:\/\/statorials.org\/pl\/","name":"Statorials","description":"Tw\u00f3j przewodnik po kompetencjach statystycznych!","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/statorials.org\/pl\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pl-PL"},{"@type":"Person","@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/6484727a4612df3e69f016c3129c6965","name":"Benjamin Anderson","image":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/statorials.org\/pl\/#\/schema\/person\/image\/","url":"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","contentUrl":"https:\/\/statorials.org\/pl\/wp-content\/uploads\/2023\/11\/Benjamin-Anderson-96x96.jpg","caption":"Benjamin Anderson"},"description":"Cze\u015b\u0107, jestem Benjamin i jestem emerytowanym profesorem statystyki, kt\u00f3ry zosta\u0142 oddanym nauczycielem Statorials. Dzi\u0119ki bogatemu do\u015bwiadczeniu i wiedzy specjalistycznej w dziedzinie statystyki ch\u0119tnie dziel\u0119 si\u0119 swoj\u0105 wiedz\u0105, aby wzmocni\u0107 pozycj\u0119 uczni\u00f3w za po\u015brednictwem Statorials. Wiedzie\u0107 wi\u0119cej","sameAs":["https:\/\/statorials.org\/pl"]}]}},"yoast_meta":{"yoast_wpseo_title":"","yoast_wpseo_metadesc":"","yoast_wpseo_canonical":""},"_links":{"self":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts\/1376","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/comments?post=1376"}],"version-history":[{"count":0,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/posts\/1376\/revisions"}],"wp:attachment":[{"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/media?parent=1376"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/categories?post=1376"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statorials.org\/pl\/wp-json\/wp\/v2\/tags?post=1376"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}