วิธีการวิเคราะห์ตัวแปรเดียวใน python: พร้อมตัวอย่าง


คำว่า การวิเคราะห์ตัวแปรเดียว หมายถึงการวิเคราะห์ตัวแปรหนึ่งตัว คุณสามารถจำสิ่งนี้ได้เพราะคำนำหน้า “uni” แปลว่า “หนึ่ง”

มีสามวิธีทั่วไปในการวิเคราะห์ตัวแปรเดียวบนตัวแปร:

1. สถิติสรุป – วัดศูนย์กลางและการแจกแจงของค่า

2. ตารางความถี่ – อธิบายว่าค่าต่างๆ ปรากฏขึ้นบ่อยแค่ไหน

3. แผนภูมิ – ใช้เพื่อแสดงภาพการกระจายของค่า

บทช่วยสอนนี้แสดงตัวอย่างวิธีการวิเคราะห์แบบตัวแปรเดียวด้วย Pandas DataFrame ต่อไปนี้:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 6, 8, 8, 9, 3, 2, 6],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 6, 6, 7, 8, 7, 9, 15]})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.0 5 11
1 1.0 7 8
2 2.0 7 10
3 3.5 9 6
4 4.0 12 6

1. คำนวณสถิติสรุป

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อคำนวณสถิติสรุปต่างๆ สำหรับตัวแปร “points” ใน DataFrame:

 #calculate mean of 'points'
df[' points ']. mean ()

5.706666666666667

#calculate median of 'points' 
df[' points ']. median () 

5.0

#calculate standard deviation of 'points'
df[' points ']. std () 

3.858287308169384

2. สร้างตารางความถี่

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อสร้างตารางความถี่สำหรับตัวแปร ‘คะแนน’:

 #create frequency table for 'points'
df[' points ']. value_counts ()

4.0 3
1.0 2
5.0 2
2.0 1
3.5 1
6.5 1
7.0 1
7.4 1
8.0 1
13.0 1
14.2 1
Name: points, dtype: int64

สิ่งนี้บอกเราว่า:

  • ค่า 4 ปรากฏ 3 ครั้ง
  • ค่า 1 ปรากฏขึ้นสองครั้ง
  • ค่า 5 ปรากฏขึ้นสองครั้ง
  • ค่า 2 ปรากฏ 1 ครั้ง

และอื่นๆ

ที่เกี่ยวข้อง: วิธีสร้างตารางความถี่ใน Python

3. สร้างแผนภูมิ

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อสร้าง boxplot สำหรับตัวแปร ‘points’:

 import matplotlib. pyplot as plt

df. boxplot (column=[' points '], grid= False , color=' black ')

ที่เกี่ยวข้อง: วิธีสร้าง Boxplot จาก Pandas DataFrame

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อสร้างฮิสโตแกรมสำหรับตัวแปร ‘คะแนน’:

 import matplotlib. pyplot as plt

df. hist (column=' points ', grid= False , edgecolor=' black ')

ที่เกี่ยวข้อง: วิธีสร้างฮิสโตแกรมจาก Pandas DataFrame

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อสร้าง เส้นโค้งความหนาแน่น สำหรับตัวแปร “คะแนน”:

 import seaborn as sns

sns. kdeplot (df[' points '])

ที่เกี่ยวข้อง: วิธีสร้างแผนความหนาแน่นใน Matplotlib

กราฟแต่ละกราฟเหล่านี้ให้วิธีพิเศษในการแสดงภาพการกระจายค่าของตัวแปร “จุด”

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *