DataFrame - 컬럼의 집계함수
본문 바로가기
파이썬(Python)/데이터 분석

DataFrame - 컬럼의 집계함수

by 뚱구리 2022. 8. 29.
데이타프레임[컬럼명].집계함수()
데이타프레임.loc[행명].집계함수()
데이타프레임.집계함수(axis=0/1)

자주 쓰이는 함수 한번씩 햇갈릴때가 많으니 정리해보자

데이타프레임[컬럼명].집계함수()
# 샘플 데이터
data = {'kor':[40, 55, 66],
         'math':[70, 55, 66],
         'eng':[80, 95, 100]}
index=['user1','user2','user3']
df = pd.DataFrame(data, index=index)
df

결과 데이터

국어 kor 컬럼의 총합과 평균

kor 컬럼의 총합 sum()
kor 컬럼의 평균 mean()



# 국어 컬럼의 총합

# 방법 1
df['kor'].sum()

# 방법 2
df.loc[:, 'kor'].sum()

# 방법 3
df.iloc[:, 0].sum()

결과는 동일하게 161 값이 나온다.

# 국어 컬럼의 평균

# 방법 1
df['kor'].mean()

# 방법 2 : 소수점 둘째자리까지 표시
round(df.loc[:, 'kor'].mean(), 2)

# 방법 3 : 소수점 셋째자리까지 표시
round(df.iloc[:, 0].mean(), 3)

결과는 평균 53.xxxx 값이 출력됨.

두 개의 컬럼 합과 평균
# 국어와 수학 컬럼의 총 합
df[['kor', 'math']].sum()

# 국어와 수학 컬럼의 평균
df[['kor','math']].mean()

결과 확인

결과 데이터

데이타프레임.loc[행명].집계함수()

user1 과목 총합과 평균확인

# user1 의 총합
df.loc['user1'].sum()

# user1 의 평균
df.loc['user1'].mean()

user1 총 합 : 40 + 70 + 80 = 190 나옴!
user1 평균 : 190 / 3 맞음 !!

모든 컬럼의 평균과 합
# 모든 컬럼의 평균 - 방법 1
df.loc[:].mean()

# 방법 2
df.iloc[:].mean()
df.iloc[0:3].mean()

# 방법 3
df.mean()
df.mean(axis=0)

# 모든 컬럼의 합은 mean() 대신 sum()을 사용하면 된다.
데이타프레임.집계함수(axis=0/1)

전부 동일한 값이 출력이 된다.

# 각 행의 평균
df.mean(axis=1)

# 각 행의 총합
df.sum(axis=1)

처음도 그렇고 지금도 그렇고 axis = 0 과 axis = 1 .. 햇갈린다....


데이터프레임 컬럼 추가

이제 평균 구한 값을 새로운 컬럼으로 생성해서 추가해보자.
user 의 성적 평균

# 평균 mean 컬럼 추가
# 소수점 둘째자리까지 표시

df['mean'] = round(df.mean(axis=1),2)
df

user 마다 성적 평균 컬럼 !





여기서 학생별 평균이 있으면 과목별 평균도 궁금할 수 있음.

# 컬럼별 평균
# 소수 둘째자리까지 출력

df.loc['mean'] = round(df.mean(axis=0), 2)
df
결과 데이터


📖 배운거 복습용으로 작성
작성 기준일 : 22. 08. 29 / 구글 코랩
※ 고수님들 만약 내용에 잘못된 부분이 있다면 알려주세요 😉

728x90

'파이썬(Python) > 데이터 분석' 카테고리의 다른 글

DataFrame - 수정 (U)_rename  (0) 2022.08.30
DataFrame - 수정(U)  (0) 2022.08.29
DataFrame - 삭제(D)  (0) 2022.08.29
Pandas  (0) 2022.08.12
NumPy  (0) 2022.08.08