데이타프레임[컬럼명].집계함수()
데이타프레임.loc[행명].집계함수()
데이타프레임.집계함수(axis=0/1)
자주 쓰이는 함수 한번씩 햇갈릴때가 많으니 정리해보자
데이타프레임[컬럼명].집계함수()
# 샘플 데이터
data = {'kor':[40, 55, 66],
'math':[70, 55, 66],
'eng':[80, 95, 100]}
index=['user1','user2','user3']
df = pd.DataFrame(data, index=index)
df

국어 kor 컬럼의 총합과 평균

kor 컬럼의 총합 sum()
kor 컬럼의 평균 mean()
# 국어 컬럼의 총합
# 방법 1
df['kor'].sum()
# 방법 2
df.loc[:, 'kor'].sum()
# 방법 3
df.iloc[:, 0].sum()
결과는 동일하게 161 값이 나온다.
# 국어 컬럼의 평균
# 방법 1
df['kor'].mean()
# 방법 2 : 소수점 둘째자리까지 표시
round(df.loc[:, 'kor'].mean(), 2)
# 방법 3 : 소수점 셋째자리까지 표시
round(df.iloc[:, 0].mean(), 3)
결과는 평균 53.xxxx 값이 출력됨.
두 개의 컬럼 합과 평균
# 국어와 수학 컬럼의 총 합
df[['kor', 'math']].sum()
# 국어와 수학 컬럼의 평균
df[['kor','math']].mean()
결과 확인

데이타프레임.loc[행명].집계함수()
user1 과목 총합과 평균확인
# user1 의 총합
df.loc['user1'].sum()
# user1 의 평균
df.loc['user1'].mean()

user1 총 합 : 40 + 70 + 80 = 190 나옴!
user1 평균 : 190 / 3 맞음 !!
모든 컬럼의 평균과 합
# 모든 컬럼의 평균 - 방법 1
df.loc[:].mean()
# 방법 2
df.iloc[:].mean()
df.iloc[0:3].mean()
# 방법 3
df.mean()
df.mean(axis=0)
# 모든 컬럼의 합은 mean() 대신 sum()을 사용하면 된다.
데이타프레임.집계함수(axis=0/1)
전부 동일한 값이 출력이 된다.
# 각 행의 평균
df.mean(axis=1)
# 각 행의 총합
df.sum(axis=1)
처음도 그렇고 지금도 그렇고 axis = 0 과 axis = 1 .. 햇갈린다....
데이터프레임 컬럼 추가
이제 평균 구한 값을 새로운 컬럼으로 생성해서 추가해보자.
user 의 성적 평균
# 평균 mean 컬럼 추가
# 소수점 둘째자리까지 표시
df['mean'] = round(df.mean(axis=1),2)
df

user 마다 성적 평균 컬럼 !
여기서 학생별 평균이 있으면 과목별 평균도 궁금할 수 있음.
# 컬럼별 평균
# 소수 둘째자리까지 출력
df.loc['mean'] = round(df.mean(axis=0), 2)
df

📖 배운거 복습용으로 작성
작성 기준일 : 22. 08. 29 / 구글 코랩
※ 고수님들 만약 내용에 잘못된 부분이 있다면 알려주세요 😉
728x90
'파이썬(Python) > 데이터 분석' 카테고리의 다른 글
DataFrame - 수정 (U)_rename (0) | 2022.08.30 |
---|---|
DataFrame - 수정(U) (0) | 2022.08.29 |
DataFrame - 삭제(D) (0) | 2022.08.29 |
Pandas (0) | 2022.08.12 |
NumPy (0) | 2022.08.08 |