데이터프레임이란?
앞에도 한번 썼던거 같지만
데이터프레임은 시리즈의 조합.
- 행과 열로 구성되어 있고 엑셀의 테이블과 비슷.
2차원 리스트
변수 = pd.DaraFrame( 2차원리스트, index=인덱스리스트, columns=컬럼리스트
# 주소록 리스트
list_1 = [['홍길동','부산','010-333-3333'],
['최길동','서울','010-555-5555'],
['박길동','울산','010-777-7777']]
list_1
[['홍길동', '부산', '010-333-3333'],
['최길동', '서울', '010-555-5555'],
['박길동', '울산', '010-777-7777']]
# 데이타프레임화
df = pd.DataFrame( list_1, columns=['name', 'addr','mobile'],
index=['num1','num2','num3'])
df
- 딕셔너리 리스트란? [ {키:값, 키:값 .... }, {키:값, 키:값 .... } ....]
- 데이타프레임변수 = pd.DataFrame( 딕셔너리 리스트, index = 인덱스리스트, columns = 컬럼리스트)
dict_list = [ {'name':'홍길동', 'addr':'부산','mobile':'010-333-3333'},
{'name':'최길동', 'addr':'서울','mobile':'010-555-5555'},
{'name':'박길동', 'addr':'울산','mobile':'010-777-7777'}]
df = pd.DataFrame( dict_list ,
index=['num1', 'num2', 'num3'])
df
시리즈 리스트
시리즈명 = pd.Series( {키:값 ... } )
데이터프레임 변수 = pd.DataFrame( [시리즈1, 시리즈2, ... ] )
s1 = pd.Series({'name':'홍길동', 'addr':'부산','mobile':'010-3333-3333'})
s2 = pd.Series({'name':'최길동', 'addr':'서울','mobile':'010-5555-5555'})
s3 = pd.Series({'name':'박길동', 'addr':'울산','mobile':'010-7777-7777'})
print(s1)
print()
print(s2)
print()
print(s3)
df = pd.DataFrame( [s1, s2, s3], index=['num1', 'num2', 'num3'])
df
하 프로젝트 하다가 행추가 열추가 때문에 수정버튼 눌렀음
추가하기
열추가 = 컬럼추가
데이터프레임명['컬럼명'] = 입력값
열추가
데이터프레임명.iloc[위치] = 입력값
데이터프레임명.loc[행인덱스명] = 입력값
📖 배운 거 복습용으로 작성
작성 기준일 : 22. 09. 4 / 구글 코랩
※ 고수님들 만약 내용에 잘못된 부분이 있다면 알려주세요 😉
728x90
'파이썬(Python) > 데이터 분석' 카테고리의 다른 글
ADsP 데이터분석 준전문가 (0) | 2022.09.14 |
---|---|
python - 주소로 위도 경도 얻기 (0) | 2022.09.06 |
DataFrame - 읽기(R) (0) | 2022.09.01 |
DataFrame - 수정 (U)_rename (0) | 2022.08.30 |
DataFrame - 수정(U) (0) | 2022.08.29 |