본문 바로가기
Python/python_pandas 입문 [책]

[python_pandas 입문] 공부 # 4일차

by happy_bigdata 2021. 1. 15.

공부할내용

- 분석하기 좋은 데이터

- 데이터 연결 기초

 


# 깔끔한 데이터의 조건

 

- 데이터 분석 목적에 맞는 데이터를 모아 새로운 표(Table)를 만들어야 한다.

- 측정한 값은 행(row)을 구성

- 변수는 열(column)를 구성

 

 

# concat 메서드

 

import pandas as pd

df1 = pd.read_csv('')

df2 = pd.read_csv('')

df3 = pd.read_csv('')

 

row_concat = pd.concat([df1, df2, df3])

print(row_concat)

 

 

# 행 1개로 구성된 데이터프레임 생성 -> 연결

 

new_row_df = pd.DataFrame([['n1', 'n2', 'n3', 'n4']], columns=['A', 'B', 'C', 'D'])

print(new_row_df)

 

print(df1.append(new_row_df))

 

 

# 행 방향으로 연결 (ignore_index = True)

 

row_concat_i = pd.concat([df1, df2, df3], ignore_index=True)

print(row_concat_i)

 

 

# 열 방향으로 연결(axis=1)

 

col_concat = pd.concat([df1, df2, df3], axis=1)

print(col_concat)

 

 

 

# 컬럼 새로 생성하기

 

col_concat['new_col_list'] = ['n1', 'n2', 'n3', 'n4']

print(col_concat)

 

 

# 공통된 열만 행 합치기

 

print(pd.concat([df1, df3], axis=1, join='inner'))

 

데이터 연결 기초에 대해 학습하였다.

간단하게 데이터프레임을 연결하고 자유자재로 다뤄보면서 더욱 익숙해져야겠다고 생각한다!_! 파이팅

 

 

 

 

 

 

 

 

 

 

 

댓글