본문 바로가기

Python9

python# 공부2_1 공공데이터를 분석해보다가 계속 사용하거나 헷갈리는 코드를 작성해보고자 한다. - 항목별로 개수 그래프 생성 graph = pd.value_counts(df['column 이름'].values, sort=True) graph.plot.bar() graph.plot.bar(grid=True, figsize=(10, 8), fontsize=15) - column 속 내가 원하는 것 데이터 가져오기 d2[d2["소재지지번주소"].str.contains("000읍")] - 원하는 columns 가져와 dataframe 만들기 light = pd.DataFrame(d2, columns=['소재지도로명주소', '소재지지번주소', '카메라대수', '위도', '경도', '데이터기준일자']) light - plot 그릴 .. 2021. 10. 9.
Python# 공부1 중요하거나 헷갈리는 부분을 작성해볼 예정 ! # 1 test = '20190727cool' year = test[:4] date = test[4:8] condition = test[8:] print(year) print(date) print(condition) # 날짜 데이터가 나올 시에 이러한 방식으로 나눠서 사용할 수 있다. # 예전 공공 데이터를 한번 다뤄보려고 시도해보았을 때, 날짜 데이터에 있어서 어떻게 나누고 정리해야할지 몰랐다. 이제는 그런 형태의 변수를 만난다면 잘 해결해나갈 수 있을 것 같다.! # 2 "I ate {number} apples. so I was sick for {day} days".\ format(number=10, day=3) # \ (역슬래시) : 한 줄로 코드를 연결.. 2021. 3. 27.
[python_pandas 입문] 공부 # 7일차 공부한 내용 - 문자열 다루기 - apply 메서드 활용 - 그룹 연산 # 문자열 다루기 # join 메서드 d1 = '40' m1 = "46'" s1 = '52.837"' u1 = 'N' d2 = '73' m2 = "58'" s2 = '26.302"' u2 = 'W' coords = ' '.join([d1, m1, s1, u1, d2, m2, s2, u2]) print(coords) # splitlines 메서드 multi_str = """Guard: What? Ridden on a horse? King Arthur: Yes! Guard: You're using coconuts! King Arthur: What? Guard: You've got ... coconut[s] and you're bangin.. 2021. 2. 3.
[python_pandas 입문] 공부 # 6일차 공부한 내용 (8장) - 자료형 다루기 - 카테고리 자료형 # astype 메서드 # seaborn 라이브러리의 tips 데이터 불러오기 import pandas as pd import seaborn as sns tips = sns.load_dataset("tips") tips['total_bill'] = tips['total_bill'].astype(str) -> 자료형을 문자열로 변환하기 # to_numeric 메서드 -> errors 인자 # raise : 숫자로 변환할 수 없는 값이 있으면 오류 발생 # coerce : 숫자로 변환할 수 없는 값을 누락값으로 지정 # ignore : 아무 작업도 하지 않음 # downcast : 정수, 실수와 같은 자료형을 더 작은 형태로 만들 때 사용 -----.. 2021. 1. 20.
[python_pandas 입문] 공부 # 5일차 # 공부한 내용 (6장~7장) - 누락값 확인 - 누락값 처리 - melt 메서드 처리 # 누락값 NaN, NAN, nan # 누락값 확인 import pandas as pd print(pd.isnull(NAN)) print(pd.notnull(NaN)) # 누락값의 개수 구하기 # 전체 개수에서 누락값이 아닌 값의 개수 빼기 num_rows = ebola.shape[0] num_missing = num_rows - ebola.count( ) print(num_missing) # 누락값 처리하기 # 0으로 변경 print(ebola.fillna(0).iloc[0:10, 0:5]) # 누락값이 나타나기 전의 값으로 변경 print(ebola.fillna(method='ffill').iloc[0:10, 0:.. 2021. 1. 18.
[python_pandas 입문] 공부 # 4일차 공부할내용 - 분석하기 좋은 데이터 - 데이터 연결 기초 # 깔끔한 데이터의 조건 - 데이터 분석 목적에 맞는 데이터를 모아 새로운 표(Table)를 만들어야 한다. - 측정한 값은 행(row)을 구성 - 변수는 열(column)를 구성 # concat 메서드 import pandas as pd df1 = pd.read_csv('') df2 = pd.read_csv('') df3 = pd.read_csv('') row_concat = pd.concat([df1, df2, df3]) print(row_concat) # 행 1개로 구성된 데이터프레임 생성 -> 연결 new_row_df = pd.DataFrame([['n1', 'n2', 'n3', 'n4']], columns=['A', 'B', 'C', 'D.. 2021. 1. 15.