[파이썬, Python] Pandas.DataFrame 행/열 제거 (drop)
DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False, errors='raise') option - labels : 제거할 index or column 입력 - axis : [0,1] 중 선택 axis=0 인 경우 labels를 index로 인식 axis=1 인 경우 labels를 column으로 인식 - index : 삭제할 index 리스트를 입력합니다. - columns : 삭제할 column 리스트를 입력합니다. - inplace : [True, False] 중 선택 inplace=True 인 경우, 원본을 변경하겠다. inplace=False 인 경우, 원본은 그대로 두고 변경된 데이터를 반환하겠다. - error..
[파이썬, Python] Pandas.DataFrame 중복 값 제거 (drop_duplicates)
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False) option - subset : 중복을 확인할 column 리스트 - keep : ['first','last',False] 중 선택 keep='first' 인 경우, 중복 행 중 첫 행만 남기기, keep='last' 인 경우, 중복 행 중 마지막 행만 남기기 keep=False 인 경우, 중복 행 전부 삭제 - inplace : [True, False] 중 선택 inplace=True 인 경우, 원본을 변경하겠다. inplace=False 인 경우, 원본은 그대로 두고 변경된 데이터를 반환하겠다. - ignore_index : [True, Fals..
[파이썬, Python] Pandas.DataFrame 중복 값 확인 (duplicated)
DataFrame.duplicated(subset=None, keep='first') option - subset : 중복을 확인할 column 리스트 - keep : ['first','last',False] 중 선택 keep='first' 인 경우, 중복 행 중 첫 행만 False, 나머지 True keep='last' 인 경우, 중복 행 중 마지막 행만 False, 나머지 True keep=False 인 경우, 중복 행 전부 True 모든 옵션에서 중복 없는 행은 False Example DataFrame 생성 import pandas as pd df = pd.DataFrame({'class':['A','A','A','B','B','B'], 'num':[1,2,2,2,1,1], 'price':[20,..
[파이썬, Python] csv 파일 저장 및 불러오기 (read_csv, to_csv)
pandas 라이브러리를 활용하여 csv 파일 불러오는 방법 및 다양한 옵션들을 알아보겠습니다. import pandas as pd 1. Dataframe 생성하여 csv 파일로 저장하기 - 우선 임의의 dataframe을 생성하여 csv로 저장해보겠습니다. - dataframe 변수에서 to_csv로 저장할 수 있으며 파일명을 입력하면 됩니다. - index 옵션 : index를 포함하여 저장할 것인지 여부 (default : True) df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9], 'b':[9,8,7,6,5,4,3,2,1], 'c':[6,7,8,9,1,2,3,4,5], 'd':[5,4,3,2,1,9,8,7,6]}) df.to_csv('test_1.csv') df.to_..
[파이썬, python] dataframe 정렬 (sort_values)
오늘은 dataframe을 sorting 하는 방법을 알아보겠습니다. import pandas as pd Example 1. Dataframe 생성 df = pd.DataFrame({'a':[1,3,5,2,4], 'b':[2,3,1,5,4], 'c':['c','a','g','e','w']}) df 결과 2. 'a' 열을 기준으로 정렬 df.sort_values('a') 결과 3. 'c'열을 기준으로 정렬 - 문자열도 순서가 있으므로 정렬이 가능합니다. df.sort_values('c') 결과 - 아래와 같이 'c'열의 알파벳 순으로 정렬되었습니다. 4. 'c'열을 기준으로 정렬 (내림차순) - default로 오름차순으로 정렬을 하는데, ascending 옵션을 사용하면 내림차순으로 정렬할 수 있습니다...
[파이썬, Python] subplot 그리기 (plt.subplot)
matplotlib을 활용하여 subplot을 그리는 방법을 알아보겠습니다. import matplotlib.pyplot as plt 1. Example # 3X2 개의 plot 그리기 # 행 개수 : 3, 열 개수 : 2, 가로 길이 : 5, 세로 길이 : 10 f, ax = plt.subplots(3, 2, figsize=(5, 10)) # main title f.suptitle('Main title') # plot 사이 간격 조정 # hspace : 위아래 간격, wspace : 좌우간격 f.subplots_adjust(hspace=0.2, wspace=0) ax[0,0].plot([1,2,3],[1,2,3]) ax[0,0].set_title('line plot') ax[0,1].hist([1,2,..