본문 바로가기

파이썬

(17)
[파이썬, Python] Pandas.DataFrame 행/열 제거 (drop) DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False, errors='raise') option - labels : 제거할 index or column 입력 - axis : [0,1] 중 선택 axis=0 인 경우 labels를 index로 인식 axis=1 인 경우 labels를 column으로 인식 - index : 삭제할 index 리스트를 입력합니다. - columns : 삭제할 column 리스트를 입력합니다. - inplace : [True, False] 중 선택 inplace=True 인 경우, 원본을 변경하겠다. inplace=False 인 경우, 원본은 그대로 두고 변경된 데이터를 반환하겠다. - error..
[파이썬, Python] Pandas.DataFrame 중복 값 제거 (drop_duplicates) DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False) option - subset : 중복을 확인할 column 리스트 - keep : ['first','last',False] 중 선택 keep='first' 인 경우, 중복 행 중 첫 행만 남기기, keep='last' 인 경우, 중복 행 중 마지막 행만 남기기 keep=False 인 경우, 중복 행 전부 삭제 - inplace : [True, False] 중 선택 inplace=True 인 경우, 원본을 변경하겠다. inplace=False 인 경우, 원본은 그대로 두고 변경된 데이터를 반환하겠다. - ignore_index : [True, Fals..
[파이썬, Python] Pandas.DataFrame 중복 값 확인 (duplicated) DataFrame.duplicated(subset=None, keep='first') option - subset : 중복을 확인할 column 리스트 - keep : ['first','last',False] 중 선택 keep='first' 인 경우, 중복 행 중 첫 행만 False, 나머지 True keep='last' 인 경우, 중복 행 중 마지막 행만 False, 나머지 True keep=False 인 경우, 중복 행 전부 True 모든 옵션에서 중복 없는 행은 False Example DataFrame 생성 import pandas as pd df = pd.DataFrame({'class':['A','A','A','B','B','B'], 'num':[1,2,2,2,1,1], 'price':[20,..
[파이썬, Python] 파이썬 파일 확장자 변경 (.ipynb ↔ .py) 라이브러리 설치 pip install nbconvert pip install ipynb-py-convert .ipynb 파일을 .py 파일로 변경하기 (cmd 창에 입력) jupter nbconvert --to script 현재파일명.ipynb 또는 ipynb-py-convert 현재파일명.ipyynb 바꿀파일명.py .py파일을 .ipynb파일로 변경하기 (cmd 창에 입력) ipynb-py-convert 현재파일명.py 바꿀파일명.ipynb 해당 기능 이용 시 셀을 구분하려면 # %%로 구분해주면 됩니다.
[파이썬, Python] csv 파일 저장 및 불러오기 (read_csv, to_csv) pandas 라이브러리를 활용하여 csv 파일 불러오는 방법 및 다양한 옵션들을 알아보겠습니다. import pandas as pd 1. Dataframe 생성하여 csv 파일로 저장하기 - 우선 임의의 dataframe을 생성하여 csv로 저장해보겠습니다. - dataframe 변수에서 to_csv로 저장할 수 있으며 파일명을 입력하면 됩니다. - index 옵션 : index를 포함하여 저장할 것인지 여부 (default : True) df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9], 'b':[9,8,7,6,5,4,3,2,1], 'c':[6,7,8,9,1,2,3,4,5], 'd':[5,4,3,2,1,9,8,7,6]}) df.to_csv('test_1.csv') df.to_..
[파이썬, python] dataframe 정렬 (sort_values) 오늘은 dataframe을 sorting 하는 방법을 알아보겠습니다. import pandas as pd Example 1. Dataframe 생성 df = pd.DataFrame({'a':[1,3,5,2,4], 'b':[2,3,1,5,4], 'c':['c','a','g','e','w']}) df 결과 2. 'a' 열을 기준으로 정렬 df.sort_values('a') 결과 3. 'c'열을 기준으로 정렬 - 문자열도 순서가 있으므로 정렬이 가능합니다. df.sort_values('c') 결과 - 아래와 같이 'c'열의 알파벳 순으로 정렬되었습니다. 4. 'c'열을 기준으로 정렬 (내림차순) - default로 오름차순으로 정렬을 하는데, ascending 옵션을 사용하면 내림차순으로 정렬할 수 있습니다...
[파이썬, Python] subplot 그리기 (plt.subplot) matplotlib을 활용하여 subplot을 그리는 방법을 알아보겠습니다. import matplotlib.pyplot as plt 1. Example # 3X2 개의 plot 그리기 # 행 개수 : 3, 열 개수 : 2, 가로 길이 : 5, 세로 길이 : 10 f, ax = plt.subplots(3, 2, figsize=(5, 10)) # main title f.suptitle('Main title') # plot 사이 간격 조정 # hspace : 위아래 간격, wspace : 좌우간격 f.subplots_adjust(hspace=0.2, wspace=0) ax[0,0].plot([1,2,3],[1,2,3]) ax[0,0].set_title('line plot') ax[0,1].hist([1,2,..
[파이썬, Python] 파일 압축하기, 압축해제하기 (zipfile, tarfile) zipfile과 tarfile 라이브러리를 이용하여 파일 압축 해제하는 법을 알아보겠습니다. 저는 실제로는 사실 터미널 명령어를 이용해서 압축을 자주 이용하고 있습니다. (VSCode) import zipfile import tarfile 1. zip 파일 압축 / 압축해제 - with 구문을 활용하여 조금 더 쉽게 압축하고 압축해제 할 수 있습니다. # 압축하기 with zipfile.ZipFile('./zipfile.zip', 'w') as myzip: myzip.write('./file1.txt') myzip.write('./file2.txt') # 압축해제하기 with zipfile.ZipFile('./zipfile.zip') as myzip: myzip.extractall() 2. tar 파일 ..