파이썬(Python)/Pandas

Pandas code snippet

leebaro 2023. 12. 5.
728x90

 

 

여러개의 csv 파일을 한개의 csv 파일로 만들기

 

import os
import pandas as pd

# 현재 디렉토리의 모든 파일 목록을 얻기
files = os.listdir('.')

# 'result_숫자.csv' 형식에 맞는 파일만 필터링
csv_files = [file for file in files if file.startswith('result_') and file.endswith('.csv')]

# 모든 CSV 파일을 합치기
combined_csv = pd.DataFrame()
for file in csv_files:
    df = pd.read_csv(file)
    combined_csv = pd.concat([combined_csv, df])

# 결과 CSV 파일 저장
combined_csv.to_csv('combined_result.csv', index=False)

 

 

데이터프레임 컬럼 이름 변경하기

df.rename(columns={'A': 'X', 'B': 'Y', 'C': 'Z'}, inplace=True)

 

 

특정 컬럼만 남기고 컬럼 삭제하기

new_df = df[['A', 'B']]

 

 

모든 컬럼에 꼬릿말 붙이기

new_df = df[['A', 'B']]

 

 

두 개의 데이터프레임 조인하기

result_df = pd.merge(df1, df2, left_on='A', right_on='A_new')

 

두 개의 데이터프레임 레프트 조인하기

result_df = pd.merge(df1, df2, left_on='A', right_on='A_new', how='left')

 

 

컬럼 이름 정렬하기

# 'CC'와 'DD'를 제외한 나머지 컬럼을 알파벳 순으로 정렬
sorted_columns = sorted([col for col in df.columns if col not in ['CC', 'DD']])

# 'CC'와 'DD'를 앞에 두고 나머지 컬럼을 뒤에 배치
final_columns = ['CC', 'DD'] + sorted_columns

# 정렬된 컬럼 순으로 DataFrame 재배열
df_sorted = df[final_columns]
728x90