ThLee
ThLee의 기록장
ThLee
전체 방문자
오늘
어제
  • 분류 전체보기 (137)
    • 정보처리기사 (13)
    • 알고리즘&문제 (5)
    • 인공지능 (4)
    • 자연어처리(NLP) (6)
    • 파이썬 (24)
    • 앱인벤터 강좌 (21)
    • 리눅스 (4)
    • 프로젝트 (1)
    • (App)톡분석AI (2)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 파이썬 넘파이
  • 딥러닝
  • 인공지능
  • 정보처리기사 정리
  • 판다스
  • 넘파이
  • Python
  • 정처기
  • 블로그
  • 정보처리기사
  • 앱인벤터 강좌
  • 블록코딩
  • AI
  • 앱인벤터
  • 정보처리기사 실기 정리
  • 어플
  • 파이썬
  • 앱인벤터 블로그
  • 앱인벤터 무료
  • 정보처리기사 실기

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
ThLee

ThLee의 기록장

[파이썬] 데이터프레임 병합 merge
파이썬

[파이썬] 데이터프레임 병합 merge

2022. 4. 24. 12:10
728x90

분석를 진행하다보면 데이터가 여기저기 분산되어 있는 경우가 생각보다 많다.

조각난 데이터를 분석에 필요한 데이터셋으로 만들기 위해 데이터프레임을 병합해서 사용해야 한다.

한개 이상의 데이터프레임을 병합할 때, 주로 사용하는 함수를 알아보았다.


pd.merge(베이스 df, 병합할 df)

- df : 데이터프레임

how : 'left' , 'right' , 'inner' , 'outer'
left_on : key값이 다른 경우, 베이스 df의 key 설정
right_on : key값이 다른 경우, 병합 df의 key 설정

merge 실습 

df 생성

merge_df1 = pd.DataFrame({
    '이름': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L'],
    '국어': [100, 70, 70, 70, 60, 90, 90, 70, 70, 80, 100, 100],
    '영어': [100, 90, 80, 50, 70, 100, 70, 90, 100, 100, 80, 100]
    }, columns=['이름', '국어', '영어']) 

merge_df2 = pd.DataFrame({
    '일어': [80, 100, 100, 90, 70, 50, 100],
    '수학': [90, 70, 100, 80, 70, 80, 90],
    '이름': ['A', 'B', 'F', 'I', 'D', 'G', 'L'],
    }, columns=['일어', '수학', '이름'])

df 확인

# 데이터프레임 확인
merge_df1

# 데이터프레임 확인
merge_df2

병합 테스트 : no how

# 병합 테스트 : no how
pd.merge(merge_df1,merge_df2)

병합 테스트 : how = outer

# 병합 테스트 : how = outer
pd.merge(merge_df1,merge_df2, how = 'outer')

병합 테스트 : how = left

# 병합 테스트 : how = left
pd.merge(merge_df1,merge_df2, how = 'left')

병합 테스트 : how = right

# 병합 테스트 : how = right
pd.merge(merge_df1,merge_df2, how = 'right')

 

728x90

'파이썬' 카테고리의 다른 글

[파이썬] 코랩으로 EDA 해보기 (보스턴주택가격)  (0) 2022.04.24
[파이썬] 데이터프레임 인덱스 편집  (0) 2022.04.24
[파이썬] 데이터 분석해보기 (All Lending Club loan data)  (0) 2022.04.24
[파이썬] NaN, None, Null 차이 및 제거 방법  (0) 2022.04.22
[파이썬] 넘파이(Numpy) 특수 array 생성하기  (0) 2022.04.22
    '파이썬' 카테고리의 다른 글
    • [파이썬] 코랩으로 EDA 해보기 (보스턴주택가격)
    • [파이썬] 데이터프레임 인덱스 편집
    • [파이썬] 데이터 분석해보기 (All Lending Club loan data)
    • [파이썬] NaN, None, Null 차이 및 제거 방법
    ThLee
    ThLee
    # 포트폴리오 https://thleewave.notion.site/ThLee-1fef9e057dbf40d5b7b851ab0abccf36?pvs=4 #Github - https://github.com/git-ThLee #IoT 스타트업 -Full-stack -2021.01~2021.07 -사용기술 : fluterr, arduino, node.js #코딩학원 강사 - 2019.11 ~ 진행중 - 언어 : python, 블록 코딩 - 플랫

    티스토리툴바