문자열 구분

정규표현식으로 문자열 구분

str.extract() 활용

  • 정규표현식을 사용하여 문자열의 특정 부분 추출
  • 각각의 추출된 패턴을 열로 갖음

예) 숫자와 하이폰만 가져오기

r'([\d\-]+)'

  • [\d\-]+ : 숫자 또는 -가 하나 이상 나오는 부분

특수문자로 문자열 구분

str.split(expand=True) 활용

  • 특정 구분자를 기준으로 문자열 분리
  • expand=True: 결과를 데이터프레임으로 확장
    • 기존의 열 값을 유지하면서, 분리된 각 부분이 새로운 열로 들어감

문자열 리스트 하나로 통합

.join() 메서드 활용

  • 문자열 리스트 각 요소를 사용자 정의 구분자를 기반으로 하나의 문자열로 생성
  • 예) ['a', 'b', 'c'] > 'a, b, c'
    • 각 문자열 요소를 , 공백으로 구분
before = ['a', 'b','c']
after = ", ".join(before)