문자열 구분
정규표현식으로 문자열 구분
str.extract()
활용
- 정규표현식을 사용하여 문자열의 특정 부분 추출
- 각각의 추출된 패턴을 열로 갖음
예) 숫자와 하이폰만 가져오기
r'([\d\-]+)'
[\d\-]+
: 숫자 또는-
가 하나 이상 나오는 부분
특수문자로 문자열 구분
str.split(expand=True)
활용
- 특정 구분자를 기준으로 문자열 분리
expand=True
: 결과를 데이터프레임으로 확장
- 기존의 열 값을 유지하면서, 분리된 각 부분이 새로운 열로 들어감
문자열 리스트 하나로 통합
.join()
메서드 활용
- 문자열 리스트 각 요소를 사용자 정의 구분자를 기반으로 하나의 문자열로 생성
- 예)
['a', 'b', 'c']
>'a, b, c'
- 각 문자열 요소를
,
와공백으로 구분
before = ['a', 'b','c']
after = ", ".join(before)