Pandas(문자열 함수들)
문자열 함수
- str
데이터 프레임에서 예를들어서 경상남도,경상북도 이렇게 value가 들어있다면 앞의 경상만 뽑아 올 수 있게 해주는 함수이다.
df['지역'].str[:-2]
-> 앞의 경상만 뽑히게 된다.
- str.contains()
만약 사람 이름을 가지는 열이 있을 때 그 열에서 찾고 싶은 사람의 성만 알 때 찾기위해 쓰거나 contains안에 선언된 단어만 포함하는 데이터를 뽑기 위해 사용할 수 있다.
df['이름'].str.contains('이창민')
-> 이창민이 포함된 열을 모두 뽑아 온다.
- 정규표현식
특수문자들을 제거하고 싶을 때 사용하는 표현식이다.
#r'[^\w]'는 모든 특수문자를 뜻하는 정규 표현식이다.
#r''는 제거하겠다는 의미이고 r' '이면 공백으로 대체된다.
#regex=True 는 작동시키는 코드이다.
df['제목'].str.replace(pat=r'[^\w]', repl=r'', regex=True)
Leave a comment