Pandas(문자열 함수들)

less than 1 minute read

문자열 함수

  • str

데이터 프레임에서 예를들어서 경상남도,경상북도 이렇게 value가 들어있다면 앞의 경상만 뽑아 올 수 있게 해주는 함수이다.


    df['지역'].str[:-2]
    

-> 앞의 경상만 뽑히게 된다.

  • str.contains()

만약 사람 이름을 가지는 열이 있을 때 그 열에서 찾고 싶은 사람의 성만 알 때 찾기위해 쓰거나 contains안에 선언된 단어만 포함하는 데이터를 뽑기 위해 사용할 수 있다.

    df['이름'].str.contains('이창민')

-> 이창민이 포함된 열을 모두 뽑아 온다.

  • 정규표현식

특수문자들을 제거하고 싶을 때 사용하는 표현식이다.

    #r'[^\w]'는 모든 특수문자를 뜻하는 정규 표현식이다.
    #r''는 제거하겠다는 의미이고 r' '이면 공백으로 대체된다.
    #regex=True 는 작동시키는 코드이다.
    df['제목'].str.replace(pat=r'[^\w]', repl=r'', regex=True)

Tags:

Categories:

Updated:

Leave a comment