판다스 예제

팬더 DataFrames에 대해 여전히 의심하고 NumPy 배열 이나 시리즈와 같은 다른 데이터 구조와 어떻게 다른지 에 대해 여전히 의심하는 경우 아래의 작은 프레젠테이션을 볼 수 있습니다. 즉, 1000개의 행과 11개의 열. 행은 이 튜플의 인덱스 0에 있고 열은 이 튜플 중 하나의 인덱스에 있습니다. 이것이 축=1이 열에 영향을 미치는 이유입니다. 이것은 NumPy에서 유래, 그리고 NumPy를 배우는 것은 당신의 시간 가치가 이유의 좋은 예입니다. 안녕하세요 여러분! 오늘은 팬더 라이브러리에 대해 쓰고 싶습니다 (웹 사이트에 대한 링크). 팬더는 „파이썬 데이터 분석 라이브러리”를 의미합니다. 팬더의 위키백과 페이지에 따르면, „이름은 다차원 구조화 데이터 세트에 대한 계량 경제학 용어인 „패널 데이터”에서 파생됩니다.” 그러나 나는 그것이 매우 유용한 파이썬 라이브러리에 귀여운 이름이라고 생각합니다! 팬더는 데이터 과학에 대 한 인기 있는 파이썬 패키지, 그리고 좋은 이유: 그것은 강력 하 게 제공 합니다., 표현 및 유연한 데이터 구조 데이터 조작 및 분석 쉽게, 다른 많은 것 들 중. DataFrame은 이러한 구조 중 하나입니다. 이 예제와 같이 동일한 변수에 DataFrame을 계속 할당하는 것은 약간 자세한 내용입니다. 이러한 이유로 팬더는 많은 메서드에 대한 인플레이스 키워드 인수를 가지고 있습니다. Inplace=True를 사용하면 DataFrame 개체가 수정됩니다: 팬더에서 훨씬 쉽게 사용할 수 있는 것 중 하나는 목록이나 사전에서 값을 선택하는 것과 비교하여 원하는 데이터를 선택하는 것입니다. 열(df[col])을 선택하고 레이블 col이 있는 열을 시리즈 또는 몇 개의 열(df[col1, col2]])으로 반환하고 열을 새 DataFrame으로 반환할 수 있습니다.

위치(s.iloc[0]) 또는 인덱스(s.loc[`index_one`)로 선택할 수 있습니다. 첫 번째 행을 선택하려면 df.iloc[0,:] 을 사용하고 첫 번째 열의 첫 번째 요소를 선택하려면 df.iloc[0]을 실행할 수 있습니다. 이들은 또한 다른 조합에서 사용할 수 있습니다., 그래서 그것은 당신에 게 팬더에서 수행할 수 있는 다른 선택 및 색인의 아이디어를 제공 합니다. DataFrame을 만드는 또 다른 방법은 팬더를 사용하여 csv 파일을 가져오는 것입니다. 이제 csv cars.csv가 저장되고 pd.read_csv를 사용하여 가져올 수 있습니다: 데이터 분석을 위해 팬더를 사용하려는 경우 일반적으로 팬더의 데이터 프레임에 대한 첫 번째 질문 집합을 통과한 세 가지 방법 중 하나로 사용할 수 있습니다. 첫 번째 섹션에서 본 것보다 DataFrames에 훨씬 더 많은 것이 있기 때문에 기본을 뛰어 넘고 손을 더럽히기 위한 시간입니다. 아래 예제에서는 대괄호를 사용하여 DataFrame 의 한 열을 선택할 수 있습니다. 단일 브래킷 또는 이중 브래킷을 사용할 수 있습니다. 팬더 시리즈를 출력 하는 단일 브래킷, 더블 브래킷 팬더 DataFrame을 출력 하는 동안.

때로는 값을 다른 값으로 바꿔야 할 때가 있습니다. 예를 들어 s.replace(1,`one`)는 1과 같은 모든 값을 `one`으로 바꿉니다. s.replace([1,3], [`1,`3`,`3`])는 모두 1을 `1`으로, 3은 `3`으로 대체하는 여러 값에 대해 수행할 수 있습니다. 또한 df.rename(열={`old_name`: `new_name`})을 실행하여 특정 열의 이름을 변경하거나 df.set_index(`column_one`)를 사용하여 데이터 프레임의 인덱스를 변경할 수도 있습니다. 위에서 볼 수 있듯이 행 0:5를 원한다고 지정했습니다. 즉, 위치 0부터 위치 5까지의 행을 원했지만 포함하지 는 않습니다.