source

판다 데이터 프레임의 인덱스를 열로 변환하는 방법

factcode 2022. 11. 26. 13:53
반응형

판다 데이터 프레임의 인덱스를 열로 변환하는 방법

이것은 당연한 것처럼 보이지만 데이터 프레임의 인덱스를 열로 변환하는 방법을 알 수 없는 것 같습니다.

예를 들어 다음과 같습니다.

df=
        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

로.

df=
    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

다음 중 하나:

df['index1'] = df.index

또는 다음과 같이 입력합니다.

df = df.reset_index(level=0)

따라서 다음과 같은 3가지 수준의 인덱스를 가진 다중 인덱스 프레임이 있는 경우:

>>> df
                       val
tick       tag obs        
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

첫 번째를 변환하는 경우(tick)와 3번째 (obs인덱스의 각 레벨은 다음과 같습니다.

>>> df.reset_index(level=['tick', 'obs'])
          tick  obs     val
tag                        
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

rename_axis + reset_index

먼저 인덱스 이름을 원하는 레이블로 바꾼 다음 영상 시리즈로 상승할 수 있습니다.

df = df.rename_axis('index1').reset_index()

print(df)

   index1         gi  ptt_loc
0       0  384444683      593
1       1  384444684      594
2       2  384444686      596

이것은, 에 대해서도 유효합니다.MultiIndex데이터 프레임:

print(df)
#                        val
# tick       tag obs        
# 2016-02-26 C   2    0.0139
# 2016-02-27 A   2    0.5577
# 2016-02-28 C   6    0.0303

df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()

print(df)

       index1 index2  index3     val
0  2016-02-26      C       2  0.0139
1  2016-02-27      A       2  0.5577
2  2016-02-28      C       6  0.0303

좀 더 명확하게 하기 위해 인덱스(MultiIndex)에 두 가지 레벨이 있는 DataFrame을 살펴보겠습니다.

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'], 
                                    ['North', 'South']], 
                                   names=['State', 'Direction'])

df = pd.DataFrame(index=index, 
                  data=np.random.randint(0, 10, (6,4)), 
                  columns=list('abcd'))

여기에 이미지 설명 입력

reset_index기본 매개 변수와 함께 호출되는 메서드는 모든 인덱스 수준을 열로 변환하고 단순 매개 변수를 사용합니다.RangeIndex새로운 인덱스로서.

df.reset_index()

여기에 이미지 설명 입력

를 사용합니다.level열로 변환되는 인덱스 수준을 제어하는 매개 변수입니다.가능한 경우 보다 명확한 수준 이름을 사용합니다.레벨명이 없는 경우는, 외부로부터0 으로 시작하는 정수 로케이션으로 각 레벨을 참조할 수 있습니다.여기서 스칼라 값을 사용하거나 재설정할 모든 인덱스의 목록을 사용할 수 있습니다.

df.reset_index(level='State') # same as df.reset_index(level=0)

여기에 이미지 설명 입력

드물게 인덱스를 유지하고 인덱스를 열로 변환하려는 경우 다음을 수행할 수 있습니다.

# for a single level
df.assign(State=df.index.get_level_values('State'))

# for all levels
df.assign(**df.index.to_frame())

MultiIndex의 경우 다음 명령을 사용하여 하위 인덱스를 추출할 수 있습니다.

df['si_name'] = R.index.get_level_values('si_name') 

어디에si_name는 서브 인덱스의 이름입니다.

를 사용하는 경우reset_index메서드 및 기존 인덱스를 보존합니다.

df.reset_index().set_index('index', drop=False)

또는 제자리에서의 변경:

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

예를 들어 다음과 같습니다.

print(df)
          gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596

print(df.reset_index())
   index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596

print(df.reset_index().set_index('index', drop=False))
       index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

인덱스 라벨을 삭제하고 싶은 경우는, 다음의 조작은 다음과 같습니다.

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
   index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596

이렇게 하면 (다단계 인덱싱이 아닌 경우) 효과가 있습니다.

df.reset_index().rename({'index':'index1'}, axis = 'columns')

코드 결과

물론 이름 변경의 함수 매개변수에 있는 새 변수에 이 값을 할당하지 않으려면 언제든지 inplace = True를 설정할 수 있습니다.

df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1

    new     gi     ptt
0    0      232    342
1    1      66     56 
2    2      34     662
3    3      43     123

언급URL : https://stackoverflow.com/questions/20461165/how-to-convert-index-of-a-pandas-dataframe-into-a-column

반응형