python - pandas - reading and writing feather
what is feather?
Feather provides binary columnar serialization for data frames. It is designed to make reading and writing data frames efficient, and to make sharing data across data analysis languages easy. This initial version comes with bindings for python (written by Wes McKinney) and R (written by Hadley Wickham).
save dataframe as feather
- 아무튼, 일단 한번 사용해봅니다. 최소한 코드는 아주 간단하네요. 그리고, csv 등과는 비교할 수 없을 정도로 빠릅니다.
df.to_feather("df.feather")
pd.read_feather('df.feather')
wrap-up
- 데이터를 중간에 저장할 때, 습관적으로 csv로 저장하곤 했습니다. 그런데, 이렇게 처리할 경우에는 데이터가 커질수록 읽고 쓰는데 너무 많은 시간이 소요된다는 문제가 있었죠.
- 앞으로는 가능한 csv로 데이터를 읽고 쓰는 것을 지양하고,
feather
와 같이 간편한 데이터 저장형식을 사용하려고 합니다.
댓글남기기