pip install pandas

conda install pandas

 

pandas.pydata.org/docs/index.htmlpandas.pydata.org/docs/getting_started/overview.htmlpandas.pydata.org/docs/getting_started/overview.html

 

Package overview — pandas 1.2.4 documentation

pandas is a Python package providing fast, flexible, and expressive data structures designed to make working with “relational” or “labeled” data both easy and intuitive. It aims to be the fundamental high-level building block for doing practical, r

pandas.pydata.org

 

 

pip install -U pandas-profiling

pip install pandas_profiling

 

판다스 프로파일링은 데이터의 의미를 파악하기 전 단계에서

데이터의 상태(EDA)에 대한 오버뷰를 제공하는 강력한 패키지이다. 

 

좋은 요리를 위해서는 조리 방법도 중요하지만, 그만큼 중요한 것은 갖고있는 재료의 상태입니다. 재료가 상하거나 문제가 있다면 좋은 요리가 나올 수 없습니다. 마찬가지로 좋은 머신 러닝 결과를 얻기 위해서는 데이터의 성격을 파악하는 과정이 선행되어야 합니다. 이 과정에서 데이터 내 값의 분포, 변수 간의 관계, Null 값과 같은 결측값(missing values) 존재 유무 등을 파악하게 되는데 이와 같이 데이터를 파악하는 과정을 EDA(Exploratory Data Analysis, 탐색적 데이터 분석)이라고 합니다. 이번에는 방대한 양의 데이터를 가진 데이터프레임을 .profile_report()라는 단 한 줄의 명령으로 탐색하는 패키지인 판다스 프로파일링(pandas-profiling)을 소개합니다.

 

wikidocs.net/47193

 

위키독스

온라인 책을 제작 공유하는 플랫폼 서비스

wikidocs.net

rk1993.tistory.com/entry/Python%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-EDA-%EC%89%BD%EA%B2%8C-%ED%95%98%EA%B8%B0-pandasprofiling

 

[Python]데이터분석 EDA 쉽게 하기 - pandas_profiling

pandas 라이브러리 중 EDA를 한눈에 볼 수 있는 라이브러리 발견 ! 보고서 쓸 때나 데이터 확인할 때 쓰면 아주 좋을 것 같다. pandas_profiling 이란 ? 딱 EDA할 때 보는 거 다 나온다. 이제 파이썬으로 하

rk1993.tistory.com

 

+ Recent posts