pip install pandas
conda install pandas
pandas.pydata.org/docs/index.htmlpandas.pydata.org/docs/getting_started/overview.htmlpandas.pydata.org/docs/getting_started/overview.html
Package overview — pandas 1.2.4 documentation
pandas is a Python package providing fast, flexible, and expressive data structures designed to make working with “relational” or “labeled” data both easy and intuitive. It aims to be the fundamental high-level building block for doing practical, r
pandas.pydata.org
pip install -U pandas-profiling
pip install pandas_profiling
판다스 프로파일링은 데이터의 의미를 파악하기 전 단계에서
데이터의 상태(EDA)에 대한 오버뷰를 제공하는 강력한 패키지이다.
좋은 요리를 위해서는 조리 방법도 중요하지만, 그만큼 중요한 것은 갖고있는 재료의 상태입니다. 재료가 상하거나 문제가 있다면 좋은 요리가 나올 수 없습니다. 마찬가지로 좋은 머신 러닝 결과를 얻기 위해서는 데이터의 성격을 파악하는 과정이 선행되어야 합니다. 이 과정에서 데이터 내 값의 분포, 변수 간의 관계, Null 값과 같은 결측값(missing values) 존재 유무 등을 파악하게 되는데 이와 같이 데이터를 파악하는 과정을 EDA(Exploratory Data Analysis, 탐색적 데이터 분석)이라고 합니다. 이번에는 방대한 양의 데이터를 가진 데이터프레임을 .profile_report()라는 단 한 줄의 명령으로 탐색하는 패키지인 판다스 프로파일링(pandas-profiling)을 소개합니다.
위키독스
온라인 책을 제작 공유하는 플랫폼 서비스
wikidocs.net
[Python]데이터분석 EDA 쉽게 하기 - pandas_profiling
pandas 라이브러리 중 EDA를 한눈에 볼 수 있는 라이브러리 발견 ! 보고서 쓸 때나 데이터 확인할 때 쓰면 아주 좋을 것 같다. pandas_profiling 이란 ? 딱 EDA할 때 보는 거 다 나온다. 이제 파이썬으로 하
rk1993.tistory.com
'SW 개발환경 > SDK' 카테고리의 다른 글
[SDK] 목차 구성해보기. (0) | 2021.10.31 |
---|---|
[알고리즘] Algorithm Tutorial (0) | 2021.05.10 |
[Python]표준 라이브러리 도감 (0) | 2021.05.10 |
[데이터 작업 패키지_2] 데이터 특성 선택을 위한 데이터 시각화 패키지 (0) | 2021.04.26 |