본문 바로가기
Python

탐색적 데이터 분석 (eda)

by 앗사비 2022. 5. 16.
728x90

가설로 데이터 검증을 하는게 아닌

데이터를 살펴보면서 인사이트 찾기

 

https://pypi.org/project/sweetviz/

import pandas as pd
import sweetviz as sv
 
df = pd.read_csv("titanic.csv")
my_report = sv.analyze(df)
my_report.show_html()

https://pypi.org/project/pandas-profiling/

import pandas as pd
from pandas_profiling import ProfileReport
 
df = pd.read_csv("titanic.csv")
profile = ProfileReport(df, title="report")
profile.to_file("your_report.html")

https://pypi.org/project/dtale/

import pandas as pd
import dtale
 
if __name__ == '__main__':
      dtale.show(pd.read_csv("titanic.csv"), subprocess=False)
728x90

'Python' 카테고리의 다른 글

imap 방식으로 메일의 첨부파일 다운 받기  (0) 2022.07.06
ec2 에서 파이썬 환경 셋팅  (0) 2022.06.29
오렌지3로 머신러닝 해보기  (0) 2022.05.16
pywinauto 사용해보기  (0) 2022.04.05
[python] 이미지 자르기  (0) 2022.02.11