親です。

子ども産まれたんで育児とかについて書きます。映画とか心理学とかITとかの趣味についても書きます。

【データ分析】Pythonを使ってデータをざっと把握する

おつです。これからどんな風にこのデータを分析しようかな〜〜って考えてる時に、目の前のデータの傾向をざっくりと掴む必要がある。データの傾向というと、まあ色々あるけど、①統計量の取得、②分布図の表示、③相関係数の取得についてメモする。

使用するツール

Jupiter notebook
Pythonのpandas, seaborn

①統計量の取得

統計量の取得にはpandasのdf.describe()

②分布図の表示

seaborn.distplot

相関係数の取得

df.corr