第3章 データフレーム ・ ノック 36 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br>
← 前 [[035 - 列の名前を見る]] ・ 次 → [[037 - $ で列を取り出す]]
> [!info] 要約統計とは何か
> **要約統計**(summary statistics)とは、データ全体をざっくり把握するための代表的な数値のことです。最小値・最大値・中央値・平均値などが代表例で、「データの分布がどのくらいの範囲に広がっているか」を一目で知ることができます。
>
> `summary()` 関数はデータフレームを渡すと、数値列に対して最小値(Min.)・第1四分位数(1st Qu.)・中央値(Median)・平均値(Mean)・第3四分位数(3rd Qu.)・最大値(Max.)の6つをまとめて表示します。文字列の列には個数などが表示されます。論文を書く前の最初の確認作業として必ず使う関数です。
## 問題
データフレーム `df` の要約統計を `summary()` で表示してみましょう。
> [!tip] ヒント
> `summary(データフレーム名)` と書くだけです。数値列に対して6種類の統計量が自動で計算されます。
> [!success]- 回答を見る
> ```r
> df <- data.frame(name = c("佐藤","鈴木","高橋"), height = c(160,172,168), weight = c(55,68,60))
> summary(df)
> ```
> ```
> name height weight
> Length:3 Min. :160.0 Min. :55.0
> Class :character 1st Qu.:164.0 1st Qu.:57.5
> Mode :character Median :168.0 Median :60.0
> Mean :166.7 Mean :61.0
> 3rd Qu.:170.0 3rd Qu.:64.0
> Max. :172.0 Max. :68.0
> ```
> `1st Qu.` は第1四分位数(下位25%の値)、`3rd Qu.` は第3四分位数(上位25%の値)です。