第3章 データフレーム ・ ノック 36 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br> ← 前 [[035 - 列の名前を見る]] ・ 次 → [[037 - $ で列を取り出す]] > [!info] 要約統計とは何か > **要約統計**(summary statistics)とは、データ全体をざっくり把握するための代表的な数値のことです。最小値・最大値・中央値・平均値などが代表例で、「データの分布がどのくらいの範囲に広がっているか」を一目で知ることができます。 > > `summary()` 関数はデータフレームを渡すと、数値列に対して最小値(Min.)・第1四分位数(1st Qu.)・中央値(Median)・平均値(Mean)・第3四分位数(3rd Qu.)・最大値(Max.)の6つをまとめて表示します。文字列の列には個数などが表示されます。論文を書く前の最初の確認作業として必ず使う関数です。 ## 問題 データフレーム `df` の要約統計を `summary()` で表示してみましょう。 > [!tip] ヒント > `summary(データフレーム名)` と書くだけです。数値列に対して6種類の統計量が自動で計算されます。 > [!success]- 回答を見る > ```r > df <- data.frame(name = c("佐藤","鈴木","高橋"), height = c(160,172,168), weight = c(55,68,60)) > summary(df) > ``` > ``` > name height weight > Length:3 Min. :160.0 Min. :55.0 > Class :character 1st Qu.:164.0 1st Qu.:57.5 > Mode :character Median :168.0 Median :60.0 > Mean :166.7 Mean :61.0 > 3rd Qu.:170.0 3rd Qu.:64.0 > Max. :172.0 Max. :68.0 > ``` > `1st Qu.` は第1四分位数(下位25%の値)、`3rd Qu.` は第3四分位数(上位25%の値)です。