第5章 tidyverse(dplyr)で再現 ・ ノック 67 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br>
← 前 [[066 - 大きい順に並べ替える]] ・ 次 → [[068 - グループごとに要約する]]
> [!info] summarise() はデータを一行の要約値にまとめる動詞です
> **`summarise()`**(サマライズ)は、データフレーム全体を集計して一行の要約値にまとめる動詞です。平均・合計・最大値など、さまざまな集計関数と組み合わせて使います。`mean_sl = mean(Sepal.Length)` のように「新しい列名 = 集計式」の形で書きます。
>
> Rベースでは `mean(iris$Sepal.Length)` と書くと数値一つが返ってきました。`summarise()` を使うと結果がデータフレーム形式で返るため、後続の処理(グループ集計や他のデータとの結合)につなげやすくなります。
## 問題
`iris` 全体の Sepal.Length の平均値を `summarise()` で求めてみましょう。
> [!tip] ヒント
> `summarise(iris, 新しい列名 = 集計関数(列名))` の形で書きます。平均は `mean()` です。
> [!success]- 回答を見る
> ```r
> library(dplyr)
> summarise(iris, mean_sl = mean(Sepal.Length))
> ```
> ```
> mean_sl
> 1 5.843333
> ```
> Rベースでは `mean(iris$Sepal.Length)` でしたが、`summarise()` を使うと結果が `mean_sl` という列名のデータフレームとして返ります。列名を付けておくと、グループ集計のときに見やすくなります。