第5章 tidyverse(dplyr)で再現 ・ ノック 67 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br> ← 前 [[066 - 大きい順に並べ替える]] ・ 次 → [[068 - グループごとに要約する]] > [!info] summarise() はデータを一行の要約値にまとめる動詞です > **`summarise()`**(サマライズ)は、データフレーム全体を集計して一行の要約値にまとめる動詞です。平均・合計・最大値など、さまざまな集計関数と組み合わせて使います。`mean_sl = mean(Sepal.Length)` のように「新しい列名 = 集計式」の形で書きます。 > > Rベースでは `mean(iris$Sepal.Length)` と書くと数値一つが返ってきました。`summarise()` を使うと結果がデータフレーム形式で返るため、後続の処理(グループ集計や他のデータとの結合)につなげやすくなります。 ## 問題 `iris` 全体の Sepal.Length の平均値を `summarise()` で求めてみましょう。 > [!tip] ヒント > `summarise(iris, 新しい列名 = 集計関数(列名))` の形で書きます。平均は `mean()` です。 > [!success]- 回答を見る > ```r > library(dplyr) > summarise(iris, mean_sl = mean(Sepal.Length)) > ``` > ``` > mean_sl > 1 5.843333 > ``` > Rベースでは `mean(iris$Sepal.Length)` でしたが、`summarise()` を使うと結果が `mean_sl` という列名のデータフレームとして返ります。列名を付けておくと、グループ集計のときに見やすくなります。