第4章 Rベースで抽出・集計 ・ ノック 57 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br>
← 前 [[056 - 欠損のない行を調べる]] ・ 次 → [[058 - 因子(factor)と水準を理解する]]
> [!info] `na.omit()` で欠損のある行をまとめて除く
> `na.omit()` は1列でもNAがある行をすべて除いたデータフレームを返す関数です。「na(欠損値)を omit(省略)する」という意味そのままです。実際の解析では欠損を含む行を除外した完全なデータだけを使うことがよくあります。ただし、除外前後で行数を必ず確認して「何行が分析対象か」を把握することが大切です。
## 問題
`na.omit(iris)` の行数を `nrow()` で確認して、欠損除外前後で行数が変わらないことを確かめてください。
> [!tip] ヒント
> `nrow(na.omit(iris))` と書くと1行で行数を確認できます。`iris` には欠損がないので、元の行数と変わらないはずです。
> [!success]- 回答を見る
> ```r
> nrow(na.omit(iris))
> ```
> ```
> [1] 150
> ```
> 欠損のある行が0だったため、行数は変わらず150のままでした。欠損を含む実データで同じ操作を行うと、除外された行数だけ結果が小さくなります。この確認が分析前の必須ステップです。