第4章 Rベースで抽出・集計 ・ ノック 55 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br>
← 前 [[054 - 各列に関数を適用する]] ・ 次 → [[056 - 欠損のない行を調べる]]
> [!info] 欠損値 NA とは
> 実際のデータには「測定できなかった」「記録が漏れた」などの理由で値が存在しない箇所があります。Rではこのような値を **NA**(Not Available)と表します。NAは0でも空白でもなく、「値が不明」という特別な状態です。`is.na()` は各要素がNAかどうかを TRUE/FALSE で返し、`sum()` を組み合わせると全体のNA数を一度に数えられます(TRUEが1、FALSEが0として足し算されます)。
## 問題
`iris` 全体に欠損値(NA)がいくつあるかを `is.na()` と `sum()` を使って調べてください。
> [!tip] ヒント
> `sum(is.na(データ))` の形で書くと、データ全体のNA数が一度に求まります。
> [!success]- 回答を見る
> ```r
> sum(is.na(iris))
> ```
> ```
> [1] 0
> ```
> 結果は 0 でした。`iris` には欠損値がひとつもありません。次のノックでは欠損を別の方法でも確認します。実際の研究データでは欠損が多数含まれることが多いため、この確認作業は必須のステップです。