第4章 Rベースで抽出・集計 ・ ノック 55 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br> ← 前 [[054 - 各列に関数を適用する]] ・ 次 → [[056 - 欠損のない行を調べる]] > [!info] 欠損値 NA とは > 実際のデータには「測定できなかった」「記録が漏れた」などの理由で値が存在しない箇所があります。Rではこのような値を **NA**(Not Available)と表します。NAは0でも空白でもなく、「値が不明」という特別な状態です。`is.na()` は各要素がNAかどうかを TRUE/FALSE で返し、`sum()` を組み合わせると全体のNA数を一度に数えられます(TRUEが1、FALSEが0として足し算されます)。 ## 問題 `iris` 全体に欠損値(NA)がいくつあるかを `is.na()` と `sum()` を使って調べてください。 > [!tip] ヒント > `sum(is.na(データ))` の形で書くと、データ全体のNA数が一度に求まります。 > [!success]- 回答を見る > ```r > sum(is.na(iris)) > ``` > ``` > [1] 0 > ``` > 結果は 0 でした。`iris` には欠損値がひとつもありません。次のノックでは欠損を別の方法でも確認します。実際の研究データでは欠損が多数含まれることが多いため、この確認作業は必須のステップです。