第4章 Rベースで抽出・集計 ・ ノック 42 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br>
← 前 [[041 - 組み込みデータ iris を呼び出す]] ・ 次 → [[043 - 列を取り出す]]
> [!info] データの「構造」を確認する理由
> データを扱い始める前に、「何行・何列あるか」「各列はどんなデータ型か」を確認する習慣をつけることが大切です。`str()` は structure(構造)の略で、データフレームの列数・行数・各列の型・最初の数値をまとめて1画面で見せてくれます。列の型には `num`(数値)や `Factor`(因子・カテゴリ変数)などがあります。**因子(factor)** とは「setosa・versicolor・virginicaのように、あらかじめ決まった種類の値をとる変数」のことです。
## 問題
`iris` の構造を `str()` で確認してください。
> [!tip] ヒント
> `str` は structure の略です。`head()` と同じようにカッコの中にデータ名を入れます。
> [!success]- 回答を見る
> ```r
> str(iris)
> ```
> ```
> 'data.frame': 150 obs. of 5 variables:
> $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
> $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
> $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
> $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
> $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
> ```
> 150行・5列のデータで、Species だけが Factor(因子)型、残りの4列は num(数値)型であることがわかります。