第4章 Rベースで抽出・集計 ・ ノック 42 / 100 ・ [[000 - はじめに(使い方と目次)|目次]]<br> ← 前 [[041 - 組み込みデータ iris を呼び出す]] ・ 次 → [[043 - 列を取り出す]] > [!info] データの「構造」を確認する理由 > データを扱い始める前に、「何行・何列あるか」「各列はどんなデータ型か」を確認する習慣をつけることが大切です。`str()` は structure(構造)の略で、データフレームの列数・行数・各列の型・最初の数値をまとめて1画面で見せてくれます。列の型には `num`(数値)や `Factor`(因子・カテゴリ変数)などがあります。**因子(factor)** とは「setosa・versicolor・virginicaのように、あらかじめ決まった種類の値をとる変数」のことです。 ## 問題 `iris` の構造を `str()` で確認してください。 > [!tip] ヒント > `str` は structure の略です。`head()` と同じようにカッコの中にデータ名を入れます。 > [!success]- 回答を見る > ```r > str(iris) > ``` > ``` > 'data.frame': 150 obs. of 5 variables: > $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... > $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... > $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... > $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ... > $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ... > ``` > 150行・5列のデータで、Species だけが Factor(因子)型、残りの4列は num(数値)型であることがわかります。