統計解析の前に、R そのものを手で動かして覚えるための練習帳です。データの変換だけでなく、ターミナルでの R の起動から、`c()` でのデータ作成、R ベースでの抽出、tidyverse(dplyr)での同じ操作、可視化・保存、そして `q()` での終了まで、すべてターミナルに打ち込んで結果を確認していきます。
## 使い方
- 1 ノック 1 記事です。指示文だけを読み、まず自分でターミナルに打ち込んでください。
- 回答は「回答を見る」の折りたたみの中にあります。自力で試してから開いてください。
- コードは長くても 10 行程度です。すべて実際に動くものを載せています。
- 各記事の上部にある「← 前 / 次 →」で順番に進めます。
## 進め方の基本
ターミナル(Mac の Terminal アプリ)を開き、`R` と入力して Enter を押すと R が対話モードで起動します。プロンプトが `>` に変わったら準備完了です。各ノックのコードを 1 行ずつ打ち込み、Enter で実行して出力を確かめてください。
R ベースのやり方を先にしっかり練習し、第 5 章で tidyverse(dplyr)を使って同じ操作を読みやすい書き方で再現します。両方を知っておくと、人のコードを読むときにも自分で書くときにも役立ちます。
## 目次
### 第 0 章 起動と環境(1〜10)
- [[001 - Rを起動する]]
- [[002 - 計算して動作を確かめる]]
- [[003 - 変数に代入して中身を表示する]]
- [[004 - Rのバージョンを確認する]]
- [[005 - 作業フォルダを確認する]]
- [[006 - 作業フォルダを変更する]]
- [[007 - いまあるオブジェクトの一覧を見る]]
- [[008 - オブジェクトを1つ消す]]
- [[009 - すべてのオブジェクトを消す]]
- [[010 - Rを終了する]]
### 第 1 章 パッケージ管理(11〜16)
- [[011 - パッケージとは何か・導入済みか確認する]]
- [[012 - パッケージをインストールする]]
- [[013 - パッケージを読み込む]]
- [[014 - libraryとrequireの違いを知る]]
- [[015 - 関数の使い方をヘルプで調べる]]
- [[016 - 導入済みパッケージを一覧する]]
### 第 2 章 ベクトルとデータ作成(17〜30)
- [[017 - c() で数値ベクトルを作る]]
- [[018 - もう一つのベクトルを作る]]
- [[019 - ベクトルの要素数を数える]]
- [[020 - 連続した整数を作る]]
- [[021 - 規則的な数列を作る]]
- [[022 - 同じ値をくり返す]]
- [[023 - ベクトルどうしで計算する]]
- [[024 - 平均を求める]]
- [[025 - 合計・最大・最小を求める]]
- [[026 - ばらつきを求める]]
- [[027 - 文字のベクトルを作る]]
- [[028 - 条件で真偽のベクトルを作る]]
- [[029 - ベクトルに名前をつける]]
- [[030 - ベクトルの一部を取り出す]]
### 第 3 章 データフレーム(31〜40)
- [[031 - data.frame で表を作る]]
- [[032 - 表の構造を見る]]
- [[033 - 先頭と末尾を見る]]
- [[034 - 行数と列数を調べる]]
- [[035 - 列の名前を見る]]
- [[036 - 要約統計を見る]]
- [[037 - $ で列を取り出す]]
- [[038 - 行と列を位置で取り出す]]
- [[039 - 条件に合う行を取り出す]]
- [[040 - 新しい列を追加する]]
### 第 4 章 R ベースで抽出・集計(41〜58)
- [[041 - 組み込みデータ iris を呼び出す]]
- [[042 - iris の構造を確認する]]
- [[043 - 列を取り出す]]
- [[044 - 条件で行を絞る]]
- [[045 - 複数条件で絞る]]
- [[046 - subset で分かりやすく絞る]]
- [[047 - 必要な列だけ選ぶ]]
- [[048 - 値の大きい順に並べ替える]]
- [[049 - 計算した新しい列を加える]]
- [[050 - 種類ごとの個数を数える]]
- [[051 - グループごとの平均を求める]]
- [[052 - グループ別に集計する]]
- [[053 - 列ごとに一括計算する]]
- [[054 - 各列に関数を適用する]]
- [[055 - 欠損値を確認する]]
- [[056 - 欠損のない行を調べる]]
- [[057 - 欠損のある行を除く]]
- [[058 - 因子(factor)と水準を理解する]]
### 第 5 章 tidyverse(dplyr)で再現(59〜80)
- [[059 - tidyverse を読み込む]]
- [[060 - データを tibble にする]]
- [[061 - 行を絞る]]
- [[062 - 複数条件で行を絞る]]
- [[063 - 列を選ぶ]]
- [[064 - 列を作る・計算する]]
- [[065 - 並べ替える]]
- [[066 - 大きい順に並べ替える]]
- [[067 - 要約する]]
- [[068 - グループごとに要約する]]
- [[069 - パイプ %>% でつなぐ]]
- [[070 - ネイティブパイプを使う]]
- [[071 - 個数を数える]]
- [[072 - 重複を除く]]
- [[073 - 列名を変える]]
- [[074 - 先頭の数行を取り出す]]
- [[075 - 一つの列をベクトルで取り出す]]
- [[076 - 列の並び順を変える]]
- [[077 - 条件で値を振り分ける]]
- [[078 - 複数の列に同じ処理をする]]
- [[079 - 二つの表をつなぐ]]
- [[080 - データを縦長に変形する]]
### 第 6 章 可視化(81〜92)
- [[081 - 散布図を描く]]
- [[082 - 軸ラベルとタイトルをつける]]
- [[083 - 点を群で色分けする]]
- [[084 - ヒストグラムを描く]]
- [[085 - 箱ひげ図を描く]]
- [[086 - 回帰直線を引く]]
- [[087 - ggplot2を読み込んで土台を作る]]
- [[088 - ggplotで散布図を描く]]
- [[089 - 色で群を分ける]]
- [[090 - 近似線を重ねる]]
- [[091 - グループごとに分割表示する]]
- [[092 - ラベルとテーマを整える]]
### 第 7 章 入出力と保存(93〜100)
- [[093 - CSVファイルを読み込む]]
- [[094 - readr で速く読み込む]]
- [[095 - データを CSV に書き出す]]
- [[096 - グラフを画像ファイルに保存する]]
- [[097 - ggplot の図を保存する]]
- [[098 - オブジェクトをそのまま保存して読み戻す]]
- [[099 - ネット上のデータを読み込む]]
- [[100 - Rを閉じて作業を終える]]