統計解析の前に、R そのものを手で動かして覚えるための練習帳です。データの変換だけでなく、ターミナルでの R の起動から、`c()` でのデータ作成、R ベースでの抽出、tidyverse(dplyr)での同じ操作、可視化・保存、そして `q()` での終了まで、すべてターミナルに打ち込んで結果を確認していきます。 ## 使い方 - 1 ノック 1 記事です。指示文だけを読み、まず自分でターミナルに打ち込んでください。 - 回答は「回答を見る」の折りたたみの中にあります。自力で試してから開いてください。 - コードは長くても 10 行程度です。すべて実際に動くものを載せています。 - 各記事の上部にある「← 前 / 次 →」で順番に進めます。 ## 進め方の基本 ターミナル(Mac の Terminal アプリ)を開き、`R` と入力して Enter を押すと R が対話モードで起動します。プロンプトが `>` に変わったら準備完了です。各ノックのコードを 1 行ずつ打ち込み、Enter で実行して出力を確かめてください。 R ベースのやり方を先にしっかり練習し、第 5 章で tidyverse(dplyr)を使って同じ操作を読みやすい書き方で再現します。両方を知っておくと、人のコードを読むときにも自分で書くときにも役立ちます。 ## 目次 ### 第 0 章 起動と環境(1〜10) - [[001 - Rを起動する]] - [[002 - 計算して動作を確かめる]] - [[003 - 変数に代入して中身を表示する]] - [[004 - Rのバージョンを確認する]] - [[005 - 作業フォルダを確認する]] - [[006 - 作業フォルダを変更する]] - [[007 - いまあるオブジェクトの一覧を見る]] - [[008 - オブジェクトを1つ消す]] - [[009 - すべてのオブジェクトを消す]] - [[010 - Rを終了する]] ### 第 1 章 パッケージ管理(11〜16) - [[011 - パッケージとは何か・導入済みか確認する]] - [[012 - パッケージをインストールする]] - [[013 - パッケージを読み込む]] - [[014 - libraryとrequireの違いを知る]] - [[015 - 関数の使い方をヘルプで調べる]] - [[016 - 導入済みパッケージを一覧する]] ### 第 2 章 ベクトルとデータ作成(17〜30) - [[017 - c() で数値ベクトルを作る]] - [[018 - もう一つのベクトルを作る]] - [[019 - ベクトルの要素数を数える]] - [[020 - 連続した整数を作る]] - [[021 - 規則的な数列を作る]] - [[022 - 同じ値をくり返す]] - [[023 - ベクトルどうしで計算する]] - [[024 - 平均を求める]] - [[025 - 合計・最大・最小を求める]] - [[026 - ばらつきを求める]] - [[027 - 文字のベクトルを作る]] - [[028 - 条件で真偽のベクトルを作る]] - [[029 - ベクトルに名前をつける]] - [[030 - ベクトルの一部を取り出す]] ### 第 3 章 データフレーム(31〜40) - [[031 - data.frame で表を作る]] - [[032 - 表の構造を見る]] - [[033 - 先頭と末尾を見る]] - [[034 - 行数と列数を調べる]] - [[035 - 列の名前を見る]] - [[036 - 要約統計を見る]] - [[037 - $ で列を取り出す]] - [[038 - 行と列を位置で取り出す]] - [[039 - 条件に合う行を取り出す]] - [[040 - 新しい列を追加する]] ### 第 4 章 R ベースで抽出・集計(41〜58) - [[041 - 組み込みデータ iris を呼び出す]] - [[042 - iris の構造を確認する]] - [[043 - 列を取り出す]] - [[044 - 条件で行を絞る]] - [[045 - 複数条件で絞る]] - [[046 - subset で分かりやすく絞る]] - [[047 - 必要な列だけ選ぶ]] - [[048 - 値の大きい順に並べ替える]] - [[049 - 計算した新しい列を加える]] - [[050 - 種類ごとの個数を数える]] - [[051 - グループごとの平均を求める]] - [[052 - グループ別に集計する]] - [[053 - 列ごとに一括計算する]] - [[054 - 各列に関数を適用する]] - [[055 - 欠損値を確認する]] - [[056 - 欠損のない行を調べる]] - [[057 - 欠損のある行を除く]] - [[058 - 因子(factor)と水準を理解する]] ### 第 5 章 tidyverse(dplyr)で再現(59〜80) - [[059 - tidyverse を読み込む]] - [[060 - データを tibble にする]] - [[061 - 行を絞る]] - [[062 - 複数条件で行を絞る]] - [[063 - 列を選ぶ]] - [[064 - 列を作る・計算する]] - [[065 - 並べ替える]] - [[066 - 大きい順に並べ替える]] - [[067 - 要約する]] - [[068 - グループごとに要約する]] - [[069 - パイプ %>% でつなぐ]] - [[070 - ネイティブパイプを使う]] - [[071 - 個数を数える]] - [[072 - 重複を除く]] - [[073 - 列名を変える]] - [[074 - 先頭の数行を取り出す]] - [[075 - 一つの列をベクトルで取り出す]] - [[076 - 列の並び順を変える]] - [[077 - 条件で値を振り分ける]] - [[078 - 複数の列に同じ処理をする]] - [[079 - 二つの表をつなぐ]] - [[080 - データを縦長に変形する]] ### 第 6 章 可視化(81〜92) - [[081 - 散布図を描く]] - [[082 - 軸ラベルとタイトルをつける]] - [[083 - 点を群で色分けする]] - [[084 - ヒストグラムを描く]] - [[085 - 箱ひげ図を描く]] - [[086 - 回帰直線を引く]] - [[087 - ggplot2を読み込んで土台を作る]] - [[088 - ggplotで散布図を描く]] - [[089 - 色で群を分ける]] - [[090 - 近似線を重ねる]] - [[091 - グループごとに分割表示する]] - [[092 - ラベルとテーマを整える]] ### 第 7 章 入出力と保存(93〜100) - [[093 - CSVファイルを読み込む]] - [[094 - readr で速く読み込む]] - [[095 - データを CSV に書き出す]] - [[096 - グラフを画像ファイルに保存する]] - [[097 - ggplot の図を保存する]] - [[098 - オブジェクトをそのまま保存して読み戻す]] - [[099 - ネット上のデータを読み込む]] - [[100 - Rを閉じて作業を終える]]