今ほど覚えた ``tabstat`` ですが、 ``, statistics()`` 以外にも色々とオプションをつけることができそうです。オプションについて自力で検索する方法を覚えましょう。それが、``help`` コマンドです。次のように入力してみてください。 . help tabstat 別のウィンドウが立ち上がり、``tabstat``のヘルプコマンドが別ウィンドウで表示されたと思います。中身は次のようになります。 ![ヘルプ画面](help.png) 「今までソフトウェアのヘルプファイルなんて見たこともないし、見ても役に立たなかった」という方は多いと思いますが、Stata のヘルプファイルは間違いなく役に立ちます。すぐに活用できるよう、読み方のコツをお教えします。 とりあえず最初のほうにある説明はすべて飛ばして頂いて、下のほうへ移動します。すると、 ``Examples`` という大きな文字にが目に入ります。その名の通り、ここには ``tabstat`` を使った例が表示されています。では、例をみてみましょう。次のような例がヘルプに記載されていると思います。 Examples Setup . sysuse auto Show the mean (by default) of price, weight, mpg, and rep78 . tabstat price weight mpg rep78 Show the mean (by default) of price, weight, mpg, and rep78 by categories of foreign . tabstat price weight mpg rep78, by(foreign) ドットのあとに続いているのがコマンドの例です。どうやら、最初に私たちが使った ``auto`` ファイルをつかったサンプルを表示してくれているようです。最初例ではシンプルに ``. tabstat price weight mpg rep78`` と実行しています。 Stata がヘルプで示してくれている例は徐々に発展しています。次の例では ``, by()`` オプションを使っています。 我々が行った例でも ``, by()`` を使ってみましょう。現在 ``, statistics()`` (省略して ``, s()`` としています)オプションだけを使っていますが、追加して ``, by()`` を加えてみましょう。現在の例では ``male`` がカテゴリー変数なので、``, by(male)`` を追加することにします。 注意していただきたいのは、``, s(), by()`` とカンマを二つ加えるとエラーになるということです。``, s() by()`` としてください。Stata コマンドに加えられるカンマは特別な場合を除いて1つだけで、カンマのあとはオプションになります。 では実行してみましょう。 . tabstat height weight, s(n mean sd min p25 p50 p75 max) by(male) Summary statistics: N, mean, sd, min, p25, p50, p75, max by categories of: male (male) male | height weight -------+-------------------- 0 | 10 10 | 162.49 52.77 | 10.48273 6.731031 | 140.1 40.3 | 155.9 48.2 | 164.4 54.1 | 169.3 57.7 | 175.4 61.8 -------+-------------------- 1 | 10 10 | 178.56 69.21 | 10.76746 8.670313 | 163.6 59.5 | 171.7 61 | 176.4 68.95 | 183.1 74 | 199.2 88 -------+-------------------- Total | 20 20 | 170.525 60.99 | 13.22609 11.32231 | 140.1 40.3 | 163.95 54.1 | 170.5 59.85 | 176.4 68.95 | 199.2 88 ---------------------------- 性別ごとに結果が表示されたと思います。 ヘルプというと退屈なイメージがありますが、最初に ``Example`` をみることで実践的な使い方を学習することができます。 例題だけでは細かいことが分からないこともありますので、詳細な解説も見てみましょう。ヘルプの最初の説明に戻ってみてください。``Syntax`` という項目があると思います。 Syntax tabstat varlist [if] [in] [weight] [, options] options Description ----------------------------------------------------------------------------- Main by(varname) group statistics by variable statistics(statname [...]) report specified statistics Options labelwidth(#) width for by() variable labels; default is labelwidth(16) varwidth(#) variable width; default is varwidth(12) columns(variables) display variables in table columns; the default columns(statistics) display statistics in table columns format[(%fmt)] display format for statistics; default format is %9.0g casewise perform casewise deletion of observations nototal do not report overall statistics; use with by() missing report statistics for missing values of by() variable noseparator do not use separator line between by() categories longstub make left table stub wider save store summary statistics in r() ----------------------------------------------------------------------------- ``Syntax`` とはプログラミングで使う構文のことです。構文の使い方を見てみましょう。構文は次のように記載されています。 tabstat varlist [if] [in] [weight] [, options] ``tabstat`` はコマンド本体ですね。``varlist`` は変数名のリストのことです。私たちの実行したものですと ``height weight`` になります。``[if]`` と書かれているので、たとえば ``if male==1`` としたら、男性だけの結果が表示できることがわかります。``[in]`` は ``in 1/5`` と記載することで1行目から5行目までのデータを対象二階席が行えます。``[weight]`` は今回の扱っている体重データではなく、データの重み付けのことです。例えば集計済みのデータなどで1行のデータが1人分ではなく8人分になる場合などに使います。少し応用になりますので気になる方は 青文字になっている ``weight`` の部分をクリックして詳細を表示してください。 そのあと ``[, options]`` とまとめられており、オプションの詳細が下にずらっと書いてあります。その一番うえに私たちが使った ``by`` と ``statistics`` がメインオプションとして記載されています。 私たちがよく使うソフトのヘルプはたいてい使い物になりませんが、Stata のヘルプは使えます。初めのうちは使い慣れない関数にあったらヘルプから ``Example`` を呼び出して大まかな動きを確認し、そのあと ``Syntax`` で詳細な働きを確認するのが良いでしょう。