再読みするつもりのない本のメモ


※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。


避けてきた統計について。

rand関数がきちんとrandになってるかチェックするには、そりゃ統計が必要なわけで・・・。

Rによる統計解析の基礎

統計解析の手順:

  • 目的を明確にする
  • 生データを取る
  • データ化(エンディング、コーディング、データ入力)
  • データの図示(幹葉表示やヒストグラムなど)
  • 代表値(分布の位置やばらつきを示す値)の計算
  • 作業仮説の明確化(因果関係についての仮説を立てることが多い)
  • 仮説検定や区間推定を行う(撹乱要因に配慮し、その影響を制御する必要がある)
  • 因果関係についての推論を行う(先行研究の知見なども総合する必要がある)

因果関係:

A->この分析で結果との関係を評価したい因子

B->この分析で結果との関係をみたいわけではないが

  結果やAやそれらの関係に影響することがわかっている因子

C->この分析では調べていないが、結果に影響する因子

統計として出てきている結果において、

Cの因子の影響が小さいほど良い。

1.4 統計解析の2大方針

  1. デザインに基づく
  2. モデルに基づく

--

分布

--

二項分布

 P_r(X=k) = {_n C_k} B^k (1-B)^{n-k}

dbinom(k, n, B)

と同値。

正規分布

P_r(X=x)=\frac{1}{\sqrt{2\pi\sigma^2 }} $$\exp(-\frac{(x - \mu )^2 }{ 2\sigma ^2 }) $$


p18の表を写す。

分布 確立密度関数 分布関数 = 確率母関数 = 累積確率密度関数 分位点関数
カイ二乗分布 dchisq(カイ2乗値, 自由度) pchisq(カイ二乗値, 自由度 ) qchisq(%, 自由度)
2項分布 dbinom(生起回数, 試行回数, 母比率) pbinom(生起回数, 試行回数, 母比率) qbinom(%, 試行回数, 母比率)
ポアソン分布 dpois(生起回数, 期待値) ppois(生起回数, 期待値 ) qpois(%, 期待値)
正規分布 dnorm(Zスコア, 平均, 標準偏差) pnorm(Zスコア, 平均, 標準偏差 ) qnorm(%, 平均, 標準偏差)
対数正規分布 dlnorm(Zスコア, 対数平均, 対数標準偏差) plnorm(Zスコア, 対数平均, 対数標準偏差) qlnorm(%, 対数平均, 対数標準偏差)
一様分布 dunif(値, 最小値, 最大値) punif(値, 最小値, 最大値) qunif(%, 最小値, 最大値)
t分布 dt(t値, 自由度) pt(t値, 自由度) qt(%, 自由度)
F分布 df(F値, 第一自由度, 第二自由度) pf(F値, 第一自由度, 第二自由度) qf(%, 第一自由度, 第二自由度)


研究のすすめ

P51 時間の有効な使い方

1、1日をいくつかのブロックに分ける:

 1日を効率よく使うための時間割、自分自身のエネルギーと想像力をベースに

2、それぞれのタスクに優先順位をつける:

 「1日の特定の時間に〜の作業をする」というように決定する

ゴールデンタイム

 1日の中には最も生産性の高まる時間帯を”ゴールデンタイム”と呼ぶ。

 重要な仕事のみをもってきて、それ以外はここに持ち込まないようにする。

 ゴールデンタイムがいつなのかを知るのも大切か。

優先順位

 事とは学生が思い描いている仕事をこなす時間の3倍〜4倍の時間を有する。

タスクの時間は倍数のように・・・ではなく次のようにわる

1、1〜4時間の仕事

2、10分〜1時間以内の仕事

3、10分以内の仕事


最大で4時間なので、うまく仕事を割り当てることができる。