R and stats

パイプ

library(dplyr) # ←この時点でわかりにくい。これで合ってるかな。なんの略だこれ。 x <- rnorm (100) y <- rnorm (100) lm (y ~ x) %>% summary わー便利。さて、lm (y ~ x) の中身はと・・・中身はと・・・ 結局コードしなおしじゃん。 パイプの中をごちゃ…

はじめてのべいずせいこう

かけんひのさいたくりつ(p)の事後分布 (by Rstan)。Stanでは事前分布は一様分布になるそうだ。ここでは デフォルトの0 to 1。 うけるわ。なんやこれ。一生無理やん(右端は1じゃないからね)。生々しいなー、こうするとなんか。 ある意味ベイズ統計のちから…

P値

Nature Digest 統計学の大物学者がP値の刷新を提案 - pp18 - 19 http://www.nature.com/ndigest/index_ja.html?volume=14&issue=11 原著 https://psyarxiv.com/mky9j ショッキングな見出しである。 新発見の統計的有意性を評価するために、科学者が好んで用…

 忘備録:誤差伝播

x, yに誤差があるときにf(x,y)の誤差はどうなるか(近似) x.hat = x + Δx y.hat = y + Δy ただし x.hat、y.hatはそれぞれx, yの推定値 Δx, Δy それぞれx, yにおける誤差。ただし、誤差分布の平均は0、分散はそれぞれ(e_x)^2, (e_y)^2 とする。 f(x,y)の推定…

 覚え:切片だけのロジスティック回帰

(1つの飼育容器に10匹入れて選好性試験:AとBのどっちに行くか)×20反復 母比率=0.5を検定したい 切片だけのロジスティック回帰?(もちろん各個体は他の個体と独立に選ぶという前提で) # ロジスティック関数・切片だけモデル・シミュレーション# 関数定…

昨日の会議が5時間半もあったのでかなり疲れが残っている. 日を超えるのはなんとか免れた。 そういうわけで今日の午前はゆるゆるやる。夜の部もあるし。 図はこんなもんか。 x軸をあと書きするとき plot(..., xaxis = F); axis(1,at = 1:6, labels = 文字ベ…

 FAQ

はい、そうです。 たった2群でも分散分析できるんです。 等分散を仮定した場合の2群の分散分析はシンプルなt検定と同じ結果になるんです。 卒論時期には必ず一回は来る質問。 「2群の時はt検定、3群以上のときは分散分析」 という教条化した、硬直化し…

条件にあう要素だけを置換する alpha[which(alpha > 8)]

lev lev levels(dat$host) 以下にエラー `levelsvalue = c("hati", "kene", "meda", : number of levels differs 消えないな。

 削除して、もはや存在しない level を消す

除去したはずのlevelがまだ有効・・・不思議な仕様だ。 horai, susukiが生き残っている。なぜだろう?追記: http://www.okada.jp.org/RWiki/?Tips%2F%BB%B3%DC%A5Tips%BD%B8#a8c9e343factor(x)で消えるとな

NA行を除去dat hostがAでもBでもないものを抜く dat[dat$host != "horai" & dat$host != "susuki",]

 軸目盛の変更lab

なんかいいところだけど、整数軸にしたい・・・こういうちょっとしたことを直すのは簡単ではない。 plot( ... ,lab=c(4,7,7)) # x, y, サイズ むずい!追記: plot(..., yaxp = c(0, 3, 3)) # 下限、上限、目盛数

ラベル軸の大きさとか変える方法とか忘却のかなた。 なんでデフォがこんなに小さいのか、馬鹿なんじゃないのか。 cexがラベルに効かない。おかしいね。

プロットの並べ換えってどうやるんだっけ・・・?もうね、毎度毎度。 っていうか、この程度のことも簡単にできないRはやはり市民権を得ることはできないのではないだろうか。

 防備録

NAを除いたベクトルの要素を取り出す x[!is.na(x)] #横方向へのデータから差分をとる xx for (i in 3:15){ xx } xx # タテにならべてデータフレームを作る n host ind day fec dat2 平均と標準偏差プロット library(gplots) plotmeans(y~x)

一応できた。おやつのあんみつがよかったか。 trt d n m rvector(t(m)) trt1 response dat 071003追記(こっちのほうがいいか) # 別解 trt d n rvector(t(cbind(d,n))) trt1 response dat

Rで二値応答データ treatment diapause nondiapause A 0 3 B 1 3 C 3 1 を trt response A 1 A 1 A 1 B 0 B 1 B 1 B 1 C 0 C 0 C 0 C 1 みたいにする方法。前に自分でやったか人に教えてもらったことがあるような気がするが completely に忘れてしまった。ご…

青木先生のページを眺めていたら、R.A.フィッシャーの論文を集めたサイトのことが掲示板に乗っていてびっくり。まあほとんど見ないだろうけど。 http://www.library.adelaide.edu.au/ual/special/fisher.html

枝分かれ分散分析 Nested ANOVA on R, SAS and SPSS

ここに書いてあることは古くて現状に即していないと思いますし、私は統計学者でもありませんので、別の資料を参照されたほうがよいと思います。誤りがあればご指摘ください。2012年6月15日 後輩のデータは枝分かれnested(階層的;hierarchical)ANOVAだと思…

Rつづき mixed-model

多重ロジスティック回帰の変数のひとつがランダム要因の場合、やはりglmmPQLにするのだろうか。しかしglmと同じ文法でそれっぽくやってみてもダメだった。nlmeはえらく難しい。ttp://www.geocities.jp/nob_cambridge/GLMM.htm glmmPQL(Y~x1+x2+x3, family=bi…

R

久保さんにsuggestされたstepAICを呼び出そうとしたが、そんなもんはない!とつっぱねられる。よく調べてみるとMASSライブラリーを読み込まないとだめということだったが、ライブラリーの読み込み方の基本すら怪しく、いろんなプルダウンメニューを開いて悪…

 率の回帰

久保さんに出した統計関連の質問(「呪われた」率の回帰の問題)の返事が来る。詳しく答えてくれて大変感謝。 仮想の例をつけたのだが説明が足りなかったようで、真剣に解析していただいた(冷や汗もの)。glm+AICかあ。なるほど・・・。 「生データから率に…

昨日に引き続き2×2×2の分割表データを対数線形モデルで解析。午前中いっぱいRと格闘した末、劇的な勝利(negative)。飯くってこよ。馬鹿馬鹿しい。

 分割表の対数線形モデル

粕谷先生にsuggestされた分割表の対数線形モデルアプローチ。ネットで調べるというおざなりなことをする。 このリソースは割とよさそう。SASやSのプログラムが載っているし、ロジスティック回帰との関係についても触れている。 http://wwwbs.let.hokudai.ac.…

zが二値反応(従属変数)で、x,yがカテゴリー変数のときの解析法x y z - a i 1 a i 0 a j 0 a j 1 b i 1 b i 1 b j 0 b j 1ダミー変数を用いたロジスティック回帰でいいのかしらん?SPSSとSASで答えが合わない。肝心なところは両方ネガティブなのでいいのだ…

つづき

なんか式たててたら、正規分布の積の分布はどないやねん、という問題にぶちあたる。ネットで調べたら、なんかの呪文のようなものが見える↓ 「なお,メリン変換の特異積分式は留数定理により求めることができますが,これによって,確率変数の積,商,代数関…

疑似反復

統計の相談をうける。1つの個体で、ある刺激に対する反応を数回にわけて観察する。多くの個体で同じことを繰り返す。このとき刺激に対する反応を、全個体全回数をプールして1つのサンプルとする。 これは明らかに疑似反復(pseudoreplication)の問題を含…

 回帰の平行性の検定

これは古くなった勉強日記です。皆さんの勉強には下記の青木先生のサイトや、英語ですがZarのBiostatistical Analysis 4th edn.あたりがいかがでしょうか。最近ではこの問題について信頼のおけるサイトがいくつもあります。また、コメント欄もご参照ください…

「デ−タ解析で出会う統計的問題 -- 多重検定と多重比較をめぐって」

(04.12.16補足)以下では多重比較の方法について述べていません。青木先生のHPをおすすめします。http://aoki2.si.gunma-u.ac.jp/ 生態学会のときに聞けなかった自由集会の資料を読んでみる。説明が聞けなかったので残念ながらあまり深くは頭に入らない。多…

統計のお勉強

TVのキスイヤ!を見ながら、ウチにある統計の本をパラパラとめくってた。キスイヤ!のなかではカップルが修羅場を演じていた。展開にドキドキしながら、なんとか理解したところによると、多変量の場合のt検定(μ=μ0)はHotellingのT、F検定はWilksのΛに対応…