(これは遊び)

 それはさておき。
 大学入試センターのプレス発表資料*1
によると、昨年度のリスニングテスト受験者数は 491,056人で、解答中に不具合等の申出があった機器台数は 185台だそうだ(机上からの落下等の申出により交換した43台を含む)。
 今年は、時事通信によると、リスニング受験者は49万4350人で、249人が不具合の申し出を行ったそうだ*2


「母不具合率に有意差があるかどうかを二項分布の正規近似で有意水準0.05で求めなさい。」 

# touan

#2007
mu7 <- 185
var7 <- mu7 * (491056-mu7)/491056 # 184.9303

#2008
mu8 <- 249
var8 <- mu8 * (494350-mu8)/494350 # 248.8746

# mu8-mu7

mu.dif = mu8 - mu7 # 64
var.dif = var7 + var8 # 433.8049

pnorm ( 0, mu.dif, sqrt(var.dif)) # 0.001060341

qnorm ( 0.025, mu.dif, sqrt(var.dif)) # lower.limit = 23.17790
qnorm ( 0.975, mu.dif, sqrt(var.dif)) # upper.limit = 104.8221

 
 うーん。誤差の範囲なんじゃないの?と思ったらけっこう有意だな。本当かね。(t分布を使うべきなのかしら)
 
 ただし、「不具合」というのが曲者で、ぱっと聞くと機械の故障のように聞こえるが、さきの大学入試センターの資料によると、機器に起因する不具合よりも受験者の
使用方法に起因するもの等(「再生ボタンの長押し失敗」「受験者が機器の不具合と受けとめたと考えられるもの」「検証では不具合が再現せず,かつ
申出症状等から原因の推定もできなかったもの」)が圧倒的に多い(110/142)。これは知らなかった。そういうわけで、これらの要因も交絡しているのだろうから、こういう統計値もだいぶ変わるだろう。