雑草研究において,生育条件によ り雑草の種子生 産数が変化するかどうかなど, ある要因が測定データ に与える影響の統計学的裏付けを得るため,分散分 析が使われてきた。分散分析は,① データのばらつき が正規分布に従う こと,② 要因間の分散が等しいこと (等分散性)を仮定している。しかし,我々が扱うデー タの中には, この2つの仮定を満たさないものも多い。 本稿で扱う割合データでいえば,次のよ な性質を持つ う ため分散分析の仮定を満たさない。 ①割合なので, データの取りる範囲は0から1であ う る(正規分布の取る範囲は-∞から∞) 。 ②平均値が0も は1に近づく しく ほど分散が小さ な く り,要因間の分散が等しく ならない。 近年,データのばらつきを正規分布以外の確率分 布でも表現できるように拡張した,一般化線形モデル (Generalized Linear Model, 以下GLM)が普及して いる。本稿では,分散分析による仮説検定を拡張した 手法と して, GLMを用いた仮説検定をフリー統計ソフ ト ウェア「R」 (R Development Core Team 2009)の使 い方を示しながら解説する。 特に本稿では,割合データの解析方法を中心に解 説する。本稿でいう割合とは,全試行数(発芽試験 に供試した種子数や除草剤を散布した個体数など) のうちの,着目した事象が起きた数(発芽や除草剤に よる死滅など)の割合のことである。このよ う なデータのことを本稿では割合データ と呼ぶ。 ここで注意したいのは,単位面積あたりの発生雑草 数など,測定値を調査面積で割ったデータは本稿で扱 う割合データとは異なるという点である。なぜなら,単 位面積あたりの発生雑草数に換算するのは,圃場内 の発生雑草数を推定するためや異なる調査面積の データを比較するためであり,解析されるのは密度の形 で表された雑草の“数”だからである(このよ うなケー スの解析例は,下野(2010)でオフセッ トを用いた GLMと して紹介されている) 。一方,割合データでは, 発芽した数と発芽しなかった数など,着目 した事象が起 きた数と起きなかった数がわかるため,着目した事象が 起きた“確率”を解析することになる。
CITATION STYLE
Imaizumi, T. (2010). An introductory guide to statistical analysis-generalized linear models for proportion data using R. Journal of Weed Science and Technology, 55(4), 275–286. https://doi.org/10.3719/weed.55.275
Mendeley helps you to discover research relevant for your work.