An introductory guide to statistical analysis-generalized linear models for count data using R.

  • Shimono Y
N/ACitations
Citations of this article
33Readers
Mendeley users who have this article in their library.

Abstract

雑草研究において,生育条件によ り雑草の種子生 産数が変化するかどうかなど, ある要因が測定データ に与える影響の統計学的裏付けを得るため,分散分 析が使われてきた。分散分析は,① データのばらつき が正規分布に従う こと,② 要因間の分散が等しいこと (等分散性)を仮定している。しかし,我々が扱うデー タの中には, この2つの仮定を満たさないものも多い。 本稿で扱う割合データでいえば,次のよ な性質を持つ う ため分散分析の仮定を満たさない。 ①割合なので, データの取りる範囲は0から1であ う る(正規分布の取る範囲は-∞から∞) 。 ②平均値が0も は1に近づく しく ほど分散が小さ な く り,要因間の分散が等しく ならない。 近年,データのばらつきを正規分布以外の確率分 布でも表現できるように拡張した,一般化線形モデル (Generalized Linear Model, 以下GLM)が普及して いる。本稿では,分散分析による仮説検定を拡張した 手法と して, GLMを用いた仮説検定をフリー統計ソフ ト ウェア「R」 (R Development Core Team 2009)の使 い方を示しながら解説する。 特に本稿では,割合データの解析方法を中心に解 説する。本稿でいう割合とは,全試行数(発芽試験 に供試した種子数や除草剤を散布した個体数など) のうちの,着目した事象が起きた数(発芽や除草剤に よる死滅など)の割合のことである。このよ う なデータのことを本稿では割合データ と呼ぶ。 ここで注意したいのは,単位面積あたりの発生雑草 数など,測定値を調査面積で割ったデータは本稿で扱 う割合データとは異なるという点である。なぜなら,単 位面積あたりの発生雑草数に換算するのは,圃場内 の発生雑草数を推定するためや異なる調査面積の データを比較するためであり,解析されるのは密度の形 で表された雑草の“数”だからである(このよ うなケー スの解析例は,下野(2010)でオフセッ トを用いた GLMと して紹介されている) 。一方,割合データでは, 発芽した数と発芽しなかった数など,着目 した事象が起 きた数と起きなかった数がわかるため,着目した事象が 起きた“確率”を解析することになる。

Cite

CITATION STYLE

APA

Shimono, Y. (2010). An introductory guide to statistical analysis-generalized linear models for count data using R. Journal of Weed Science and Technology, 55(4), 287–294. https://doi.org/10.3719/weed.55.287

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free