|
|
|
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
okh2003aの日記 [全41件]
法文学部社会システム(それと農学部)だけかもしれないが 琉球大学の情報センターはこれまでSASが標準であったが、現在2007年度のシステム変更からRになっている。 いいことだが、毎度思うのはどのような方法で意思決定しているのだろうか。 一方、法文の社会学系ではSPSSを使用しているとのこと。 同じくMaple標準から、Mathematicaも追加されているようだが、教師の利便性が優先されていて、学生のことはあまり気にかけていないようだ。 考えてみれば沖縄で卒業後SASを使う環境なんて、極めて考えにくい。 かといってExcelでは2003から2007の変更から分かるように、不安でしょうがない。 こんかいのRの導入は、学生向きの視点。しかしMathematicaやStllaはどんなもんか。 Maxima、Octave、+scilabでもよかったんじゃなかろか? 現状では、法文から出る情報系の人材は、怖くて使いにくいんじゃなかろか?
重回帰分析 マクロ経済学では消費関数が重要な項目となっており、消費行動を定式化する様々な理論、仮設がだされている。 習慣形成モデルの代表例である ブラウン型消費関数 を例に挙げる。 この仮設は、消費習慣は過去の所得水準での消費が消費行動に慣性、あるいは履歴効果をもたらすというものである。 Y=a+bX(t)+cX(t-1)+dX(t-2)+eX(t3)+・・・ 習慣の持続は幾何級数的に減少すると仮定する。 /////////// sample data ////////// 煙草 消費 所得 65 1758.4 43.7 50.3 66 1844.3 47.6 54.5 67 1945.7 51.4 59.8 68 1949.0 55.5 65.0 69 2071.4 59.9 70.7 70 2155.0 63.1 76.4 71 2254.4 66.1 78.9 72 2360.1 71.4 86.0 73 2463.9 74.8 93.4 74 2598.7 74.4 96.0 75 2618.1 76.0 97.1 76 2576.6 78.0 98.5 77 2663.0 80.1 100.9 78 2649.6 83.8 103.4 79 2679.6 87.0 106.2 80 2632.1 87.1 106.8 81 2635.0 87.7 107.7 82 2642.3 91.2 109.0
※ 期末試験は1月30日に実施します。 相関係数と回帰分析について、再度、学習します。 回帰分析だけでも、この1年間の成果として身につけてもらえれば幸いです。 回帰分析のイメージ 単回帰の描画 相関と回帰のデータ 単回帰は「予測」あるいは「影響関係(場合によっては因果関係)」の解析の基本である。 目的変数=f(説明変数) という関数関係を、具体的に 目的変数=切片+傾き×説明変数 の1次式の形で定式化する。 切片が何を意味するか、傾きはどのように利用されるか、などといったことを分析目的によって使いこなす。 また、データを変換することによって、様々な意味を待たせることが出来る。 //////////////////////////////////////// 最小二乗法について 回帰係数や切片は最小二乗法という方法で推計される。 当てはめるべき推計値と観測値の差の総和を最小にするものが最良の予測であるが、そうするとプラスマイナスが打ち消しあって、総和は常に0になる。そこで推計値と観測値の差を二乗し、その総和を最小にするというアイディアである。 例えば 残差の二乗の総和=>Σ{Y-(a+b・X}^2 の式を最小にする。この手続きは以下の方法で実現できる。 傾き=YとXの共分散/Xの分散 切片=Yの平均-傾き×Xの平均 演習ではこの方法による推定とExcelの関数を用いる方法の複数の方法をマスターする。 → なお、回帰結果の評価は相関係数とその2乗である決定係数による方法があるが、 回帰係数はt分布に従い t=(係数-0)/回帰係数の標準誤差 により、推計された係数が0か否かを検定する。 通常は2以上あれば係数は信頼できるとみてよいだろう。
平均と分散(標準偏差)が与えられれば、正規分布が得られる。 分散が未知の場合、t分布が得られる。 分散の分布も同様に得られる。これをカイ2乗分布という。 正規分布の2乗と考えてよい。t分布同様カイ2乗分布の確率分布も自由度によって決定される。 自由度の項で説明したように、標本分散は母分散より小さな値に偏る傾向にある。そのため母分散の推定にはnではなく(n-1)=自由度1で除した不偏分散を用いる。 カイ2乗値は (n-1)・不偏分散/母分散 により求める。 この式から分かるようにこの分布はt分布同様、自由度に応じて変わる。カイ2乗分布の平均は自由度に一致し、分散はその2倍に一致することが分かっている。 実際に自由度1のカイ2乗の分布形を見てみよう。以下はRのソースコードである。 ////////////////// chigr<-function(x) dchisq(x,1) curve(chigr,0,1) ////////////////// 自由度を変化させると分布形がどうなるか、各自調べよ。 ではExcelによってカイ2乗分布に関する分析を行ってみよう。 Example data 2.01 1.72 1.94 2.05 1.62 2.04 2.12 2.31 1.89 2.32 平均 標準偏差 分散 標本数 自由度 カイ2乗値 上側確率 下側確率 両側確率 確率(信頼度) 下側2.5%点 上側2.5%点 上側信頼限界 下側信頼限界
2つの異なるグループがあるとしよう。 例えば沖縄出身の学生と東京出身の学生の身長、那覇出身の学生と名護出身の学生の体重etc... このような2つのグループが等質か、異質か調べてみたい。 まず平均が等しいか、一方が大きいか、小さいかといったことである。 検定:2つの母平均の差について調べる ![]() 例によって「帰無仮説」とは2つのグループの差を0とおいて、その確率を調べるものである。 0か否かをテストするので「帰無」:すなわち無に帰する=0になる、という非常に分かりにくいかもしれないが、差が0.1のテスト、0.5のテスト、2の、5の・・・などというと、無数の数表を調べなければならない。0か否かなら、一つの数表ですむ、という消極的なテストなのであるが、あらゆる場面で使える便利な概念なのである。 ************************ 2つのグループの検定には 対応のある場合と無い場合がある ************************ さて実際の問題で確認しよう。 |一覧| |
|