2008年06月02日

Posted by ryu908
at 11:30
Comments(17)

2005年6月2日

登録サイトの確認

アカウントがない方は早めに連絡してください。

今回のテーマ

経済学で扱うデータは基本的に2つに分けられる。

①.時系列データ(Time series data)
②.横断面データ(Cross section data)

クロスセクションは国別のデータとか個人別データ、店舗別データなどの時間と関係のないものであったが、時系列データとは年度別、月別、曜日別といった特定の指標の時間推移を示すものである。

なお両方同時に扱うものとしてプーリングデータ(パネルとか最近は言う)がある。

時系列(Wikipedia)


1.データの読み込み

read.table関数によるファイルの読み込み

  read.table("ファイル名")
  read.table("ファイル名",header=T)
  (データの1行目に変数名がある場合「header=T」をつける)

まずExcelを起動する。
このデータをクリックして起動

ExcelにデータがA1からB492まであります。
これを直接、Rに取り込む。

データ範囲を選択してコピーする。
①コピーは編集メニューから選択する方法と
②「Ctrl」+「C」キーのどちらの方法でもよい。

コピーするということは、Windowsのメモリーに一時的に記憶/記録されているということである。
記憶されている場所をWindowsでは「クリップボード」という。
次にRを起動し

x<-read.table("clipboard")

と入力し、xの中身を確認する。Excelのスプレッドシートがクリップボード経由でRに代入されていることが分かる。

2.時系列データの解析

分析ではなく解析としました。
余談:時系列解析を極めたい方は赤池弘次「ダイナミックシステムの統計的解析と制御」をお勧めする。この本のプログラムはfortranだが、実はRに移植されており、R版TIMSACというパッケージで提供されている。琉大図書館には72年版があります。

さて読み込んだデータをまずグラフにして、眺めます。
plot(x)
なんか変な感じです。理由はExcelから読み込むとき、列番号と変数名:V1が自動的に付けられているからです。そこで
plot(x$V1)
これはxデータセットから変数V1だけを取り出すという意味です。
Rでは「データフレーム名$変数名」と$で区切って変数を認識させます。
これでは面倒なので
x1<-x$V1
x2<-x$V2
として変換します。
これで
plot(x1)
plot(x2)
で描画できます。次は同時に表示します。グラフエリアを2つに分割します。
par(mfrow=c(1,2))
これはグラフ制御用の関数で行方向に1行2列に分けるという意味です。
par(mfrow=c(2,1))
とすれば2行1列になる。

ここから時系列分析用のパッケージ「tseries」を使う。
 →パッケージ:tseriesを読み込んでください。

時系列データはデータに時間要素が付く、特殊なものであり、Rでは
tsオブジェクト
という形式にすることで便利な使い方ができる。
ここでは月別データとして2000年1月から始まるものと仮定した。
tsx1<-ts(x1,start=c(2000),frequency=12)
plot(x1)
plot(tsx1)
上と下の違いを確認してください。
同様に
tsx2<-ts(x2,start=c(2000),frequency=12)
plot(x2)
plot(tsx2)


標本自己相関を求める。
acf(tsx1)
acf(tsx2)
decompose(tsx1)
plot(decompose(tsx1))

基本用語解説
・自己相関
・移動平均
・季節調整
・TCSI成分とde trend
・定常時系列
・非定常時系列

dcp<-decompose(tsx1)
tsx1r<-dcp$random
plot(tsx1)
plot(tsx1r)

3.予測

季節調整によってトレンドを除去すると前後12個のデータが欠落する。
のでデータを新たに定義しなおす。

tsx1r<-ts(tsx1r[7:486],start=c(2000),frequency=12)

なお、センサス局法X11、及びX12という方法を使えば、欠損値を補間してくれる。

(1)ARモデル

自己回帰分析をし、その結果をx1arというデータセットに保管する。
x1ar<-ar(tsx1r,method="ols")
summary(x1ar)

予測はpredictコマンドを使う。

x1arp<-predict(x1ar,n.ahead=12)
plot(x1arp$pred,lty=c(1,2))
ts.plot(x1arp$pred,tsx1r[469:480],lty=c(1,2))


参考文献:The R Book

2005年6月2日

2005年6月2日

2005年6月2日

2005年6月2日

(2)ARIMAモデル

AR:自己回帰
I:和分(階差と同じ)
MA:移動平均

xarma<-arima(tsx1r,order=c(2,0,1))
summary(xarma)
plot(xarma$residuals)
xarnap<-predict(xarma,n.ahead=12)
plot(predict(xarma,n.ahead=12)$pred)
ts.plot(xarmap$pred,tsx1r[469:480],lty=c(1,2))


4.課題

次のデータを使ってAR分析し、
12か月先の予測をした図を各自のブログにUPLOADしなさい。

沖縄県観光入域客数
1972(昭和47)1月~2006(平成18)12月まで
data points:420(=12×35)











この記事へのコメント

出席しました。

Posted by e031178 at 2008年06月02日 14:04

出席しました。

Posted by e061107e061107 at 2008年06月02日 14:04

出席しました。

Posted by e061246 at 2008年06月02日 14:04

出席しました

Posted by e051108 at 2008年06月02日 14:04

出席しました。

Posted by e051270 at 2008年06月02日 14:04

出席しました

Posted by e051103e051103 at 2008年06月02日 14:04

出席しました。

Posted by e051137 at 2008年06月02日 14:04

出席しました。

Posted by e061216 at 2008年06月02日 14:05

出席しました。

Posted by e061301 at 2008年06月02日 14:05

6月2日
出席しました。

Posted by e061128e061128 at 2008年06月02日 14:05

出席しました。

Posted by e061305 at 2008年06月02日 14:05

出席しました。

Posted by e051251 at 2008年06月02日 14:05

出席です。

Posted by e051268 at 2008年06月02日 14:05

出席しました

Posted by e053211e053211 at 2008年06月02日 14:05

出席しました

Posted by e061186he061186h at 2008年06月02日 14:06

出席しました。

Posted by 1ゆう5 at 2008年06月02日 14:06

出席しました。

Posted by e061266e061266 at 2008年06月02日 14:06
 
<ご注意>
書き込まれた内容は公開され、ブログの持ち主だけが削除できます。

pagetop▲