2008年06月02日
2005年6月2日
登録サイトの確認
アカウントがない方は早めに連絡してください。
今回のテーマ
経済学で扱うデータは基本的に2つに分けられる。
①.時系列データ(Time series data)
②.横断面データ(Cross section data)
クロスセクションは国別のデータとか個人別データ、店舗別データなどの時間と関係のないものであったが、時系列データとは年度別、月別、曜日別といった特定の指標の時間推移を示すものである。
なお両方同時に扱うものとしてプーリングデータ(パネルとか最近は言う)がある。
時系列(Wikipedia)
1.データの読み込み
read.table関数によるファイルの読み込み
read.table("ファイル名")
read.table("ファイル名",header=T)
(データの1行目に変数名がある場合「header=T」をつける)
まずExcelを起動する。
このデータをクリックして起動
ExcelにデータがA1からB492まであります。
これを直接、Rに取り込む。
データ範囲を選択してコピーする。
①コピーは編集メニューから選択する方法と
②「Ctrl」+「C」キーのどちらの方法でもよい。
コピーするということは、Windowsのメモリーに一時的に記憶/記録されているということである。
記憶されている場所をWindowsでは「クリップボード」という。
次にRを起動し
x<-read.table("clipboard")
と入力し、xの中身を確認する。Excelのスプレッドシートがクリップボード経由でRに代入されていることが分かる。
2.時系列データの解析
分析ではなく解析としました。
余談:時系列解析を極めたい方は赤池弘次「ダイナミックシステムの統計的解析と制御」をお勧めする。この本のプログラムはfortranだが、実はRに移植されており、R版TIMSACというパッケージで提供されている。琉大図書館には72年版があります。
さて読み込んだデータをまずグラフにして、眺めます。
plot(x)
なんか変な感じです。理由はExcelから読み込むとき、列番号と変数名:V1が自動的に付けられているからです。そこで
plot(x$V1)
これはxデータセットから変数V1だけを取り出すという意味です。
Rでは「データフレーム名$変数名」と$で区切って変数を認識させます。
これでは面倒なので
x1<-x$V1
x2<-x$V2
として変換します。
これで
plot(x1)
plot(x2)
で描画できます。次は同時に表示します。グラフエリアを2つに分割します。
par(mfrow=c(1,2))
これはグラフ制御用の関数で行方向に1行2列に分けるという意味です。
par(mfrow=c(2,1))
とすれば2行1列になる。
ここから時系列分析用のパッケージ「tseries」を使う。
→パッケージ:tseriesを読み込んでください。
時系列データはデータに時間要素が付く、特殊なものであり、Rでは
tsオブジェクト
という形式にすることで便利な使い方ができる。
ここでは月別データとして2000年1月から始まるものと仮定した。
tsx1<-ts(x1,start=c(2000),frequency=12)
plot(x1)
plot(tsx1)
上と下の違いを確認してください。
同様に
tsx2<-ts(x2,start=c(2000),frequency=12)
plot(x2)
plot(tsx2)
標本自己相関を求める。
acf(tsx1)
acf(tsx2)
decompose(tsx1)
plot(decompose(tsx1))
基本用語解説
・自己相関
・移動平均
・季節調整
・TCSI成分とde trend
・定常時系列
・非定常時系列
dcp<-decompose(tsx1)
tsx1r<-dcp$random
plot(tsx1)
plot(tsx1r)
3.予測
季節調整によってトレンドを除去すると前後12個のデータが欠落する。
のでデータを新たに定義しなおす。
tsx1r<-ts(tsx1r[7:486],start=c(2000),frequency=12)
なお、センサス局法X11、及びX12という方法を使えば、欠損値を補間してくれる。
(1)ARモデル
自己回帰分析をし、その結果をx1arというデータセットに保管する。
x1ar<-ar(tsx1r,method="ols")
summary(x1ar)
予測はpredictコマンドを使う。
x1arp<-predict(x1ar,n.ahead=12)
plot(x1arp$pred,lty=c(1,2))
ts.plot(x1arp$pred,tsx1r[469:480],lty=c(1,2))
参考文献:The R Book
(2)ARIMAモデル
AR:自己回帰
I:和分(階差と同じ)
MA:移動平均
xarma<-arima(tsx1r,order=c(2,0,1))
summary(xarma)
plot(xarma$residuals)
xarnap<-predict(xarma,n.ahead=12)
plot(predict(xarma,n.ahead=12)$pred)
ts.plot(xarmap$pred,tsx1r[469:480],lty=c(1,2))
4.課題
次のデータを使ってAR分析し、
12か月先の予測をした図を各自のブログにUPLOADしなさい。
沖縄県観光入域客数
1972(昭和47)1月~2006(平成18)12月まで
data points:420(=12×35)
アカウントがない方は早めに連絡してください。
今回のテーマ
経済学で扱うデータは基本的に2つに分けられる。
①.時系列データ(Time series data)
②.横断面データ(Cross section data)
クロスセクションは国別のデータとか個人別データ、店舗別データなどの時間と関係のないものであったが、時系列データとは年度別、月別、曜日別といった特定の指標の時間推移を示すものである。
なお両方同時に扱うものとしてプーリングデータ(パネルとか最近は言う)がある。
時系列(Wikipedia)
1.データの読み込み
read.table関数によるファイルの読み込み
read.table("ファイル名")
read.table("ファイル名",header=T)
(データの1行目に変数名がある場合「header=T」をつける)
まずExcelを起動する。
このデータをクリックして起動
ExcelにデータがA1からB492まであります。
これを直接、Rに取り込む。
データ範囲を選択してコピーする。
①コピーは編集メニューから選択する方法と
②「Ctrl」+「C」キーのどちらの方法でもよい。
コピーするということは、Windowsのメモリーに一時的に記憶/記録されているということである。
記憶されている場所をWindowsでは「クリップボード」という。
次にRを起動し
x<-read.table("clipboard")
と入力し、xの中身を確認する。Excelのスプレッドシートがクリップボード経由でRに代入されていることが分かる。
2.時系列データの解析
分析ではなく解析としました。
余談:時系列解析を極めたい方は赤池弘次「ダイナミックシステムの統計的解析と制御」をお勧めする。この本のプログラムはfortranだが、実はRに移植されており、R版TIMSACというパッケージで提供されている。琉大図書館には72年版があります。
さて読み込んだデータをまずグラフにして、眺めます。
plot(x)
なんか変な感じです。理由はExcelから読み込むとき、列番号と変数名:V1が自動的に付けられているからです。そこで
plot(x$V1)
これはxデータセットから変数V1だけを取り出すという意味です。
Rでは「データフレーム名$変数名」と$で区切って変数を認識させます。
これでは面倒なので
x1<-x$V1
x2<-x$V2
として変換します。
これで
plot(x1)
plot(x2)
で描画できます。次は同時に表示します。グラフエリアを2つに分割します。
par(mfrow=c(1,2))
これはグラフ制御用の関数で行方向に1行2列に分けるという意味です。
par(mfrow=c(2,1))
とすれば2行1列になる。
ここから時系列分析用のパッケージ「tseries」を使う。
→パッケージ:tseriesを読み込んでください。
時系列データはデータに時間要素が付く、特殊なものであり、Rでは
tsオブジェクト
という形式にすることで便利な使い方ができる。
ここでは月別データとして2000年1月から始まるものと仮定した。
tsx1<-ts(x1,start=c(2000),frequency=12)
plot(x1)
plot(tsx1)
上と下の違いを確認してください。
同様に
tsx2<-ts(x2,start=c(2000),frequency=12)
plot(x2)
plot(tsx2)
標本自己相関を求める。
acf(tsx1)
acf(tsx2)
decompose(tsx1)
plot(decompose(tsx1))
基本用語解説
・自己相関
・移動平均
・季節調整
・TCSI成分とde trend
・定常時系列
・非定常時系列
dcp<-decompose(tsx1)
tsx1r<-dcp$random
plot(tsx1)
plot(tsx1r)
3.予測
季節調整によってトレンドを除去すると前後12個のデータが欠落する。
のでデータを新たに定義しなおす。
tsx1r<-ts(tsx1r[7:486],start=c(2000),frequency=12)
なお、センサス局法X11、及びX12という方法を使えば、欠損値を補間してくれる。
(1)ARモデル
自己回帰分析をし、その結果をx1arというデータセットに保管する。
x1ar<-ar(tsx1r,method="ols")
summary(x1ar)
予測はpredictコマンドを使う。
x1arp<-predict(x1ar,n.ahead=12)
plot(x1arp$pred,lty=c(1,2))
ts.plot(x1arp$pred,tsx1r[469:480],lty=c(1,2))
参考文献:The R Book
(2)ARIMAモデル
AR:自己回帰
I:和分(階差と同じ)
MA:移動平均
xarma<-arima(tsx1r,order=c(2,0,1))
summary(xarma)
plot(xarma$residuals)
xarnap<-predict(xarma,n.ahead=12)
plot(predict(xarma,n.ahead=12)$pred)
ts.plot(xarmap$pred,tsx1r[469:480],lty=c(1,2))
4.課題
次のデータを使ってAR分析し、
12か月先の予測をした図を各自のブログにUPLOADしなさい。
沖縄県観光入域客数
1972(昭和47)1月~2006(平成18)12月まで
data points:420(=12×35)
この記事へのコメント
出席しました。
Posted by e031178 at 2008年06月02日 14:04
出席しました。
Posted by e061107 at 2008年06月02日 14:04
出席しました。
Posted by e061246 at 2008年06月02日 14:04
出席しました
Posted by e051108 at 2008年06月02日 14:04
出席しました。
Posted by e051270 at 2008年06月02日 14:04
出席しました
Posted by e051103 at 2008年06月02日 14:04
出席しました。
Posted by e051137 at 2008年06月02日 14:04
出席しました。
Posted by e061216 at 2008年06月02日 14:05
出席しました。
Posted by e061301 at 2008年06月02日 14:05
6月2日
出席しました。
Posted by e061128 at 2008年06月02日 14:05
出席しました。
Posted by e061305 at 2008年06月02日 14:05
出席しました。
Posted by e051251 at 2008年06月02日 14:05
出席です。
Posted by e051268 at 2008年06月02日 14:05
出席しました
Posted by e053211 at 2008年06月02日 14:05
出席しました
Posted by e061186h at 2008年06月02日 14:06
出席しました。
Posted by 1ゆう5 at 2008年06月02日 14:06
出席しました。
Posted by e061266 at 2008年06月02日 14:06