2011年9月13日火曜日

実証に役立つデータセットへのリンク集のリンク集

実証研究をしていく上で悩ましいのはデータセットの入手です。
ここでは、実証分析を進めていく上で比較的よく使われるデータセットのリンク集を紹介します。

多くは国連や世銀、IMF、著名な研究者が公表しているフリーのデータセットですが、使う場合はきちん使用権限を確認し、リファーも忘れないようにしましょう。


--------------------------------------------


■東京大学 戸堂康之先生HPのリンク集


世銀やOECDなどの代表的なデータセットへのリンクが掲載されています。また、貧困・国際経済・経済成長に関するリンクも豊富です。基本的にクロスカントリーのデータセットが中心。非常に便利。公表されているデータを使う分には必要十分か?



■京都大学 遊喜一洋先生HPのリンク集
戸堂先生に引き続きクロスカントリーのデータセットは経済成長・発展に関するものが多いですが、日本国内の代表的なデータセットに関するリンクも豊富です。GDPや雇用、家計調査、物価など。



以上2つのリンク先から代表的なデータセットの殆どにアクセス出来ると思います。




■ Harvard R.Barro のHPデータセットリンク集
マクロ経済指標のパネルデータセットやEconomic disasterに関するデータセットなどが入手出来ます。



■Barro-Lee Educational Attainment Dataset
実証では『人的資本』をよく説明変数に使いますが代表的なデータがこちらです。平均修学年数や初等・中等・高等教育を受けた人の割合などがクロスカントリーで入手できます。

The Barro-Lee Data set (2011) extends our previous estimates from 1950 to 2010, and provide more, improved data disaggregated by sex and and by 5-year age intervals. It provides educational attainment data for 146 countries in 5-year intervals from 1950 to 2010. It also provides information about the distribution of educational attainment of the adult population over age 15 and over age 25 by sex at seven levels of schooling— no formal education, incomplete primary, complete primary, lower secondary, upper secondary, incomplete tertiary, and complete tertiary. Average years of schooling at all levels—primary, secondary, and tertiary—are also measured for each country and for regions in the world.   



との事。入っているデータは以下。



    The full dataset contains the following variables:
      Variable
      Description
      BLcode
      Barro-Lee Country Code
      WBcode
      World Bank Country Code
      region_code
      Region Code
      country
      Country Name
      year
      Year
      sex
      Sex
      agefrom
      Starting Age
      ageto
      Finishing Age
      lu
      Percentage of No Schooling  Attained in Pop.
      lp
      Percentage of Primary Schooling Attained in Pop.
      lpc
      Percentage of Complete Primary Schooling Attained in Pop.
      ls
      Percentage of Secondary Schooling Attained in Pop.
      lsc
      Percentage of Complete Secondary Schooling Attained in Pop.
      lh
      Percentage of Tertiary Schooling Attained in Pop.
      lhc
      Percentage of Complete Tertiary Schooling Attained in Pop.
      yr_sch
      Average Years of Schooling Attained
      yr_sch_pri
      Average Years of Primary Schooling Attained
      yr_sch_sec
      Average Years of Secondary Schooling Attained
      yr_sch_ter
      Average Years of Tertirary Schooling Attained
      pop
      Population
      pop15
      Total Population over 15
      pop25  Total Population over 25

より詳細に知りたい場合はこちらのpaperを参照の事。




■Oxford Markus Everhardt の開発・貧困に関する膨大なリンク集


開発経済学はなんといってもデータが重要になってきますが、このリンク集のデカさは圧巻。

参考までに My Top 10 Data links and Tools に含まれているデータは以下のようになります。
As of 13th April 2011, these are my personal favourites:

  1. Stata tool wbopendata which allows you to download entire 'topics' of data from the World Bank's archives. My littledo-file helps you to transform these into Stata long format (so that we can carry out panel empirics).
  2. Easy-to-use geo-spatial data (including a GDP measure!) from the G-Econ research project at Yale University.
  3. The latest World Bank World Development Report Conflict, Security and Development comes with a comprehensivedata file covering a wide range of sources.
  4. UN ComtradeTools and StataStata Daily blog suggests easy way of getting trade data (using UN ComtradTools) into Stata. See also my simple Stata 10 do-file with additional information.
  5. The Penn World Table (PWT) data compiled by the Center for International Comparison at UPenn (for the last time with version 7!) is still one of the standard resources for development economists.
  6. The World Bank Wealth of Nations dataset provides country-level data on comprehensive wealth, adjusted net saving and non-renewable resource rents indicators.
  7. The GTAP group at Purdue's AgEcon Department not only provides resources and tools for trade analysis but also free data on FDI, migration, CO2...
  8. The disaggregated ACLED (Armed Conflict Location and Events Dataset), compiled by the Centre for the Study of Civil War (CSCW) at the Peace Research Institute Oslo (PRIO).
  9. 'The' Data blog developmentdata.org by Gunilla Petterson at Sussex University. 
  10. Another excellent data blog DEVECONDATA by Masayuki Kudamatsu at IIES (Stockholm University)

こちらは @pta277 さんに教えて頂きました。ありがとうございます。



■JIPデータベース(Japan Industrial Productivity Dataset)
日本の経済成長と産業構造を分析する上での基本資料。少なくともJIP2006段階で
日本経済全体について108セクター[PDF:125KB]という詳細な産業別に、全要素生産性を推計するために必要な、資産別資本ストックと資本コスト、属性別(男女別・学歴別・年齢別等)労働投入、総生産と中間投入、などの年次データ(1970-2002年をカバー)と、貿易・規制緩和指標などに関する付帯表から構成されている。

との事。ちなみにリンク先のRIETIには他にも便利なデータセットが掲載されています。

--------------------------------------------

今回はリンク集のリンク集という事で更新しました。
まだまだ沢山ありますが取り敢えず基本的なものが揃っているようにも思われます。随時更新して行くと思います。

今回はリンク集のリンク集でしたが、次回はここで取り上げられたものの中から個別に重要なデータセットを取り上げて紹介したいと思います。

0 件のコメント:

コメントを投稿