World Bankは、世界の開発指標(World Development Indicators)と呼ばれるパネルデータシリーズの数千を提供しています。
pandas_datareaderを使ったデータ取得
World Bankのデータはpandas_datareaderを用いると簡単に取得できます。
まずは、必要なTickerを検索します。
from pandas_datareader import wb
# GDP per capita in constant dollarsの検索
matches = wb.search('gdp.*capita.*const')
matches
これで条件にあう項目が表示されるので、その中から取得したい項目のIDを選びます。
例えば、NY.GDP.PCAP.KDの場合、
# データのダウンロード
dat = wb.download(indicator='NY.GDP.PCAP.KD', country=['US', 'CA', 'MX'], start=2005, end=2008)
dat
とすることで、簡単に取得できます。
APIを使ったデータ取得
続いて、レポートなどをAPI経由で取得する方法を紹介します。
風力タービンに関連するドキュメントを取得するコードを見てみます。
import requests
url = 'https://search.worldbank.org/api/v2/wds?format=json&qterm=wind%20turbine&fl=docdt,count'
response = requests.get(url)
data = response.json()
qterm
にキーワードを入れることで、検索が可能です。
フォーマットパラメータ「format」として「json」または「xml」のいずれかを指定できます。
https://search.worldbank.org/api/v2/wds?format=json&display_title=wind%20energy
このようにするとタイトルにwindとenergyの両方が含まれるものを検索対象にできます。
より詳細については、公式ドキュメントを確認してください。