オープンデータとは?

オープンデータは、誰もが自由に利用が許されるデータです。利用が許されるから、利用しやすい、公開しやすいデータです。

このようなデータを日本だけでなく、世界中で広く活用されています。2013年6月の主要8ヶ国首脳会議(G8サミット)で、各国の首脳が「オープンデータ憲章」に合意しました。首脳宣言で「オープンな政府データとは、情報時代の不可欠な資源である」と述べられています。公共データがオープンとなり、広くたくさんの人々に活用されることによりもたらされる行政や、経済、情報の流通の活性化に世界中の期待が寄せられています。

日本では、政府が国家戦略として、2012年に「電子行政オープンデータ戦略」、2013年に「世界最先端IT国家創造宣言」を掲げました。政府だけでなく、地方自治体も含めて公共データの活用のため、オープンデータを推し進める環境づくりを進めています。

オープンデータの推進の目的・意義を「電子行政オープンデータ戦略」にて3つ挙げています。

1)透明性・信頼性の向上
国民が公共データを活用して政府・自治体の政策等を分析し、判断することで、行政の透明性が高まり、信頼を高めること
2)国民参加・官民協同の推進
民間サービスを新しく作り出すことにより、官民連携による公共サービスの提供や、データを活用したサービスが迅速かつ効率的に提供できること
これによって、身の回りの問題(例えば、街灯の電球が切れているから、夜道が暗いなど)に対し、官民が協力的、適切に対応することができる
3)経済の活性化・行政の効率化
データを活用することによって、様々な新しいビジネスが生み出されたり、企業の活動が効率的になること
また、行政機関では政策決定事項などに公共データの分析結果を使うことで、業務が効率的かつ高度的に行えること

オープンデータは行政機関だけでなく、民間企業・個人の手で活用されることで、行政改革、経済活性化につながることが期待されています。また、様々なデータを組み合わせ(マッシュアップ)たり、分析することにより、データの活用の幅を広げ、社会課題や人々のニーズへの対応の選択も広がります。

 

オープンデータはどのように利用できるのでしょうか。

オープンデータは、オープン化したいデータに特定のライセンスを与えるだけで利用できます。
広く開かれた利用を許可することを表示する「オープンライセンス」を提示し、他の人がそのデータを利用することができるようになります。
オープンライセンスが与えられたデータには、次の特性があります。

1)利用可能であり、アクセスが可能である
データの利用は自由であるべきとされており、その為にオープン化されたデータは、インターネットから簡単にアクセス可能であり、誰もが使いやすく加工しやすい形式であることが求められていること
2)再利用と再配布が可能である
データは再利用・再配布可能である必要があること。加工するために他のデータと組み合わせて使用することも許されている必要があること
この再利用・再配布されるデータはもちろん、無償提供されること
また、再配布する際、配布される時点と同条件の下でおこなわれること
3)誰でも利用可能である
誰もが利用できて、再利用・再配布も可能でなければならないこと
データの使用方法に対して規制を設けてはいけないし、営利・非営利を押し付けることなく、どんな方法で活用しても構わないという条件であること

オープンライセンスやそれをよりどころとして従うライセンスには様々なものがあり、日本一般的に採用されているものは、「パブリックドメイン」と「クリエイティブ・コモンズ・ライセンス(CCライセンス)」です。

特にCCライセンスは、データに与えられたライセンスの制約が一目でわかり、ライセンス情報がメタデータとして公開されることによりそのデータをインターネットから検索されやすくすることができるという特徴があります。

さらに、CCライセンスの中でも「CC BY」というライセンスは指定のクレジットの明記を主な利用条件とし、加工することを許す「改変」や商業などの「営利目的での利用が可能」であるため、利用の自由度が非常に高く、オープンデータの条件にぴったりと適合するライセンスとして広く利用されています。

CCライセンスの利用方法は、専用のマークをオープン化したいデータを掲載したサイト上に、指定された方法で表示することで利用できます。このマークが表示されていることで、対象のデータがオープンライセンスであることを証明することができます。また、利用者へそのデータが自由に活用できることをアピールすることができます。ライセンスの利用には、登録や費用は一切必要ありません。ライセンスの選択からロゴの貼り付け方までサポートする、選択式ガイドサイトがあります。
https://creativecommons.org/choose/

 

オープンデータを広めるには、どのようなデータであればよいでしょうか。

オープンデータを推し進めていく上で、重要な点は、機械も人間も判読可能な形式のデータであることが大切であることです。オープンデータの定義に含まれている「使いやすく加工しやすい形式での公開」を目指すことが求められています。これはデータを、どのアプリケーションからでも読み込むことができる形式(機械判読可能なデータ形式)であることが重要です。例えば、Macで読み込めても、Windowsでは読み込めないデータは、とても利用しにくいデータと言えます。

Web の考案者で、Linked Data の創設者であるティム・バーナーズ・リーが提唱した「5スター・オープンデータ」はオープンデータの公開度を5段階で表したものです。

☆なし
他のページへのリンクだけの状態、またはオープンライセンスがないデータはオープンデータの評価を受けない

☆1つ
データ形式はPDF,JPG
形式を問わず、データにオープンライセンスを与えた状態でWeb上にて公開
この場合には、データは直接編集できない形式でも構わない

☆☆2つ
データ形式はExcel,Word
データを構造化データとして公開。この場合には、データは直接編集できる形式である

☆☆☆3つ
データ形式はXML,CSV
非独占のデータで意識で公開。この場合には、アプリケーションに直接取り込んですぐに活用可能であるなど、機械判読可能な形式である。

☆☆☆☆4つ
データ形式はURI,RDF
様々な人がデータにリンク可能な形式で公開

☆☆☆☆☆5つ
データ形式はLinked Dataに参加する
公開するデータを他のデータとリンクさせることでデータのコンテキストを提供。データをリンクドデータとして公開した場合には、データ利用者は1つのデータから様々な類似あるいは関連データをみつけることができる

 

オープンデータを活用したアプリケーションの開発者にとって、機械判読可能なデータはアプリケーションの開発や、保守の工数に直結しています。オープンデータがより普及され、多くの人に活用されるためには、機械判読可能な形式のデータが重要であることが言えます。

 

参考URL/日経コンピュータ 「オープンデータとは」

http://itpro.nikkeibp.co.jp/article/Keyword/20131028/514232/?ST=govtech&P=1