本文へ

 

空間データの品質

第3回 差分抽出

2010年9月13日

差分抽出はなぜ必要か

主題図のGISデータ更新は、現況の変化を忠実にGISデータに反映させることが目的です。したがって、次の2つを満足させることが必要であると考えています。

  1. 現況の変化を正確にGISデータに反映させていること。
  2. 受託の責任範囲である作業範囲を明確にすること。

GISデータの更新は、現状の変化を忠実に反映させる作業ですから、完全性の検査を厳密に行う必要があると考えています。しかし、主題図のGISデータの完全性は、そのほとんどが現況の変化の地物等の真値が分からないことから、取得データの抜取検査で行われています。このため、完全性は、確率の問題として曖昧な問題を抱えています。但し、現状の変化数が把握している例外として、完全性を最も重視する固定資産では、別に地番、家屋の課税マスターがありますので、真値とするデータがあります。比較する真値があれば、完全性の検査を自動化することができます。

資産税では、家屋の異動判読に前年の画像と今年度の画像を比較して、色の変化を差分抽出することによって、家屋の異動を判別することを手助けする製品等もあります。しかし、残念ながら、現時点では、真値が分からない地物の品質の完全性を担保するための自動化は、今後の技術開発を待たなければならないようです

一方、受託の責任範囲である作業範囲を明確にする目的は次の項目があります。

  1. 加除訂正の内容を明らかにする。
  2. 契約の条件である加除訂正した範囲の品質を担保する。

加除訂正の内容を明らかにするとは、一般産業界で行われている修理や、改良で、調子が悪いので、良くするため(測量では現況の変化、誤差等に相当)、モジュールの追加、部品交換、修理等を行い、その明細はかくかくです、に相当します。主題図のGISデータが製造物ですから、他の産業界のように、加除訂正の明細を提出することが計画機関の信頼を勝ち得るためにも加除訂正の明細が必要ではないかと考えています。

次に、契約条件である加除訂正した範囲の品質担保をするためには、加除訂正した、削除、訂正、追加の地物抽出し、そのデータが品質要求を満足することを保証する必要があります。そこで、このような目的を達成するため、差分抽出ツールが必要であると考えています。

作業機関の皆様も、契約範囲外の誤差(エラー)を直せといわれる理不尽な要求から解放されたいと思いませんか。

差分抽出ツールとは

差分抽出ツールは、元データと加除訂正した更新データを比較して、その差分を抽出することを言います。私が作成したものは、更新データを元データと比較して次の分類を行います。

  1. 元データにあって更新データにないもの。(削除データ)
  2. 更新データにあって元データにないもの。(追加データ)
  3. 座標の一部が異なるもの。(訂正データ・座標)
  4. 座標が同じで、両方にあって属性が異なるもの(訂正データ・属性)
  5. 元データと更新データが全く同一なもの(無変更データ)

差分抽出するには、元データと更新データの同一の地物を探す必要があります。 例えば、元データにある渡邉の家、更新データにある渡邉の家を比較して、削除、追加、訂正を判断する必要があります。ところが、一般的なGISフォーマッ トには、元データと更新データの地物が同じ地物であることを示す情報が入っていません。

そこで、地物ごとに、元データの1番最初のデータと更新データの1番最初のデータの座標列を1点、1点比較して、同じ地物を探すことになります。

比較の分類は次のようになります。

  1. 元データと更新データの座標が合致している地物が無変更地物
  2. 元データと更新データの座標が一致しているが一部に異なるものがあるが訂正地物
  3. 元データにあって、更新データに同じものがない場合が削除地物
  4. 元データになくて、更新データあるものを追加地物

これで、属性以外の分類が出来そうに見えますが、実は困ったことが発生します。

どのような問題が起きるか、皆さんちょっと考えて見てください。

GIS-03-01.JPG

誤りは、次の場合に発生します。

元データにある地物が他の地物と交差していて、この形状を変えずに(変えても良いですが)位置を移動させた場合は、訂正データとしたいですね。しか し、元データから見れば、同じ座標が無くなっています。そして、更新データから見れば、元データにないデータが存在します。ということは、削除地物と追加 地物があると分類されます。

更に、変換による更新していない座標が動いているとすれば、無変更地物が訂正地物に変わってしまいます。

特に、追加地物は更新によって、新たに発生したと分類したいので、これは致命的な問題となります。座標だけですと、このような問題を解決できないように思います。

IDを利用した差分抽出

そこで,あまり一般的でないかもしれませんが、属性にユニークなID番号を付加して差分抽出を行うことにしました。また、差分抽出は、追加地物、訂正地物、削除地物、無変更地物の識別を行うために,ID附番の原則を次のとおりとしました。

  1. ID番号は地物単位にユニークな番号を付与する。
  2. ID番号は10桁で上2桁は西暦の更新年度の下2桁を示す。
  3. 追加地物のID番号は最終番号+1で附番する。また、属性に追加年月日を記録する。
  4. 削除地物のID番号は欠番とする。
  5. 訂正地物のID番号は変更せず,属性に訂正年月を記録する。

表は,差分抽出の処理および判定の関係を示したものです。

処理1 判定1 判定2 判定3

元データ

ID番号

更新データ

ID番号

1 1 同じID番号 座標、属性の差分抽出 無変更or訂正
2 2 同じID番号 座標、属性の差分抽出 無変更or訂正
3 欠番 削除地物
4 4 同じID番号 座標、属性の差分抽出 無変更or訂正
5 5 同じID番号 座標、属性の差分抽出 無変更or訂正
6 欠番 削除地物
7 7 同じID番号 座標、属性の差分抽出 無変更or訂正
... ... ... ... ...
31 31 同じID番号 座標、属性の差分抽出 無変更or訂正
32 32 同じID番号 座標、属性の差分抽出 無変更or訂正
なし 33 追加地物
なし 34 追加地物

このように、ID番号を附番することによって、元データと更新データの同じID番号は、同一地物ということができます。 処理1では,同じID番号が元データ、更新データの片方にしかない場合で、元データのみにある場合を削除地物、更新データのみにある場合を追加地物と判定 します。削除地物、追加地物はID番号のみで判定できますから、処理時間を短縮することができます。

処理2では、同じID番号が元データ、更新データの両方にあるものに対して、同じID番号の座標列および属性の比較を行って、元データと更新データ が異なる場合を訂正地物、同じ場合を無変更地物と判定することとしました。ID番号が元データと更新データの両方にある訂正地物または無変更の識別は、座 標の差が設定数値以上にある場合と属性が変更されている場合に訂正としました。

このツールは、ID番号の規則性によって判定しているので、ID番号の論理性が崩れてしまうと、信頼性に大きく影響すします。そこで、論理性の チェックは、ID番号の文字型、重複、異なるID番号の同一座標がないかについて検査をしています。 GISのデータにユニークなID番号を付けて分析することに、ID番号の品質上の問題から、疑義を唱える方もいらっしゃいますので、皆様もぜひ検討して見 てください。

加除訂正範囲の品質検査

更新データの品質検査は、ほとんどの場合、更新データ全体に対して行われています。しかし、更新データには、無変更地物が存在しており、この無変更 地物を除外する必要があります。完全性、論理一貫性の書式一貫性、概念一貫性、定義域一貫性は、加除訂正の範囲の検査で行います。しかし、位相一貫性の交 差は、他の地物との相対的関係を検査するものですから、その他の地物が無変更地物と交差する可能性があります。したがって、交差については、加除訂正した 追加、訂正地物が更新データ全体と交差していないかを検査する必要があります。

GIS-03-02.JPG

差分抽出ツールと、更新データ用品質検査ツールを使用することによって、作業領域の明確化と、作業範囲の品質検査を自動化出来ることが分かります。

私は、ある自治体の固定資産の更新データの受入品質検査を4年ほどさせていただいております。その間にデータを更新した作業機関は、4社あります。勿論、私は、差分抽出ツールと品質検査ツールを使って作業を行っています。その経験から得た課題は、次のようになります。

  1. 作業機関は、責任の範囲を元データに加除訂正した範囲であると認識しているが、更新したデータのどのデータを加除訂正したかを把握していない。また、加除訂正したデータを報告するという概念が全くない。
  2. 品質検査は、編集機のDISK上のデータで行い、納品物で行っていないので、座標変換誤差はチェエクしていない。また、指定されたフォーマットに変換する際に、オペレータの設定ミスがそのまま納品されてしまうことが多々ある。

実は、「座標が動いている」の項で申し上げた座標の移動の発見は、この差分抽出ツールで発見したものです。差分抽出ツールは、座標値の訂正と認識す るための移動量を設定することが出来るようになっています。通常は、元データに対して更新データが1cm以上の変化があるものを変更地物としていま す。(設定によって1mmにも出来ますが)

なお、今年度、地形図の更新の受入品質検査を行うことになっていりますので、その結果が出ましたら、報告出来るかもしれません。

また、差分抽出ツールの詳細については、私の論文「更新データの品質検査のための空間データのID番号を活用した差分抽出ツールの開発」を参照してください。この論文は、地理情報システム学会の方であれば、デジタルアーカイブをご覧ください。