本文へ

 

空間データの品質

完全性検査でエラーがあるか否かの判定を行うためには、その前提条件として、エラー(誤差)とは何かを明確にしておかなければなりません。しかし、JPGISでも適合水準、全数検査又は抜取検査等の定義はありますが、残念ながらこのエラーの定義がはっきりしておりません。

そこで、ここでは、エラーの定義の必要性と、現状の検査の課題を提起させていただき、課題解決に対する提案をさせていただきます。

完全性のエラーとは

完全性の検査は、漏れと過剰について検査することになっています。 漏れとは、原典資料にあるものが、空間データ(成果物)に“ない”ことです。また、過剰はとは、原典資料にないものが、空間データ(成果物)に“ある”こ とです。では、漏れと過剰が“ある”“ない” (ここでは“ある”を“良”とし、“ない”を“否”とし、判定することを良否の判定とします)は、どのような状態をいうのでしょうか。完全性を考える場合 に、図形を対象とする場合と、属性も対象とする場合がありますが、ここでは、図形を対象とした場合に限定してお話を進めます。

GIS-06-01.jpg

上記の表は、黒線は、原典資料の図形又は画像とし、赤線を作成した空間データで示しています。原典資料と空間データが交差又は重なっている図形 1,3,6,7については、どなたも“良”と判定するでしょう。また、4,5,9,10は相手側にないので“否”と考えるでしょう。しかし、2,8は意見 が分かれるものと思われます。

同じ地物の形状を重視すると“良”なりますし、原典資料との距離を重視すると“否”となります。従って、形状を重視している方は、漏れが2で過剰が2となります。一方、距離を重視している方は、漏れが4で過剰が4ということになります。

このように、“良”“否”は、何を持って良否の判定するかによって判定結果が大きく変わることになることをご理解いただきたいと考えます。

もう一度、図を見ると、ポリゴンの図形1〜5を見ると、図形1〜3の形状が同じで、いずれも位置ずれを起こしており、位置ずれの大きさで判断が分かれてい ます。(図形4は原典にあって、空間データにないもので、図形5は原典になく、空間データにあるものですから、議論の余地はないと思います。)

次にラインの図形6〜10を見ると、図形6〜8は形状が同じで、いずれも位置ずれを起こしており、位置ずれの大きさで判断が分かれるのではないでしょうか。

このように考えると、形状を重視する方でも1km先に同じものがあるからと言って“良”とは言わないでしょうから、完全性の良否の判定は、形状と位置ずれ の距離によって判断しているのではないかと考えております。この良否の判定の値がばらばらであれば、この完全性の評価を一定の水準を保つことはできません。

では、この位置ずれが、どの程度の範囲にあることが“良”の判定となり、位置ずれがどの程度の範囲であれば、“否”の判定とすべきでしょうか。筆者は、こ の良否の判定の距離の値は、空間データが要求する位置正確度が良いのではないかと考えています。その理由として、位置正確度の範囲を超えた値でも、完全性 の判定を“良”とした場合に、完全性では良いが、位置正確度を越えても良いことになり、矛盾していると考えるからです。皆様はいかがお考えでしょうか。

いずれにしても、昨今、計画機関の単位が市町村から、基盤図データのように市町村単位で空間デーを元に全国のデータを作成するようになってきました。従っ て、良否の判定の値を統一しておかないと、完全性の検査結果が合格であっても、その中身の判定基準が全く異なり、良否の判定そのものが意味をなさなくなる 危険性があると考えています。そこに、エラー定義の必要性を提起する理由があります。

完全性の検査地物の範囲

製品仕様書等を見ても、どの地物を検査するかを定義していないことが見受けられます。また、地形図の場合、建物、道路に限定して検査していることが 数多く見受けられます。空間データは、利用者にとって、その目的によって注目する地物が異なります。従って、完全性の検査は、全ての地物に対して行うべき であると考えています。

幾つかの計画機関、作業機関、検査機関に、完全性の地物を建物や道路に限定する理由について質問したところ、検査にかかる費用が高くなるので限定している と回答しています。これは、本末転倒で、整備をいかに安くするかを考えて整備方法を検討し、また、検査をいかに安く行う検査方法を検討することが必要と考 えております。すなわち優先すべきは、検査地物の限定ではなく、検査の自動化検討等によるコストダウンが先であると考えています。完全性の検査がほとんど 目視の現状を考えると、コストダウンのための自動化の必要性を感じますが、皆様はいかがお考えでしょうか。

検査の信頼性

検査結果の信頼性は、抽出方法の適正化と再現性だと考えています。

(1) 抽出方法の適正化

JPGISでは、無作為抽出又は有意抽出の中から抜取方法を選択する、となっています。有意抽出とは、典型的又は標準的サンプルを抽出することを指しますが、空間データでは、標準的なサンプルを抽出することは難しいので、無作為抽出に絞って良いと考えます。

第4回の「計画機関の発注時における品質要件の記載状況と課題」の「作業機関が検査図郭を検査機関に持って行くことが問題か」の項で、計画機関が作業機関 に検査図郭を伝え、その図郭を作業機関が第三者機関に検査図郭を提出している現状は、無作為抽出以前の問題として、作業機関が検査図郭を提出に当たり、再 度、社内検査によってエラーを修正する可能性があり、望ましい方法とはいえません。また、第三者機関も提出された図郭の品質検査の品質を保証しています が、整備更新全体の品質を保証していません。そこで、計画機関の指示に基づき作業機関は、第三者機関に整備更新の全データと、検査比率を提示する。第三者 機関は、整備更新の全データの中から指定された検査比率を無作為に抽出して、全体の品質保証をするように改めるべきであると考えます。

(2) 結果の再現性

検査結果を再現できないならば、その検査結果は信用することができません。 検査結果を再現するためには、検査した地物と、その良否判定の結果の記録が必要となります。この記録がないと検査結果の再現できません。

現状の完全性の抜取検査の方法は、ほとんどが目視で行われています。そして、検査結果のエラーリストは作成していますが、検査して良とした地物の記 録がないのが一般的になっています。目視は、どうしても個人誤差と誤りが発生することを前提に考える必要があります。しかし、検査して良とした地物の記録 がないと、母集団の分母の地物と数が特定できません。従って、再現性を確保するためにも、抜取りの分母の根拠を示すためにも抜取検査した地物と、その合否 判定結果の証拠として残すことは、絶対条件であると考えています。

筆者が提案する完全性の検査方法

完全性の検査は、原典資料と成果物である空間データを見比べて目視で判断しています。しかし、品質管理のコストは、計画機関、作業機関、第三者機関 にとっても、検査の正確を期そうとすればするほど高くなり、整備更新費を圧迫してしまいます。従って、できるだけ、省力化、自動化を図る必要があります。 そこで、筆者は、完全性の検査システムは次のようにしています。

(1) 原典資料と空間データの重ね表示

原典資料は、写真、アナログ図面、デジタルデータの3種類があります。そこで、完全性の検査は、原典資料に対して作成された空間データが一致してい るかを検査するものですから、デジタルデータを除く写真、アナログ図面は、ラスターデータに変換して比較する空間データと重ねて表示できるようにします。 最近では、航空写真測量で得られた写真でオルソ画像を作成する計画機関が多くなっていますので、このオルソ画像と空間データを重ねて表示します。もし、オ ルソ画像がない場合には、デジタル図化機で重ね表示を行うことによって、同様の作業ができると考えています。

(2) 検査地物の無作為抽出

完全性の検査は、ほとんどの場合、抜取検査ですから、無作為に検査する地物を抽出する必要があります。そこで、システムは、各地物の総数からランダム関数を発生させて指定された抜取の指定比率を検査地物として抽出します。

(3) 過剰検査と再現性

上記で抽出した地物を1番目から表示します。表示されている原典資料と空間データを目視で合否判定の数値以内か、以上か、によってOK、NOを判断 して、Y又はNのキーを入力します。この結果は表示された地物の属性にY又はNが記録されます。リターンで次の地物が表示され作業を繰り返します。検査 後、過剰のリストを作成し地物ごとに地物のID番号 (データベースに地物ごとに付けたユニークな番号) とY,Nの結果と、その集計によって合否の判定が行われます。データベースには、抜取検査を行った漏れ、過剰、YN等が記録されていますので、いつでも再 現ができます。

(4) 漏れ検査と再現性

漏れは、成果物である空間データに地物がなくて、原典資料にあるものですから、過剰と同じようにはできません。そこで、ランダム関数を発生させて指 定された抜取比率を検査地物として特定させ、その地物を中心に指定した領域を表示させます。その領域の中にある検査する地物の漏れがないかを目視で検査し ます。その領域に該当する地物がない場合には、スキップさせます。スキップした領域は、更にランダム関数で検査領域を追加します。

漏れがない場合は、Y、ある場合はNとキーで入力します。但し、漏れがあった場合には、空間データにデータがないので、座標とNが記録されます。ま た、漏れが複数個あった場合には2N,又は3N,又は4N等とします。この結果は表示された地物の属性にY又はNが記録されます。リターンで次の領域が表 示され作業を繰り返します。検査後、過剰のリストを作成し地物ごとに、地物のID番号とY,N(Nの場合はIDがないので座標を記入)と、その集計によっ て合否の判定が行われます。データベースには、抜取検査を行った漏れ、過剰、Y,N等が記録されていますので、いつでも再現ができます。

(5) 原典資料がデジタルデータの検査と再現性

原典資料がDMデータのようなデジタル情報の場合は、第2回目で述べた「差分抽出プログラム」を利用して、全数の原典資料に対して、座標及び属性の 追加(過剰)、削除(漏れ)、座標の訂正を抽出することができます。座標の訂正については、訂正と判断する距離を自由に設定できるようにしています。同様 にデータベースには、抜取検査を行った漏れ、過剰、Y、N、距離等が記録されていますので、いつでも再現ができます。

おわりに

空間データを公共測量の測量成果とするためには、空間データの第三者機関の品質検査を含めて品質を確保することを求めています。しかし、作業規程の 準則やJPGISを見ても、完全性の漏れ、過剰を判定するエラーの定義が明確に規定されていません。このため、品質検査の結果が合格であっても、不合格で あっても、その根拠があいまいなものとなっています。識者には、エラーの調査と分類等の基礎研究を経て、エラーの定義を定めることを期待したいものです。

計画機関、作業機関、第三者機関にとっても、品質検査を厳密に行おうとすれば、するほど品質検査に係る費用が大きくなっています。品質検査は論理検 査を除いて、多くは、目視検査に頼っています。そこで、品質検査費用を削減と、より厳密な検査を目的とした完全性の品質検査の自動化の研究を推進すること を期待したいものです。