「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに
コメント
選択しているユーザー
注目のコメント
今回の件は日本の住所の難しさの一例でしかありませんが、それ以外にもとっても問題になるのが建物の名寄せ問題です。
例えば、下記は私が勝手に作り出した物件例ですが、単なる文字列処理では同一のものとみなされません。
・サンライズ1
・サンライズ1
・サンライズI
・サンライズI
・サンライズ一
・サンライズ1号棟
・Sunrise +上記
・サンライズ+上記
・どこかにスペースやハイフンがはいったもの
正式名称を調べて入れればいいだけではと思われるかもしれませんが、不動産ポータルで同じ物件はひとまとめにして表示されるということがあるため、登録する不動産業者があえて「ずらして」掲載するということもあると聞いています。
そのため、下記のガイドラインに大変期待を寄せています。
「不動産ID」導入へ 国交省が検討会 今年度中にガイドライン
https://newspicks.com/news/621364620年前にスクリプト組んでハマった悪夢がよみがえりました。もう緯度経度でいいじゃないかと思いました。
真面目な話をすると、住所というのは個人識別にはそもそも向いてません。引っ越しますし、地番整理で変わることもあります。同姓同名や結婚で性が変わる等、個人4情報はある瞬間は一意なのですが、継続性がありません。だからマイナンバーが必要です。
マイナンバーが無いことで、システム関係者の莫大な時間が失われてきました。システム予算だって何千億円無駄に費やしたかもしれません。それくらい大きな問題であることを多くの人に知って欲しいです。
もう一つ異体字という40年来の未解決課題があります。文字コード問題含め、闇が深過ぎて語れません、、。田井さんのリンク記事を読むと恐ろしさがわかります。こんな面倒なことこそAIに解決策を出させてみたらどうでしょう。人間より短時間に最適解を出せるのではないでしょうか。