表記ゆれの影響受けず物件を特定できる「不動産共通ID」正式版が公開、国土交通省「不動産IDルール検討会」とも連携予定
コメント
注目のコメント
建物名をアルファベットで書くかカタカナで書くか、数字も漢数字・アラビア数字・ローマ数字・全角半角など様々なバリエーションが存在します。また、ポータルサイトで不動産業者も名寄せをされないように(同じ物件として他の不動産業者の情報とひとくくりにされないように)わざと工夫する例もあります。逆にこれが不動産のIT化を阻害していた要因の一つでした。
どれくらい大変かって、名寄せをニューラルネットワークで解くというのが今年の国際会議論文になるほどです。手前味噌で恐縮ですが、アットホームラボのみなさんと共著で発表した論文です。
Youiti Kado, Takashi Hirokata, Koji Matsumura, Xueting Wang, and Toshihiko Yamasaki, Entity Resolution of Japanese Apartment Property Information Using Neural Networks, IEEE 4th International Conference on Multimedia Information Processing and Retrieval (MIPR), Special Session: Multimedia for RETech 2021: Innovations of Housing and Real Estate Industries, pp. 277-282, 2021.