2018年04月06日に初出の投稿

Last modified: 2018-04-06

あまり普及しているとは言い難いが、何年か前から自分のサイトだけではなく自社で僕が構築してきたウェブサイトには Schema.org のメタデータを付けるようにしている。もう既に semantic web などという言葉は死語に近くなってしまったし、機械学習を本当に理解しているとは言い難い大半の人々は、Google や Microsoft が勝手に自分のコンテンツを「ええあんばい」で扱ってくれると呑気に考えているらしいが、まだ検索の品質など大したことはないし、そもそも Google や Microsoft がコンテンツを公正にパースしたり検索結果を馬鹿正直に表示する筈だと、ボーイスカウトのような純朴さで期待する方がどうかしている。自分たちでメタデータを操作して、彼らの処理を逆手に取れるなら、それに越したことはない。"SEO" とは、インチキ業者であれなかれ、本質的には自社の目的にとって検索結果を最適化するということであって、検索エンジン企業の思惑に乗っかることではないだろう。

個人データの扱いにも言えることだが、このような自己コントロールというアプローチを簡単に諦めてしまう人々というのは、何も単純に勉強や調べものや自分でコーディングしたり内容を管理するのが嫌いで面倒だというだけではなく、そういうことまで自分でコントロールするのは無理だという、テクノロジーとプレゼンスのコントロールに関する圧倒的な差についての諦観という思想が根っこあるのだと思う。そういうセンチメンタリズムや敗北の美学は日本人の多くが好むところであり、SF に出てくるような、唯々諾々と機械や権力に従う部品のような無機質な人間の典型として描かれる。そして、何かよくわからないきっかけで、バンザイ突撃したりハラキリするわけだ。しかし、こういう連中はクレイジーでしかない。なぜなら、そんなことは少なくとも僕が「日本人」だと言い得る限りですら、日本の伝統でも何でもないからだ。寧ろ、日本の伝統とは、そういうキチガイじみたことを平気でやる安易な諦観とか命の軽視という発想ではないのか。

Schema.org から酷く話が飛んでしまったが、これが普及しない一つの理由として、schema.org で公開されている仕様の分かり難さが大きいと思う。簡単に言うと、各ノードでどういう値が取れるのか直観的に分からない。例えば、"schema.org/areaServed" というノードは企業や店舗がサービスを展開する地理上の領域だと定義されている。そして、その値としてとりうるのが "AdministrativeArea" とか "GeoShape" とか "Place" とか "Text" だという。"Text" なら、「大阪府」のようなマルチバイト文字でもいいと思えるが、これは本当にデータベースのデータ型のような種別なのかというと、恐らくは schema.org での種別なのだろうから、"Text" とは何なのかを調べなくてはいけない。そこで、Text がなんなのかをさらに調べると・・・"schema.org/Text" には夥しい種類の別のカテゴリー名が並ぶ。そして、"Text" の属性として "text" を記入でき、"text" が何であるかを調べると、再び "schema.org/Text" に戻る・・・これの繰り返しだ。

これは、世の中に存在する「もの」とか「こと」をカテゴリーなり属性によって区別しようという semantic な処理をする際には、恐らく避けて通れない問題なのだろうとは思う。しかし、areaServed の子ノードに Text を配置して、その属性値に text を加えるといった面倒臭いことをやる人がいるわけないように、結局は使ってみて慣れてきた人間が「それなりの粒度」で解説するしかないのだろう。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Google+ Twitter Facebook