Scribble at 2022-02-15 16:46:03 Last modified: 2022-02-15 16:58:46

オンラインのリソースとは言っても、それだけで三つのタイプがあることは既に多くの方々にとって周知のことだろう。第一に、visible / surface と呼ばれるウェブ・リソースの「層」があるとされていて、僕はこうした検索エンジンによるインデックスが可能かどうかという基準でものごとを分類することには必ずしも同意できないのだが、ひとまずここでは容認しておこう。すると、次に deep と呼ばれる層があり、そして最後に dark の層があるとされる。ここでは、これら三つの「層」についての誤解があるようなので、それぞれについて補足しておきたい。

surface web は既に Google や Bing によってインデックスされていて検索可能なコンテンツではあるけれど、それに誰でもいつでもアクセス可能だという保証もなければ、今後も存続し続けるという保証もない。そして、この surface web に該当する、僕らがふだん「ググって」探すウェブ・ページなんてものは、実はオンラインに存在しているリソースの1割ていどでしかないという推定もある。

次の deep web は、「まだインデックスされていない」というだけの意味でしかないコンテンツも多いため、これからインデックスされて surface という扱いになる可能性もあるし、偶発的な事情でコンテンツの提供者が意図せずに検索側へコンテンツがインデックスされてしまう場合もあろう。たとえば、Google Drive に保管している大切なファイルを間違って誰でもアクセスできる権限で誰かと共有してしまい、URL をメールに記載したとか、どこかの掲示板やブログ記事のコメントに貼り付けたといった事情で、検索エンジンにインデックスされてしまうことがある。また、ウェブの制作業界でもテスト用のコンテンツや公開前のコンテンツにベーシック認証という室町時代のセキュリティ対策を施して、コンテンツを保護した気分になっている場合も多々ある(僕も、これは室町時代同然の人々に合わせて活用しているところだ)。しかし、クライアントによっては ID とパスワードを入力するのが面倒臭いという理由で、URL に ID とパスワードを記載できるというベーシック認証の(本来は脆弱性と言うべき)特徴を活用して、

"https://ユーザ名:パスワード@markupdancing.net/himitsu/sukebe.html"

といった URL を提供して、クライアントと呼ばれている原始人(もちろん一部の腑抜けと言うべき者だけだが)にサービスを提供していたりする場合もある。もちろん、そういう URL を丸裸で使っていれば、メールに認証情報付きの URL を書いてしまう人もいれば、保護された領域に含まれる外部リンクをやみくもにクリックして、外部のサーバへ Referer をプレゼントしてしまう困ったちゃんもいるわけだ。こうして、本来は deep web のコンテンツが surface web のコンテンツになってしまう。

最後に dark web だが、これは意図的にインデックスされないように組み上げているため、もちろん認証情報があろうとなかろうと掲示板に URL を貼り付けるバカを想定している。よって、HTTP や ssh を処理するポート番号をサーバにおいて 8888 とか 8080 などとテスト用に変更する人もいるが、あんなものは子供騙しでしかないことがわかるだろう。ssh でも 22 番のポート番号を 2222 とかに変更して「セキュリティ対策」などと称している馬鹿がいるけれど、ふつう侵入したいサーバを相手にするときは、可能なだけのポートに対して応答ステータスを調べるものだ。そして、この手の「セキュリティ対策」が本当の対策だと信じている愚かな連中に限って、そういうウェブ・ページに書かれている「2222 番に変更しよう」というアドバイスを読めば、昆虫のように 2222 番へと変更するだけなので、変更したポート番号など小学生でも立ちどころに見つけてしまうわけだ。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook