Scribble at 2020-09-14 10:42:01 Last modified: 2020-09-14 11:07:57

詳しくは書かないが、このサイトの Notes をそのままウェブ・スクレイピングして自分のブログに掲載しているやつがいて、597262.xyz みたいなサイトを始めとしていくつか発見している。色々なサイトから盗んできているため、MD のコンテンツばかりではないから、よほど検索でうまくヒットしないと分からないのだが、一定の機械的な処理をして検索すれば、こんな盗用サイトはすぐに発見できる。この手のサイトをばら撒いてる奴が本当にクズだと思うのは、まず女性の名前でサイトを運営してたら手加減してもらえるとでも思っているかのようなパターンが非常に多いということだ。Facebook でヘイトをばら撒いてる人々でも、実際には女性でもなんでもないのに女性を装っているパターンが見受けられるのは、そういう事情があるからだろう。そして、上記のようなサイトではすぐにわかることだが、オリジナルの文章に追加した文章が日本語として成立していないため、おそらくは日本人が作っているサイトではないと思う。これは英語でも同じようなガラクタがウェブに膨大な数で作られていて、同じく出鱈目な英語が書かれてある。コンテンツに何の興味もない連中が公開している明白な証拠だ。

ウェブ・スクレイピングという手法は、例の岡崎市図書館事件を初めとして幾つかの事案で知られるようになったわけだが、僕はプログラムを使った自動処理について、設定によっては、たとえ素人が実装して動かしたとしても責任能力を否定するべきでないのはもちろん、可罰的違法性の棄却もすべきではないだろうと思う。ちなみに、僕はスクレイピングという手法を原則として何でも違法性があると言いたいわけではない。僕も実際に PHILSCI.INFO で学会のサイトに対して更新情報を得るためにスクレイピング処理として一定時間ごとにページへアクセスしている。

よく、こういうことを厳しく規制するとイノベーションがどうとかクリエーティブがどうとか、とにかくプログラマや開発者が委縮するという、実は何の根拠もない憶測で反対する人がいるのだが、規制には現実的な牽制力があり、そして現実に被害を受けた側を救済する力がある。ウェブ・スクレイピングをすると訴えると多くのサイトが公表することで、ウェブ・スクレイピングを控える人が増えたとして、それで何の可能性が阻害されることになるのかと思う。実際は、上記で紹介したような SEO の分野で violation of distributions と呼ばれるコピー・サイトでページ・ランクを故意に引き上げたり、検索サイトでヒットしてアクセスしてくる人にウイルスを感染させるような手合いが減るだけのことだろう。確かに、Google も DDG もスクレイピングによってインデックスしているのだから、社会的な意義もあると言えばある。企業がやっているから許されて、個人はやるなという道理は通用しないだろう。しかし、それも規制の対象とするべき限度や基準があってこそだ。Google でも一つのサイトへ1時間おきにボットをアクセスさせているくらいの調節をしており、仮に個人や企業が任意にスクレイピングして秒間に何回ものアクセスをサーバが処理しなくてはならなくなれば、それこそ処理に対応できるスペックに増強するためのコストを、少なくとも民事の事案として誰かに請求するのが当然であろう。

もちろん、為政者の側から国民に責任を問うということに警戒するのは分かる。警察の雑な捜査や企業の顧問弁護士によるスラップ訴訟などによって、僕らの活動が委縮するという事例は、なるほど色々あることだろう。しかし、責任を負うということについて安易に反抗したり否定することは、これもまた一つの雑な態度というものであろう。もし、日曜プログラマが他人のサーバを落としても責任能力が問われないということなら、要するにプログラマという人間は社会人としての責任能力に欠ける、自分が書いて動かす処理の効率や成果しか考えないキモオタだという差別を助長することになるのではないか。あいつらはイノベーションのためなら他人のコンテンツを平気でコピーするというわけだ。そう蔑まれても、結果として自分たちが上場して大金を手にすれば見返せるとでも思っているなら、それは東映のヤクザ映画で描かれるチンピラの立身出世物語をなぞっているだけにすぎまい。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook