Scribble at 2021-07-06 13:33:03 Last modified: unmodified

Show HN: RSS feeds for arbitrary websites using CSS selectors (vincenttunru.com)

再び RSS に注目が集まってきている。そういうことで、こういうアイデアも出てくるのだろう。でも、基本的に「しょーもない」としか言いようがないな。結局はサイトごとにセレクタとして使っている何の要素を抜き出せばいいかを定義しなくてはいけないからだ。こんな手作業をするのが面倒臭いからこそ、少なくともブログを運営しているなら RSS くらい配信しろというわけなのだ。でも、そういう画一的なフォーマットとか配信内容を人に強要すること自体がオンライン・コンテンツの爆発的な普及なり進展を阻害するものだと言われてきた。そういう強要は、しょせんバーナーズ・リーが WWW を初めて公開したときのように、インターネット通信の用途を共有する研究者どうしのルールとしてのみ強要できるのであって、無知無教養な人々や犯罪者も含めて、雑多な目的やスキルや知識や技術でネットを利用する人々へ何事かを強要できるものではない。

つまり、無いものをどこからか拾い集めるなら、それは単純に文字データとして機械的にやって、掻き集めたデータの何が「主題」に当たるのか、そして何が「本文」に相当するテキストなのかを、こちらで勝手に判定する他にないのだ。恐らく僕が思うには、究極の検索エンジンというのは、もうタグだの CSS セレクタだのマイクロフォーマットだのというマークアップの類は全て無視して、正味のテキスト、つまりペイロードだけを解析の対象とするようなエンジンなのだろう。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook