Scribble at 2023-12-22 10:57:27 Last modified: 2023-12-22 11:01:40
コンテンツが PDF や PS だけではなく(もう PostScript で出力してる人は殆どいないと思うが)、HTML でも提供されるという。これはありがたい。ぜひ東アジアの文化的後進国である日本とかいう国の官公庁サイトでも、ドキュメントを PDF ではなくテキストでも掲載してもらいたいものだ。あれって、結局は WORD から PDF に吐き出すくらいしか手間をかけてなくて、HTML にすると追加の手間がかかるからやらないんだろう。それは財政的には理解できるし、そういう実務を国家官僚に求めるのは浪費というものだが、そもそも WORD で文書をつくるからいけないのだ。テキスト・エディタで作れよ。フォントだの色だのなんて、ただの飾りだよ。偉い人には、それがわからんのだ。
ただ、フロー形式で論文が読みやすくなるのはいいけれど、書誌情報としてページ数を参照するときにどうすればいいんだろうかという懸念も 0.02 秒ほど脳裏に浮かんだけれど、そもそも arXiv は正式な(accepted された成果として研究業績に数えてよい)媒体ではなく、あくまでも preprint のサーバなのであるから、ページ数を記載する、つまり bibliography に arXiv のリソースを掲載して典拠表記すること自体が、本来はおかしなことであるという前提に立てば、ページ数など分からなくてもよいという理屈にはなるよな。
なお、ただいまサーバがメチャクチャに混んでて論文がダウンロードできない。あと、もう一つだけ懸念があるとすれば、これでもっと気軽にスクレイピングしやすくなったってことだ。