Scribble at 2023-12-22 10:57:27 Last modified: 2023-12-22 11:01:40

添付画像

arXiv’s goal is equitable access to scientific research for all – and to achieve this, we have been working to make research papers more accessible for arXiv users with disabilities. We are happy to announce that as of Monday, December 18th, arXiv is now generating an HTML formatted version of all papers submitted in TeX/LaTeX (as long as papers were submitted on or after December 1st, 2023 and HTML conversion is successful – more on this below).

Accessibility update: arXiv now offers papers in HTML format

コンテンツが PDF や PS だけではなく(もう PostScript で出力してる人は殆どいないと思うが)、HTML でも提供されるという。これはありがたい。ぜひ東アジアの文化的後進国である日本とかいう国の官公庁サイトでも、ドキュメントを PDF ではなくテキストでも掲載してもらいたいものだ。あれって、結局は WORD から PDF に吐き出すくらいしか手間をかけてなくて、HTML にすると追加の手間がかかるからやらないんだろう。それは財政的には理解できるし、そういう実務を国家官僚に求めるのは浪費というものだが、そもそも WORD で文書をつくるからいけないのだ。テキスト・エディタで作れよ。フォントだの色だのなんて、ただの飾りだよ。偉い人には、それがわからんのだ。

ただ、フロー形式で論文が読みやすくなるのはいいけれど、書誌情報としてページ数を参照するときにどうすればいいんだろうかという懸念も 0.02 秒ほど脳裏に浮かんだけれど、そもそも arXiv は正式な(accepted された成果として研究業績に数えてよい)媒体ではなく、あくまでも preprint のサーバなのであるから、ページ数を記載する、つまり bibliography に arXiv のリソースを掲載して典拠表記すること自体が、本来はおかしなことであるという前提に立てば、ページ数など分からなくてもよいという理屈にはなるよな。

なお、ただいまサーバがメチャクチャに混んでて論文がダウンロードできない。あと、もう一つだけ懸念があるとすれば、これでもっと気軽にスクレイピングしやすくなったってことだ。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook