編集は頑張らない by おやつ

2026/02/10

ツンデレ

Googleカレンダー公式の「祝日」が祝日以外も表示するのうざかったから国立天文台のをインポートした。ごきげんよう。

今年も性懲りもなくRSSの話ですが。<おまえの日記だよ?
生成ツールを調べている際に偶然見つけたのが、ウェブサイトのサイトマップを利用するという話です。
サイト内のページのリストですから、追加されたページを捕捉できる可能性があります。
なるほど、その発想はなかったと思って。

しかし設置義務はありませんし、今もどれだけ使われているのやら。
と思ってドメイン名の後ろに /sitemap.xml と入力してみると…、意外とあります。
調査したサイトの何割かで設置されていました。
非アクティブなものを除けば更新情報が取得できそうです。
基本的にクローラー向けに公開しているファイルですから、アクセス条件や利用制限がないのも大きいところ。

書式もXMLに則っているので解析しやすいですし。
さらに、サイトによりますが各ページのタイムスタンプが更新されることもあり、新規ページだけでなくページの変更も捕捉できます。
さらにさらに~(ぉ)、一部ですが各ページの画像URLが記載されているものもあり、メタデータを取得することなくページの内容を判断する手助けになります。

といううはー夢がひろがりんぐな世界ですけども。
二つほど注意点があって、一つはファイルサイズが大きく読み込みに時間がかかる場合があること。
もう一つは、実際のページが更新されてからサイトマップに反映されるまでタイムラグがあること。
後者はいち早く百合情報を仕入れたい自分には問題です。<百合とかいいから!

つってもそこはRSSも同じというか、結局サイトによりけりなんですけども。
全面的に切り替えるのではなく使い分けが重要なのかなと。

関連記事

あまくだry: 漢字をひらく (2)

このブログを検索

ソーシャル/購読

X  Threads  note

RSS Feedly Inoreader

Threads

ブログ アーカイブ

他の年を表示する