Monazilla/develop/access

提供:5ちゃんねるwiki
ナビゲーションに移動 検索に移動


最新情報

Monazilla/develop#最新情報 をご覧ください。

サーバへのアクセス

サーバへのアクセス、ファイルの取得に関する説明。
HTTPに関する一般的な説明は省略します。

リクエスト

User-Agent

Monazilla/1.00 (ブラウザ名/バージョン)
という形式を強く推奨します。
一時期においてMonazillaのUser-Agentのみがdat読みを許されるなど、User-Agentによって処理を変える事があり、未知のUser-Agentでは、2ch(その他掲示板サイト)による突然の仕様変更に対応できないことがあります。

なお、2ちゃんねるビューア(●)の使用時には、これとは別に指定がありますので、それに従ってください。

Accept-Encoding

gzipの対応を強く推奨します。
転送量が問題になった時から、2chブラウザはgzipで圧縮されたものを受け取れるようにするべきだ、という意見があります。
HTTPリクエストにAccept-Encoding: gzipを加えると、サーバが圧縮転送に対応していれば、圧縮されたデータが送られてきます。
解凍する手間はかかりますが、できるだけ対応させてください。
ただし、差分取得時には使えません。

転送量問題が一段落したあと、圧縮の際のサーバ負荷も考慮すべきだ、という意見も出ました。
しかしこれは、サーバ側で圧縮の可否を設定できますので、サイト管理人が優先順位を決めて対応すべき事です。
クライアント側は、どちらにも対応できるようにしておけば良いでしょう。

If-Modified-Since

前回のアクセス時のレスポンスにあった#Last-Modifiedの値を付けましょう。
更新が無い時に、無駄にデータ転送を行う事を防ぎます。

datの差分取得時には、ほぼ必須となります。
詳細は#Rangeの項にて。

Range

差分取得を行う時に必要です。
既得サイズが1000バイトとするなら、
bytes=1000-
とすることで、新たに追加された部分だけを取得できます。

この時、追加されたデータが無かった場合、部分取得失敗の#ステータスコード416が返ってきます。
この416は、レス削除等でdatファイルが既得分より小さくなっていた場合にも出るので、両者の区別が付きません。
そこで、#If-Modified-Sinceを使用すると、更新が無い時は304、更新があって小さくなっている時(レス削除等)は416、と区別できるようになります。
ただし、削除があっても、datサイズが既得分より小さくならない場合は、HTTPとしては部分取得成功の206となり、416にはならないので注意してください。

削除を検出する方法としては、(先の例で)bytes=999-として、前1バイトを余分に取る方法もあります。
datは1行1レスですので、既得分の最後の1バイトをもう一度取得し、それが改行コード以外なら、レス削除などでdatに変更が加えられたと判定するものです。
(サイズが変わった後も、偶然に改行コードになってしまう事があるのは諦めましょう。)
なお、この場合でも、#If-Modified-Sinceを用いていて更新が無い時は、1バイトのデータ転送もありません。
ただ、更新時には通常より毎回1バイト多く転送が行われるので、通常の取得データからの検証が行える場合には、そちらの方法を選択した方が良いでしょう。

レスポンス

ステータスコード

2chでは、ファイルが無い時は大抵302になります。
ただし、404等になることが絶対にないわけではありません。 また、他のサイトも含めれば一様ではないでしょう。 決め撃ちは避け、HTTP一般の仕様に沿うようにした方が良いでしょう。

Last-Modified

ファイルの更新日時です。
#If-Modified-Since#Rangeの項で説明しているように、できるだけ対応してください。

Content-Encoding

データがgzip圧縮されている時にgzipが付きます。
#Accept-Encodingの項で説明しているように、できるだけ対応してください。

Transfer-Encoding

HTML化された過去ログではchunkedになることがあります。
対応しておきましょう。