htaccess一覧

検索ロボット

 「ボット」と称する検索サイトから派遣されてくるデータ収集の自動アクセスがあります。これは自サイトを公開している以上、多くの人に見てもらうためにはいろいろなキーワード検索で「なかのさんち」が引っかかってくれたほうがいいわけですから、嫌うわけにはいきません。

 アクセス解析ツールなどはこの正規のボットはちゃんと解析から外すような設定があります。一日程度「ボットを無視しない設定」にして試してみると想像以上のアクセスがあって驚きます。常に「無視する」設定にしておけば気になりません。

 たまに「正規じゃない」とは言わないのかな、大手じゃないというのか、解析ツールが想定してないボットが来ると解析に引っかかりますが、まあたまになのでこれもいいです。

 最近になって変なことに気がつきました。うちは日本語しかサポートしてませんので、アクセスはほとんど日本からだけ、のはずです(UKユナイテッドキングダムもあるけど、それはわかってるから別)。さらに、Internet Explorer6の場合はバナーを出したりして注意を促してるのに、連日一日何回もInternet Explorer6でアクセスしてきます。解析ツールの設定で国旗を出せるのに気がついて出してみたんですけど、アクセス元が米国なんですよ。こりゃ変だおかしいとチェックしてみました。

 [aguse] ←ご存じかしら。危なそうなサイトを見に行く前に、必ずそこ経由でチェックしてから行くのが無難です。url だけでなく、ip でもチェックできます。知らなかった方、お気に入りにでも入れて活用してください。

 そこでチェックしたら、その変なアクセスはトレンドマイクロからでした。でも、そういうアクセスは普通はブラウザとかOSとか出ないんですけど、ここのは Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1 と普通に WinXP(NT5.1)で IE6 を使ってのアクセスってことになってる。

 情報を得ようと検索してみました。

 ヲレサイト(トレンドマイクロのボットがウザい件) に詳しく書いてありました。そこに書いてあることにほぼ同感です。詐称せずにボット名さえきちんと名乗ってくれれば、robots.txt で弾くのではなく、解析から外すだけの処理で私は我慢しますのに。でもいまのアクセスのされ方では .htaccess で弾いてしまうしかありません。うちは危ないサイトじゃないですからそれでいいでしょうけど、危ないサイトはこういうのにもっと敏感ですから、おそらくとっくに弾いちゃってると思います。つまり、トレンドマイクロのやりかたは何の役にも立たない可能性が高い。危ないとこの調査は出来ず、危なくないところからはうざがられるだけの拙策。

 ヲレサイトに載っていた4種のipに加え、うちにはもう一カ所(もちろんトレンドマイクロです)から来てたのでそれも加えて5種にしてアク禁の刑に処しました。これによって他のアクセスに影響はないと思いますが、影響がありそうな気配を感じたらまた元に戻します。

order allow,deny
allow from all
deny from 150.70.0.0/16
deny from 66.180.80.0/20
deny from 66.35.255.0/24
deny from 128.241.0.0/16
deny from 216.104.15.0/19


お節介な Internet Explorer

 http://nbbs.jp/ に飛んだとき、このブログページにリダイレクトする設定はできました。ルートにある index にリダイレクト構文を書くのではなく、ルートの上にある [.heaccess] での設定です。

 通過させたいディレクトリの下位に飛ばし先のディレクトリがあると設定に気を遣わないといけないというのを忘れていて、あやうく無限ループに入る設定にしてしまうところでした。

 前回リダイレクトでエラーになったと書いたのは、実はこのせいではなくて、構文を書き間違えたからなんですが、もし書き間違えてなければ無限ループになってた可能性があります。エラーになってくれたおかげで気がつき、一瞬、ヒヤッと青くなりました。万事塞翁が馬、ですね。

 つまり [.htaccess] を使うと、http://nbbs.jp/ から http://nbbs.jp/blog/ にはリダイレクトできないのです。

 正しくはディレクトリではなくファイル名まで指定すること。http://nbbs.jp/ ではルートに index.shtml を置いていますから、http://nbbs.jp/index.shtml に飛んできたらブログに飛ばす、とすればOK。で、そう設定してうまく行ってます。ん?そうか、ファイル名無しだと index.~ とみなす設定なんだから、省略しても無限ループにはなりそうにないな。でも試さない(^_^;)

 さて、「お節介な Internet Explorer」とたいそうなタイトルをつけましたが、本筋のリダイレクト問題とは余り関係なかったです(^_^;)

 うちでは、File Not Found エラー(404)などいくつかのエラーをリダイレクトして独自ファイルを表示するようにしてあります。

 これを設定した頃は Internet Explorerは4くらいだったかしら。当時は自分も Internet Explorerだったし、ちゃんと機能していたのは確かめてます。冬眠から目覚めたここ最近も FireFox と Chrome では機能しているのを確かめてました。でも Internet Explorerでの再確認まではしてなかった。

 ブログに飛ばすリダイレクト設定をやり直したところで、Internet Explorerでも確認し、ついでにエラー表示も...あら? 見せたいファイルが出なくて Internet Explorerが持つエラー画面が出ちゃう。

 調べたら、 カスタマイズしたWebエラー・メッセージが表示されないブラウザがある とかあったんだけど、ファイルサイズは1kもあるし、出るはずなんだよね。クライアント側で対処するなんてのは本末転倒な話しだし、しばらくまた悩まないといけなさそうだ。

結局 .htacess でのリダイレクトはやめました。それだと http://nbbs.jp/ にアクセスしてきた人は知らない間に /blog/ に飛ばされてしまいます。引っ越しなどでしたらいいかもしれませんが、http://nbbs.jp/ はまだ残っている(活きている)わけで、いつまた活用しだすかわかりません。ここはアクセス者に明示的に /blog/ へ飛ぶんだとしたほうが良さそうに思い、ルートの index 内に以下のようにオーソドックスなMETAタグを記述する方法に戻しました。

<META HTTP-EQUIV=”Refresh” CONTENT=”5; URL=http://nbbs.jp/blog/” />

2009/10/08 加筆修正