アクセス制御方法について
robots.txtファイルの使用例
| 例1. 全ての内容に対し、全ての検索エンジンを禁止 | user-agent: * disallow: / |
| 例2. 全ての検索エンジンを許可(もしくは空ファイルを作成) | user-agent: * disallow: |
| 例3. 特定の検索エンジンを禁止(ロボット名「badbot」の場合) | user-agent: badbot disallow: / |
| 例4. 全ての内容に対し、Baidu.jpからの全検索エンジンを禁止 | user-agent: Baiduspider disallow: / user-agent: BaiduImagespider disallow: / user-agent: BaiduMobaider disallow: / |
| 例5. 特定の検索エンジンを許可(Baiduspiderのみを許可) | user-agent: Baiduspider disallow: user-agent: * disallow: / |
| 例6.特定の検索エンジンのアクセス頻度を制限(120秒間隔) crawl-delay:この値は連続2回アクセスの間隔時間を表しています。 |
user-agent: Baiduspider
crawl-delay:120 |
| 例7.簡単な例 このサンプルでは、サイト配下の3ディレクトリに対し、全ての検索エンジンを制限します。 (つまり、検索エンジンは3つのディレクトリに対してアクセスを行いません。) 注意すべきことは、ディレクトリごとに記述が必要となる点です。 "disallow: /cgi-bin/ /tmp/ " のディレクトリ名を続けて連記した場合、または“ disallow: /tmp/ * " 、" disallow:*.gif " のような書式は無効となります。 user-agent: の後ろの * は、全てのロボットという意味であり、連続2回アクセスの間隔時間は5秒としています。 |
user-agent: * disallow: /cgi-bin/ disallow: /tmp/ disallow: /~joe/ crawl-delay:5 |
アクセス制御方法について
- robots.txtについて
- robots.txtの置き場所
- robots.txtファイルのフォーマット
- robots.txtファイルの使用例
- meta要素について
- meta要素の書式
- meta要素の使用例