robots.txt ジェネレーター|AIクローラーブロック対応
robots.txtを無料で即生成。GPTBot・ClaudeBot等のAIクローラーブロックも1クリック。コピー&DL対応。
コンテンツのAI学習目的クローリングをブロックします。
# robots.txt # Devryo で生成 User-agent: * Allow: /
robots.txt ジェネレーター|AIクローラーブロック対応とは
robots.txtの書き方がわからなくても大丈夫。クロール禁止パスの設定・AIクローラー(GPTBot・ClaudeBot・Google-Extended)ブロック・Sitemap URLの追記をビジュアルUIで操作するだけで正しいrobots.txtが完成します。生成後はそのままコピーまたはrobots.txtファイルとしてダウンロード。WordPressでも静的サイトでもそのままアップロードして使えます。
使い方
- 1まずプリセットを選択します。通常サイトは「すべて許可」、特定ページだけ制御したい場合は「カスタム設定」を選んでください。
- 2カスタムの場合はクロール禁止パスのチェックリストから選択、または独自のパス(例: /admin/)を1行ずつ入力します。
- 3AIクローラー(GPTBot・ClaudeBot・Google-Extended等)をブロックしたい場合は該当するチェックボックスを選択、または「AIを全部ブロック」ボタンを押してください。
- 4サイトマップURLを入力すると「Sitemap:」ディレクティブが自動で追記されます。
- 5右のプレビューがリアルタイムで更新されます。内容を確認して「コピー」またはrobots.txtとしてそのままダウンロードしてください。
メリット・特徴
- robots.txtの書き方を知らなくてもUIだけで正しいファイルを生成
- AIクローラー15種類(GPTBot・ClaudeBot・Google-Extended等)を個別ブロック可能
- よく使う禁止パス(/admin/ /wp-admin/ 等)をチェックリストで即設定
- robots.txtファイルとして直接ダウンロード、そのままサーバーへアップロード可能
- 無料・登録不要・ブラウザ完結。WordPress・Shopify・静的サイト問わず使える
robots.txtとは?SEOにおける役割と重要性
robots.txtはウェブサイトのルート(https://yourdomain.com/robots.txt)に置くテキストファイルです。ロボット排除プロトコル(Robots Exclusion Protocol)に基づき、検索エンジンのクローラーに対して「どのページを巡回してよいか・してはいけないか」を伝えます。Google・Bing・Yahoo!など主要な検索エンジンはすべて、サイトをクロールする前にこのファイルを読み込みます。
クローラーはrobots.txtをどう使うか
検索エンジンのボットがサイトを訪問するとき、最初にドメインルートのrobots.txtを確認します。ファイルが存在すればルールを読み込み、それに従ってクロール対象を決定します。robots.txtが存在しないか設定が不適切だと、重要でないページにクロール予算が消費される・主要コンテンツのインデックスが遅れる・最悪の場合サイト全体がクロールされなくなる、といった問題が起きます。
robots.txtとnoindexの違い
robots.txtはページの「クロール(巡回)」を制御し、noindexメタタグはページの「インデックス(登録)」を制御します。robots.txtでブロックされたページでも、他サイトからリンクされていれば検索結果に表示されることがあります。検索結果から確実に除外したい場合はnoindexタグを使い、robots.txtだけに頼らないようにしましょう。
クロールバジェットとその重要性
Googlebotは1サイトに対して1日にクロールできるページ数(クロールバジェット)が決まっています。大規模サイトでこのバジェットが重複URL・パラメーターURL・低品質ページに消費されると、重要なページがクロールされない恐れがあります。robots.txtで /tag/ /search/ などの低価値URLをブロックすることで、クロールバジェットを重要ページに集中させることができます。
robots.txtのディレクティブ(命令文)解説
robots.txtは少数のディレクティブで構成されています。それぞれの意味を理解することで、意図した通りのルールを正確に記述できます。
User-agent
どのクローラーにルールを適用するかを指定します。User-agent: * はすべてのクローラーが対象です。User-agent: Googlebot のように特定のクローラー名を指定することもできます。User-agent: GPTBot と指定すればOpenAIのトレーニングボットだけにルールを適用できます。
DisallowとAllow
Disallow: /path/ は指定パス以下のURLをクロール禁止にします。Allow: /path/ は、より広いDisallowルールの中で特定パスだけを許可するために使います。例えば Disallow: /private/ と Allow: /private/public.html を組み合わせると、/private/ 全体を禁止しつつ1ページだけ許可できます。Disallow:(値なし)はすべて許可の意味です。
Sitemapディレクティブ
Sitemap: https://example.com/sitemap.xml のように記述することで、クローラーにXMLサイトマップの場所を伝えられます。これはクロール制限ではなく「コンテンツ発見のヒント」です。複数のSitemap行を記述することも可能です。本ツールではサイトマップURLを入力すると自動でこのディレクティブが追記されます。
Crawl-delay
Crawl-delay: 10 と記述すると、対応するクローラーはページ間のリクエストを10秒空けます。サーバー負荷軽減に役立ちます。ただしGooglebotはこのディレクティブを無視します。Googleのクロール頻度を下げたい場合はGoogle Search ConsoleのCrawl Rate設定を使ってください。Bingbot・Baiduspiderなどは対応しています。
よくあるrobots.txtの設定ミス
robots.txtの設定ミスはSEOに深刻な影響を与えることがあります。特によく見られる間違いを押さえておきましょう。
サイト全体を誤ってブロックしてしまう
User-agent: * の下に Disallow: / と書くと、すべてのクローラーがサイト全体をクロールできなくなります。これはサイトをGoogleから消滅させる最も危険な設定です。アップロード前に必ず確認してください。サイトが突然検索結果から消えたらrobots.txtを真っ先に確認しましょう。
CSSとJavaScriptをブロックしてしまう
/wp-content/ などのアセットフォルダをブロックすると、Googlebotがページをブラウザのようにレンダリングできなくなります。Googleはページの見た目を評価してランキングに反映するため、スタイルやスクリプトが読めない状態では正しく評価されません。管理画面や非公開リソース以外のアセットはブロックしないようにしましょう。
セキュリティ対策としてrobots.txtを使う
robots.txtはドメイン直下に公開されており、誰でも内容を見ることができます。Disallow: に記載したパスは、悪意ある第三者に「隠しページの場所」を教えてしまうことになります。機密コンテンツの保護には認証やサーバーレベルのアクセス制御を使い、robots.txtを唯一のセキュリティ手段にしないでください。
サイト別robots.txtの設置方法
本ツールでrobots.txtを生成したら、使用しているプラットフォームに合わせて設置してください。ファイルは必ずドメインルート(https://yourdomain.com/robots.txt)に置く必要があります。
WordPress
WordPressはrobots.txtが存在しない場合、デフォルトのファイルを自動生成します。独自のrobots.txtを使うには、生成したファイルをFTPまたはホスティングのファイルマネージャーでWordPressのルートディレクトリにアップロードしてください。Yoast SEOなら「ツール」→「ファイルエディター」、Rank Mathなら「一般設定」→「robots.txt編集」からFTP不要で直接編集できます。
Shopify
2021年以降のShopifyはrobots.txt.liquidテンプレートで編集できます。Shopify管理画面の「オンラインストア」→「テーマ」→「アクション」→「コードを編集」を開き、テンプレートフォルダの robots.txt.liquid を選択してください。内容を本ツールの生成結果に差し替えるだけで即時反映されます。
静的サイト・その他のプラットフォーム
Next.js・Astro・Hugo・プレーンHTMLなどの静的サイトでは、robots.txtを public/ または static/ フォルダに置くとドメインルートで配信されます。Wix・Squarespaceなど他のCMSプラットフォームは管理画面のSEO設定にrobots.txtエディターが用意されています。設置後はブラウザで https://yourdomain.com/robots.txt にアクセスして内容を確認してください。
よくある質問(FAQ)
- robots.txtとは何ですか?
- robots.txtはウェブサイトのルートに置くテキストファイルで、検索エンジンのクローラーにどのページをクロールしてよいかを伝えます。「クロール制御ファイル」とも呼ばれ、SEO管理の基本設定のひとつです。
- robots.txtはどこに配置すればいいですか?
- ドメインのルートディレクトリ(https://example.com/robots.txt)に配置する必要があります。サブディレクトリ(例: /blog/robots.txt)には配置できません。FTPやサーバー管理画面からアップロードしてください。
- robots.txtでブロックするとGoogleのインデックスから除外できますか?
- いいえ、robots.txtはクロールを制限しますが、インデックスからの除外は保証されません。インデックスから確実に除外するにはnoindexタグまたはGoogle Search Consoleをご利用ください。robots.txtでブロックしつつ他サイトからリンクされているページはインデックスされる場合があります。
- AIクローラーをブロックする効果はありますか?
- GPTBot・ClaudeBot・Google-Extended等の主要AIクローラーはrobots.txtを遵守していると公表しています。コンテンツをAI学習に使われたくない場合は本ツールのAIクローラーブロック機能をご活用ください。ただし非公式ボットや悪意のあるクローラーはrobots.txtを無視することがあります。
- robots.txtを確認・テストするには?
- 生成したrobots.txtをサーバーに設置後、ブラウザで https://example.com/robots.txt にアクセスして内容を確認できます。当サイトの robots.txt チェッカー を使えば構文エラー・AIクローラーブロック状況を一括診断できます。GooglebotについてはGoogle Search Consoleのrobots.txtテスターも併用推奨です。
- WordPressでrobots.txtを設定するには?
- WordPressはデフォルトで仮想のrobots.txtを自動生成します。独自のrobots.txtを使いたい場合は本ツールで生成したファイルをWordPressのルートディレクトリにアップロードするか、Yoast SEO・Rank Math等のプラグインの「robots.txt編集」機能から設定できます。
- Shopifyでrobots.txtを設定するには?
- 2021年以降のShopifyはrobots.txt.liquidテンプレートで編集できます。Shopify管理画面の「オンラインストア」→「テーマ」→「コードを編集」からrobots.txt.liquidを開き、生成したルールに置き換えてください。
- Disallow: / と Disallow: の違いは?
- Disallow: /(スラッシュあり)はサイト全体のクロールを禁止します。Disallow:(空欄)はすべてのパスのクロールを許可する意味です。間違えるとサイト全体がクロールされなくなるため注意が必要です。
- CSSやJavaScriptファイルをブロックすべきですか?
- いいえ。CSSやJSをブロックするとGooglebotがページを正しくレンダリングできなくなり、評価が下がる可能性があります。ブロックするのは管理画面や非公開リソースなど、本当にインデックスされたくないパスのみにしてください。
- Crawl-delayはどのクローラーに有効ですか?
- Crawl-delayはBingbot・Baiduspider等が対応しています。Googlebotは現時点でこのディレクティブを無視しており、クロール頻度を下げたい場合はGoogle Search ConsoleのCrawl Rate設定で制御する必要があります。
- robots.txtがなくても問題ありませんか?
- robots.txtがない場合、クローラーはすべてのページを自由にクロールします。小規模サイトでは問題になりにくいですが、robots.txtにSitemapのURLを記載することでGoogleがコンテンツをより速く発見できるメリットがあります。
- 複数のUser-agentブロックを使えますか?
- はい。Googlebotには特定のDisallowルールを、GPTBotにはすべてをブロックするなど、クローラーごとに異なるルールを設定できます。User-agent: * は個別指定のないすべてのクローラーに適用されます。
不具合や動作がおかしい点を見つけたら教えてください。
不具合報告はこちら →