1月 27, 2022

The Organic Digital Blog

これは、ライブサイトとステージングサイトの2つの(大きな)ページにあるブログ記事です。

パート1:Googleがライブサイトをインデックス化しているかどうかを確認する方法

パート2:Googleがステージング|テストサイトをインデックス化しているかどうかを確認する方法

どのようにしてステージング/テストサイトをインデックス化しているかどうかを確認するにはどうすればよいですかGoogleが私の生きている場所を指示したかどうか言いなさいか。

調べるには2つの簡単な方法があります。

site:query演算子

を使用して、Googleでドメインを次のように検索します。site:organicdigital。co
サイトがインデックス化されている場合は、ページのリストが表示されます:

サイトクエリ演算子

結果が返されない場合は、問題が発生する可能性があります:

結果のないサイトクエリ演算子

注:より大きい場所で、何ページが指示されるかの近似を見る間、実際にSERPsのそれらのおよそ300しか見られない。

Google Search Consoleのカバレッジセクションをチェック

すべてのウェブサイトはGSCアカウントを持っている必要があります、それは、私の意見では、サイトの所有者やSEOが使用できる最大のツールであり、あなたのサイトの有機的な可視性とパフォーマンスに関する豊富な情報を提供します。 あなたが持っていない場合は、公式のGSCページに向かい、そうであれば、あなたがの内訳を見ることができるカバレッジセクションに行きます:

  • ページのクロール中にエラーが発生しました
  • ブロックされているページ
  • 有効なインデックス付きページ
  • 除外されているページ
GSCカバレッジレポート

サイトに問題がある場合、これらは”エラー”または”除外”の下に報告され、次のような検索に含まれない理由を見つけることができます:

  • 適切な正規タグを持つ代替ページ
  • クロールされました–現在インデックス化されていません
  • ユーザーが選択した正規
  • ‘noindex’タグによって除外されていない重複
  • クロール異常
  • が見つかりません(404)

サイトのページが”有効”セクションに表示されない場合は、問題が発生する可能性があります。

GSCのURL検査機能を使用する

一部のページがインデックスされていて、他のページがインデックスされていない場合は、URL検査ツールを使用して、Googleが特定のペー:

GSC URL Inspect Tool

ページがインデックスされている場合、次のように詳細が表示されます:

GSCインデックス付きページデータ

そうでない場合は、Googleがページをクロールしようとしたときに表示されるこのステータスと、インデックス化されていない:

GSCインデックスなしページデータ

Googleがページをクロールまたはインデックス化しないのはなぜですか?

一般的に、ページをクロールまたはインデックス化できない理由は二つあります。 これらは、新しいサイトが起動または移行され、開発環境からの設定が引き継がれた場合に特に一般的です。

ロボット。txt Disallowディレクティブ

これは、サイト、ディレクトリ、またはページがロボットによってクロールされないようにブロックされる場所です。txtファイル。

すべてのサイトはロボットを持っている必要があります。txtファイルは、これはあなたのサイトのどのセクションをクロールする必要があり、すべきではないように検索エンジンに指示を与えるために使

もし持っていれば、ルートディレクトリにrobotsという名前の下にあります。txt

https://organicdigital.co/robots.txt

サイト、ディレクトリ、またはページがクロールされないようにするディレクティブは次のようになります:

Disallow: /Disallow: /directory/Disallow: /specific_page.html

Screaming Frogを使用してサイトをクロールしようとすることもできます。 これを行うことができない場合は、次のクロールデータが表示されます:

Screaming Frog Robots Issue

このディレクティブを使用して検索エンジンをブロックするには多くの正当な理由がありますが、上記の行に沿って何かを見た場合は、サイトのクロールを許可するためにこれらを修正する必要があります。

txtファイル手動

FTPにアクセスできるか、開発者が手元にいる場合は、ロボットを手動で修正することができます。txtファイルは、サイトのクロールをブロックしているディレクティブを削除します。

一般的に、次のコマンドはこれを行います:

User-agent: *Allow: /

ロボットを修正する方法。WordPressのtxtファイル

Yoastプラグインがインストールされている場合は、ツール->ファイルエディタセクション–これを行う方法については、このリンクに従ってく

txtエディタ

ロボットを修正する方法。Magentoのtxtファイル

コンテンツ->デザイン->設定に移動し、関連するストアビューをクリックして”検索エンジンロボット”を編集します”

Magentoのロボットの設定

ロボットのメタタグは、ロボットに加えてNoindexおよび/またはNofollow

に設定されています。txtファイル、あなたはまた、あなたのサイトのソースコード内のロボットのメタタグをチェックし、それがクロールから検索エンジンを防止していない

ソースコードをチェックした場合、robotsメタタグが表示されない場合、または”index”または”index,follow”に設定されている場合–これは問題ではありません。 ただし、”noindex”と表示されている場合は、ページをクロールできますが、インデックス化されないことを意味します:

ソースコード

のNoindexタグここでも、Screaming Frogを使用して、サイト上のロボットタグのステータスを確認できます。 タグがnoindexに設定されている場合、nofollowはホームページを超えません:

Screaming Frog Robots Noindex/Nofllow Issue

noindexに設定されているだけであれば、サイト全体をクロールすることはできますが、インデックス化することはできません:

Screaming Frog Robots Noindex/Nofllow Issue

Robotsメタタグファイルを手動で修正する方法

再度、サイトのページ/テンプレートに直接アクセスし、次のタグを置き換え/追加します:

<meta name="robots" content="index, follow">

WordPressでRobotsメタタグを修正する方法

これを行うには2つの方法があります–問題がサイト全体である場合は設定に移動します->を読んで、「このサイトのイン:

Wordpress Noindexサイト設定

間違っているかもしれませんが、Yoastを使用している場合は、特定のページまたは投稿をindexまたはnoindexに設定できる唯一の方法:

Yoast NoIndex設定

Magentoの中でロボットのメタタグを修正する方法

前と同じように、コンテンツ->デザイン->設定に移動し、関連するストアビューをクリッ:Magentoの

Robots Meta

私のサイト/ページをGoogleでクロールしてインデックス化することができます–次は何ですか?

あなたはあなたのロボットことを満足したら。txtファイルとrobots metaタグが正しい場合は、URLの検査ツールを使用してページを確認し、Googleがページをクロールしてインデックスを作成するように要求できます:

GSCリクエストインデックス

私はまた、Bingのウェブマスターアカウントを持っています!

あなたは? 俺だけだと思ってた わかりました、GscでできるようにBing Webmaster Toolsのこの記事で書かれているほとんどすべての同じ事をすることができます-従ってURLを点検し、索引付けを要求:

Bing Request Indexing

私はこれをすべてやったし、私のサイト/ページはまだインデックス化されていません!

その場合、他にどのような問題があるかを特定するために、webサイトの構成と機能をより深く掘り下げて調べる必要があります。 私はあなたが以下のお問い合わせフォームに記入した場合のお手伝いをすることができます。

その2:

テストサイトがインデックス化されていることに気づいた人

方法:ステージングサイトがGoogleによってインデックス化されているかどうかを確認する

死、税金、テストサイトがGoogleによってインデックス化されているかどうかを確認する。

非常にまれに、ステージングサーバーがクロールとインデックスを作成するためにボットに開放されたままになっていることに気付かずに、新しいサイトの立ち上げに遭遇することはありません。

検索エンジンがテストサイトをインデックス化するのは非常に簡単なので、必ずしも世界の終わりではありませんが、livesiteと一緒に新しい機能を開発するためにテスト環境を長期的に実行している場合は、重複したコンテンツの問題を回避するために、できるだけ早く正しく保護されていることを確認し、実際の人間が訪問したり相互作用したりしないようにする必要があります(すなわち、何かを購入しようとします)。

私は以前は開発者であり、おそらく自分自身で何度もこれらの間違いを犯しましたが、当時はSEOが私のお尻の痛みを指摘していませんでした(当時、

次のテクニックはすべて、これらの問題を野生で特定するために使用したテスト済みの方法ですが、クライアントとその開発者のidentityofを保護するために、私は自分のウェブサイトのコンテンツを使用していくつかのテストサイトをセットアップするという無私の決定を下しました。

test.organicdigital.co
alitis.co.uk
あなたがこれを読む頃には、私は自分の助言に従い、これらを取り下げているだろうが、私が得ることができるすべての可視性が必要であり、私が必要とする最後のものは、私を保持しているインデックス付きテストサイトである。

1)Google Search Console(GSC)ドメインプロパティ

新しいGSCの優れた点の一つは、HTTPとHTTPSの両方で、ウェブサイトに関連付けられているすべてのサブドメイン間で重要な洞察を提供するドメインプロパティを設定できることです。 これを設定するには、プロパティを追加するときにドメインオプションを選択するだけです(ドメインのDNSにTXTレコードを追加するという単純では:

gscドメインプロパティ

ドメインプロパティが有用な理由はたくさんありますが、この場合は、サブドメインにテストサイトを設定していて、検索でインプレッションとクリックを生成している場合は、”パフォーマンス”セクション内からページをフィルタリングまたは注文することでこれを見つけることができます。:

GSCパフォーマンスデータ

さらに、”カバレッジ”セクションも確認する必要があります。:

GSCインデックスデータ

他のケースでは、彼らはあなたが所定の位置にコンテンツを重複していることを発見し、親切にインデックスを控える、その場合は、”重複、Googleは別の正規のユーザーを選択しました”セクション内でそれを見つけることができます”:

GSC Different Canonical

これが事実であっても、あなたはまだそれが前進してクロールされていないことを確実にするために努力するべきです。

2)リンク集

を使用してGoogle SERPsをチェックしてください。)次に、Serpをチェックして、テストURLshaveがインデックスに入ったかどうかを確認できます。

これはまた、新しいビジネスのためにピッチングするときに便利なテクニックです,彼らの内部orexternal開発チームは、彼らが最初の場所で起こることを可能にすることによって、検索の可視性deathbyでダイシングしているように見えるようにするよりも、潜在的なクライアントに勝つためにどのような良い方法,そして、あなたはthedayを保存するためにここにいること.

手順は次のとおりです:

i)LinkClump Google Chrome拡張機能をインストールすると、複数のUrlをページからExcelのようなより便利な場所にコピーして貼り付けることができます。

ii)リンク集の設定を次のように修正します:

リンク集の設定

注意すべき最も重要なものは、”クリップボードにコピー”アクションです–あなたがここで起こりたい最後のことは、百のUrl atonceに開くこ

iii)お気に入りの(またはローカルの)Google TLDに移動し、ページの右下に表示される”設定”をクリックし、”検索設定”を選択して、”ページあたりの結果”を100に設定できます。

iv)Googleホームページに戻り、”site:”queryoperatorを使用してドメインを追加します。 Wwwなどを使用している場合は、これを削除してください。
site:organicdigital.co

すべてのサブドメインでGoogleが現在インデックス化している最大300個のUrlのサンプルが表示されます。 あなたは手動で各結果を確認することができながら、不正なサイトをスポッ:

SERPsのテストサイト

右クリックしてページの一番下までドラッグする方がはるかに速く簡単です。 あなたは、次のtodenoteリンクが選択され、コピーされている発生が表示されますようにリンクの塊が動作しているかどうかを知ることができます:

リンク集
ExcelのUrl

使用可能な場合は、Serp2と3でこれを繰り返し、allURLsをExcelに貼り付けたら、Sort by A-Zを使用して、関連するすべてのサブドメイン間でindexedcontentを簡単に識別

3)サイトに固有のテキストを検索する

上記の方法は、テストサイトがライブwebサイトと同じドメインのasubdomainでホストされている場合に機能します。 ただし、テストサイトが他の場所にある場合は、次のようにします。test.webdevcompany.comそれならば、彼らは働かないでしょう。 その場合、これまたは以下の方法光。

あなたがあなたのウェブサイトに独特であることを信じる内容を見つけなさい–私の場合私はstraplineとの行った:”あなたのウェブサイトの有機性可視性およ このコンテンツを含むテストサイトのインデックスが作成されている場合は、この検索でそのコンテンツが表示されます:

SERPsのテストサイトが再び

ご覧のように、メインサイトのホームページ、テストサブドメイン、個別のテストドメインがすべて表示されます。 また、誤ってあなたのコンテンツを食い物にしている競合他社を見つけることができます。 いくつかは賛辞としてそれを取るだろう、他の人はDMCAsを発行するだろう–それはあなた次第ですが、あなたが望む最後のものは、誰かがあなた自身のコ

4)Screaming Frogを使用してサイトをクロール

私はあなたがSEOにしているので、Screaming Frogを使用していると思います。 これらの答えのいずれかがノーであれば、この記事にこれまでのところそれを作るためによくやった(私はあなたがbollockを落とし、他の誰かが見つける前に).

お持ちでない場合は、こちらからダウンロードしてください。

基本設定で、”すべてのサブドメインをクロール”にチェックを入れます。 また、一部のテスト環境ではこれが設定されている可能性があるため、”Follow Internal’nofollow'”にチェックを入れることもできます。

クロールが完了したら、リストを熟読して、テストサイトへの内部リンクがあるかどうかを確認します。 私は最近、新しいDrupalサイトがライブになったところで、ベータサブドメインを指しているブログ記事内のすべての内部リンクを使用していました:

Screaming Frog Crawl

各テストURLをクリックし、下部のInLinksをクリックして、ライブからテストサイトへの問題のある内部リンクを見つけることができます。 この場合、サイトマップ上のお問い合わせリンクをテストURLを指すように修正しました:

悲鳴を上げるカエル内部リンク

発見されたら、これらが他の場所で訪問者を連れて行く他の内部リンクがなくなるまで修正して再クロールします。 WordPressを使用している場合は、検索/置換プラグインを使用してすべてのtestURLsを検索し、それらをライブのものに置き換えます。

5)Google Analyticsのホスト名を確認する

テストサイトにライブサイトと同じGoogle Analyticsアカウントのトラッキングコードがインストールされている場合は、”動作”->”サイトコンテンツ”->”AllPages”などのセクションに移動し、セカンダリディメンションとして”ホスト名”を選択すると、これを見つけることができます。:

Google Analyticsのホスト名

これに加えて、レポートからメインドメインへのすべての訪問を除外することで、さらにデータをフィルタリングすることもできます。 サイトをテストするために、3rdpartyサイトでGAスパムがトリガされていることを明らかにすることもできます:

Google Analytics Exclude Hostname

ライブ環境とテスト環境の両方でIDrunningを追跡する同じGAを持つことには賛否両論がありますが、個人的にはnoreasonが別々のアカウントを持っていて、代わりにあなたの一つのアカウント内に複数のビューを作成することがわかります。 ライブサイトの場合は、ライブホスト名へのトラフィックのみを含めるようにフィルタを設定し、テストサイトの場合はその逆を行います。

テストサイトを削除してインデックス化しないようにする方法

上記のテクニックのいずれかを使用してインデックスでテストサイトを発見したか、最初に発生しないことを確認したいと思います。 以下はすべてこれに役立ちます:

1)GSC経由でUrlを削除する

あなたのサイトがインデックス化されている場合、トラフィックを生成しているかどうかにかかわらず、それを削除することをお勧めします。 これを行うには、「古い」GSCから「Urlの削除」セクションを使用できます。

注、これは古いGSCでは提供されていないため、ドメインプロパティレベルでは機能しません。 これを行うには、個々のtestdomainのプロパティを設定する必要があります。

設定したら、”古いバージョンに移動”し、”Googleインデックス”->”Urlを削除”に移動します。 ここから、”TemporarilyHide”を選択し、削除のためにあなたのサイト全体をwillsubmitブロックしたいURLとして単一のスラッシュとして入力します:

GSC Remove URLs

これにより、サイトが90日間Serpから削除されます。 次のいずれかで十分です(GSCを介して削除できるかどうかにかかわらず実行する必要があります)

2)テストサイトでrobotsタグをnoindexに設定します

テス:

<meta name="robots" content="noindex" />

あなたのサイトがWordPressの場合は、”設定”->”読書”と”このサイトのインデックスから検索エンジンを阻止する”を選択してこれを設定することができます:

Wordpress Reading Settings

テストサイトがインデックス化されないようにするために使用するコードや設定は、newcontentまたは機能がライブになったときにこれがライブサイトに移行されないようにする必要があります。 テストサイトの設定は、ライブサイトの可視性を台無しにするための最も一般的で確実なファイアウェイの一つです。

3)パスワードテストサイトを保護

webコントロールパネルから、またはサーバーを介して、テストサイトが存在するディレクトリをpasswordprotectします。 これを行うには多くの方法があります–bestbetは、あなたのホスティング会社や開発者にこれを設定するように依頼することです、または、これを行う方法:

https://one-docs.com/tools/basic-auth

ブロックされると、テストサイトにアクセスしようとすると警告ボックスが表示されます:

https://alitis.co.uk/

パスワードで保護されたサイト

これは、検索エンジンがサイトをクロールしてインデックスを作成するのを防ぎます。

4)サイトを削除してページステータスを返す410

テストサイトが不要になった場合は、簡単に削除できます。 検索エンジンは、長いライブ上のページを訪問しようとすると、彼らはページが削除されて表示されます。 デフォルトでは、壊れたページはstatus404(”Not Found”)を返します–これは時間内にサイトのインデックス解除を取得しますが、壊れたページが戻ってきたかどうかを確認するためのフォローアップ訪問があるので、しばらく時間がかかります。 代わりに、ステータスを410(“Permanently Gone”)に設定すると、次のメッセージが返されます:

410

ドメイン全体でこれを行うには、サイトを削除し、保存します。次のコマンドでhtaccessファイルを所定の位置に配置します:

Redirect 410 /

これは、サイトが最初に尋ねる(または少なくともaよりも速く)時にインデックス解除を取得することを保証します404)

5) ロボットを介してブロックします。txt

テストサイトのロボットに次のコマンドを実装することで、サイトがクロールされるのをブロックできます。txtファイル:

User-agent: *Disallow: /

これにより、ボットがサイトをクロールするのを防ぎます。 メモ: テストサイトが現在インデックス化されており、noindexタグをサイトに追加するルートをたどっている場合は、ロボットを追加しないでください。すべてのページがインデックス解除されるまでtxtコマンドを入力します。 すべてのページがインデックス解除される前にこれを追加すると、それらのページがクロールされ、robotsタグが検出されないようになるため、ページはインデ

そしてそれはそれです–私はあなたがtofind、deindexを見つけて、あなたのテストが二度とクロールされないようにするのに十分であることを願っています。

しかし、

を覚えておいてください。txtすべてのボットがテストサイトのクロールとインデックスを禁止する場合は、テストサイトをライブに置くときに、これらの構成をライブサイトに

そして、私たちは皆そこにいましたよね?

コメントを残す

メールアドレスが公開されることはありません。