27 stycznia, 2022

Blog Organic Digital

to jest post na blogu na dwóch (dużych) stronach – na żywo i witrynach testowych:

Część 1: Jak sprawdzić, czy Google Zindeksował Twoją witrynę na żywo

część 2: Jak sprawdzić, czy Google Zindeksował Twoją witrynę testową/testową

jak Mogę sprawdzić, czy Google Zindeksowało moją witrynę na żywo?

istnieją dwa proste sposoby, aby dowiedzieć się:

użyj strony: Operator zapytania

wyszukaj swoją domenę w Google w następujący sposób:site: organicdigital.co
jeśli Twoja strona jest indeksowana, zobaczysz listę stron:

Operator zapytania strony

jeśli nie zostaną zwrócone żadne wyniki, mogą wystąpić problemy:

Operator zapytania o stronę bez wyników

uwaga: na większych stronach, podczas gdy zobaczysz przybliżoną liczbę stron indeksowanych, będziesz mógł zobaczyć tylko około 300 z nich w SERPach.

sprawdź sekcję zasięgu Google Search Console

każda strona powinna mieć konto GSC, jest to moim zdaniem największe narzędzie, z którego może korzystać właściciel witryny lub SEO i daje mnóstwo informacji o organicznej widoczności i wydajności witryny. Jeśli go nie masz, przejdź do oficjalnej strony GSC, jeśli tak, przejdź do sekcji pokrycia, gdzie możesz zobaczyć podział:

  • błędy napotkane podczas indeksowania stron
  • strony, które są zablokowane
  • poprawne strony indeksowane
  • strony, które są wykluczone
raport pokrycia GSC

jeśli Twoja witryna ma problemy, zostaną one zgłoszone w sekcji „błąd” lub „wykluczone” – i możesz dowiedzieć się, dlaczego nie są one uwzględniane w wyszukiwaniu, takich jak:

  • alternatywna strona z odpowiednim tagiem kanonicznym
  • indeksowana-obecnie nie indeksowana
  • duplikat bez wybranego przez użytkownika kanonicznego
  • wykluczony przez tag 'noindex’
  • anomalia indeksowania
  • nie znaleziono (404)

jeśli strony Twojej witryny nie pojawiają się w sekcji” poprawne”, możesz mieć problemy.

Użyj funkcji URL Inspect w GSC

jeśli niektóre strony są indeksowane, a inne nie, możesz również użyć narzędzia URL Inspect, aby sprawdzić, czy Google jest w stanie indeksować i indeksować określoną stronę lub czy istnieją inne problemy uniemożliwiające jej pojawienie się w wyszukiwaniu – jest to w górnym menu i pozwoli Ci sprawdzić jeden adres URL naraz:

narzędzie GSC URL Inspect

jeśli Twoja strona jest indeksowana, poda następujące szczegóły:

 indeksowane Dane strony GSC

jeśli nie, otrzymasz ten status, który pokazuje, kiedy Google próbował indeksować stronę i kilka informacji o tym, dlaczego nie jest indeksowana:

GSC nie indeksowane Dane strony

Dlaczego Google nie indeksuje lub nie indeksuje moich stron?

Zasadniczo istnieją dwa powody, dla których strona nie może być indeksowana lub indeksowana. Są one szczególnie powszechne, gdy nowa witryna została uruchomiona lub migrowana, a ustawienia ze środowiska programistycznego zostały przeniesione.

roboty.txt zakazuje dyrektywy

to jest miejsce, w którym strona, katalog lub Strona są blokowane przed indeksowaniem przez roboty.plik txt.

każda strona powinna mieć robota.plik txt, służy do wskazania wyszukiwarkom, jakie sekcje witryny powinny i nie powinny być indeksowane.

jeśli go posiadasz, znajdziesz go w katalogu głównym pod nazwą robots.txt

https://organicdigital.co/robots.txt

dyrektywy, które uniemożliwiałyby indeksowanie witryny, katalogu lub strony, byłyby następujące:

Disallow: /Disallow: /directory/Disallow: /specific_page.html

Możesz również użyć Screaming Frog do próby indeksowania witryny. Jeśli nie jest to możliwe, zobaczysz następujące dane indeksowania:

Screaming Frog Robots Issue

istnieje wiele ważnych powodów blokowania wyszukiwarek za pomocą tej dyrektywy, ale jeśli widzisz coś podobnego do powyższego, musisz je zmienić, aby umożliwić indeksowanie witryny.

jak zmienić Robot.plik TXT ręcznie

jeśli masz dostęp do FTP lub masz pod ręką programistę, możesz ręcznie zmienić roboty.plik txt, aby usunąć wszelkie dyrektywy, które blokują witrynę z indeksowania.

Ogólnie rzecz biorąc, następujące polecenie zrobi to:

User-agent: *Allow: /

jak zmienić robota.plik txt w WordPress

jeśli masz zainstalowaną wtyczkę Yoast, możesz edytować plik bezpośrednio za pomocą sekcji Narzędzia – > edytor plików-kliknij ten link, aby uzyskać instrukcje, jak to zrobić.

edytor txt

jak zmienić Robot.plik txt w Magento

przejdź do treści – > projekt – > Konfiguracja, kliknij w odpowiedni Widok sklepu i edytuj „roboty wyszukiwarek”

Ustawienia robotów Magento

Meta Tag robotów jest ustawiony na Noindex i/lub Nofollow

oprócz robotów.plik txt, możesz także sprawdzić meta tag robotów w kodzie źródłowym witryny i upewnić się, że nie uniemożliwia indeksowania wyszukiwarek.

jeśli sprawdzasz kod źródłowy, jeśli nie widzisz meta tagu robotów lub jest on ustawiony na „index” lub „index, follow” – to nie jest problem – Jeśli jednak widzisz, że jest napisane „noindex”, oznacza to, że Twoja strona może być indeksowana, ale nie będzie indeksowana:

Tag Noindex w kodzie źródłowym

ponownie możesz użyć Screaming Frog, aby sprawdzić status tagów robotów na swojej stronie. Jeśli twój tag jest ustawiony na noindex, nofollow nie wykracza poza stronę główną:

Screaming Frog Robots noindex / Nofllow Issue

jeśli jest ustawiony na noindex, cała strona może być indeksowana, ale nie indeksowana:

Screaming Frog Robots noindex/Nofllow Issue

jak ręcznie zmienić plik meta tagów robotów

ponownie uzyskaj bezpośredni dostęp do strony/szablonu witryny i zastąp / Dodaj następujący tag:

<meta name="robots" content="index, follow">

jak zmienić Meta Tag robotów w WordPress

istnieją dwa sposoby, aby to zrobić – jeśli problem dotyczy całej witryny, przejdź do ustawień – > czytanie i upewnij się, że” zniechęcaj Wyszukiwarki do indeksowania tej witryny ” nie jest zaznaczone:

 WordPress ustawienie witryny Noindex

mogę się mylić,ale myślę, że jedynym sposobem na określoną stronę lub post można ustawić na indeks lub noindex, jeśli używasz Yoast, więc przejdź do page / post i sprawdź następujące ustawienie u podnóża strony:

ustawienie Yoast NoIndex

jak zmienić Meta Tag robotów w Magento

jak wcześniej, przejdź do Content – > Design – > Configuration, kliknij odpowiedni Widok sklepu i zmień opcję rozwijaną „domyślne roboty”:

 roboty Meta w Magento

Moja Strona / strony mogą być indeksowane i indeksowane przez Google – co dalej?

gdy będziesz zadowolony, że Twoje roboty.plik txt i meta tag robotów są poprawne, możesz ponownie użyć narzędzia Inspect URL, aby sprawdzić stronę i zażądać, aby Google indeksowało i indeksowało Twoją stronę:

GSC Request Indexing

mam również konto webmastera Bing!

Myślałem, że tylko ja. Ok, możesz zrobić prawie wszystkie te same rzeczy napisane w tym artykule w Narzędziach dla webmasterów Bing, jak w GSC-więc sprawdź adres URL i indeksowanie żądań:

indeksowanie żądań Bing

zrobiłem to wszystko i Moja Strona / strony nadal nie są indeksowane!

w takim przypadku potrzebujesz głębszego zagłębienia się w konfigurację i funkcjonalność swojej witryny, aby zidentyfikować inne problemy. Mogę ci pomóc, jeśli wypełnisz poniższy formularz kontaktowy.

część 2:

ktoś, kto właśnie zdał sobie sprawę, że jego strona testowa jest indeksowana

Jak: sprawdzić, czy Twoja witryna testowa jest indeksowana przez Google

tylko trzy rzeczy są pewne w życiu: śmierć, podatki i witryna testowa jest indeksowana przez Google.

bardzo rzadko można natknąć się na uruchomienie nowej witryny bez w pewnym momencie uświadomienia sobie, że serwer staging został otwarty dla botów, aby się indeksować i indeksować.

niekoniecznie jest to koniec świata, jeśli wyszukiwarka indeksuje witrynę testową, ponieważ jest to dość łatwe do rozwiązania – ale jeśli długoterminowo korzystasz ze środowiska testowego, aby rozwijać nową funkcjonalność wraz z witryną livesite, musisz upewnić się, że jest ona prawidłowo chroniona tak wcześnie, jak to możliwe, aby uniknąć duplikatów problemów z treścią i upewnić się, że prawdziwi ludzie nie odwiedzają i nie reagują (tj. próbują coś kupić).

jestem wcześniej programistą i prawdopodobnie popełniłem te błędy więcej niż raz, ale wtedy nie miałem SEO, które było wrzodem na tyłku przez cały czas wskazując te rzeczy (wtedy stara broszura szkolna-przyjdź-projektanci stron internetowych, którzy nie rozumieli ograniczenia tabel i inline CSS, gdzie ból w mojej dupie).

wszystkie poniższe techniki są wypróbowanymi i przetestowanymi metodami, których użyłem do identyfikacji tych problemów na wolności, chociaż w celu ochrony tożsamości moich klientów i ich programistów, podjąłem bezinteresowną decyzję, aby ustawić kilka witryn testowych za pomocą mojej własnej zawartości strony internetowej w celu zilustrowania tego, co musisz zrobić, są to:

test.organicdigital.co
alitis.co.uk
chociaż jak to przeczytasz, to będę szedł za własnymi radami i usunął je, potrzebuję całej widoczności, jaką mogę uzyskać, ostatnią rzeczą, jakiej potrzebuję, są zindeksowane strony testowe, które mnie powstrzymują.

1) właściwość domeny Google Search Console (GSC)

jedną z wspaniałych rzeczy w nowym GSC jest to, że możesz skonfigurować właściwości domeny, które zapewniają kluczowe informacje we wszystkich subdomenach powiązanych z Twoją witryną – zarówno na HTTP, jak i HTTPS. Aby to skonfigurować, po prostu wybierz opcję domeny podczas dodawania właściwości (musisz również wykonać potencjalnie nie tak proste zadanie dodawania rekordu TXT do DNS domeny):

właściwość domeny GSC

istnieje wiele powodów, dla których właściwość domeny jest przydatna, w tym przypadku jest to spowodowane tym, że jeśli masz witrynę testową skonfigurowaną na sub domenie i generuje wrażenie i Kliknięcia w wyszukiwaniu, możesz to zauważyć w sekcji „Wydajność”, filtrując lub porządkując strony:

dane wydajności GSC

ponadto należy również sprawdzić sekcję „pokrycie” – w niektórych przypadkach Google zindeksuje Twoją zawartość:

dane indeksowane przez GSC

podczas gdy w innych przypadkach zauważą, że dodałeś treść na miejscu i uprzejmie powstrzymasz się od indeksowania, w takim przypadku znajdziesz ją w sekcji „duplikat, Google wybrał inny kanoniczny niż użytkownik”:

GSC Different Canonical

nawet jeśli tak jest, powinieneś nadal starać się upewnić, że nie pełznie do przodu.

2) Sprawdź serwery Google za pomocą łącza

, jeśli nie masz dostępu do właściwości domeny GSC lub jakiegokolwiek dostępu do GSC (jeśli nie, dlaczego nie?) następnie możesz sprawdzić SERP, aby sprawdzić, czy jakikolwiek testowy URLshave dostał się do indeksu.

jest to również przydatna technika podczas pitchingu dla nowego biznesu,czy jest lepszy sposób na pozyskanie potencjalnego klienta niż sprawienie, aby ich wewnętrzny lub zewnętrzny zespół programistów wyglądał tak, jakby mieli dostęp do widoczności w wyszukiwarkach, pozwalając na to w pierwszej kolejności, i że jesteś tutaj, aby uratować dzień.

kroki są następujące:

i) zainstaluj rozszerzenie LinkClump Google Chrome, które pozwala na kopiowanie i wklejanie wielu Urlów ze strony do miejsca bardziej użytecznego, takiego jak Excel.

ii) zmień ustawienia zbijania linków w następujący sposób:

Link Clump Settings

najważniejszą rzeczą, na którą należy zwrócić uwagę, jest akcja „skopiowane do schowka”– ostatnią rzeczą, którą chcesz tutaj zrobić, jest otwarcie do stu adresów URL na raz.

iii) przejdź do swojego ulubionego (lub lokalnego) Google TLD, kliknij „Ustawienia”, które powinieneś zobaczyć w prawym dolnym rogu strony i wybierz „Ustawienia wyszukiwania”, gdzie możesz ustawić „wyniki na stronę” na 100.

iv) wróć na stronę główną Google i użyj zapytania ” site:” i dołącz swoją domenę. Jeśli używasz www lub podobnego, usuń to-tak polecenie będzie wyglądać następująco:
site:organicdigital.co

zostanie wyświetlona próbka do 300 Url zindeksowana przez Google we wszystkich subdomenach. Podczas gdy można ręcznie przeglądać każdy resultto spot nieuczciwych witryn:

strona testowa w SERPach

znacznie szybciej i łatwiej jest kliknąć prawym przyciskiem myszy i przeciągnąć całą drogę na dół strony. Dowiesz się, czy klomb linków działa, jak zobaczysz, co następuje, Aby linki do notatek były wybierane i kopiowane:

klej linków w akcji
adresy URL w Excelu

powtórz to w SERPach 2 i 3, jeśli są dostępne, a po wklejeniu wszystkich elementów do programu Excel, użyj sortowania według A-Z, aby łatwo zidentyfikować indeksowany kontent we wszystkich odpowiednich subdomenach.

3) wyszukaj tekst unikalny dla Twojej witryny

powyższe metody działają, jeśli Twoja witryna testowa jest hostowana na asubdomain w tej samej domenie, co Twoja witryna NA ŻYWO. Jeśli jednak Twoja strona testowa znajduje się w innym miejscu, np. test.webdevcompany.com wtedy nie zadziałają. W takim przypadku, to lub następujące metodysmight.

Znajdź pewne treści, które uważasz za unikalne dla Twojej witryny – w moim przypadku poszedłem z strapline: „zwiększ widoczność organiczną swojej witryny i ruch” – następnie wyszukaj to w cudzysłowie. Jeśli strona testowa zawierająca tę zawartość została zindeksowana, to wyszukiwanie powinno ją ujawnić:

strony testowe w SERPach ponownie

jak widać, pojawiają się strony główne na stronie głównej, sub domena testowa i oddzielna domena testowa. Możesz również nieumyślnie zauważyć konkurenta, który oszukał Twoje treści. Niektórzy uznaliby to za komplement, inni wydaliby DMCA-to zależy od ciebie, ale ostatnią rzeczą, jakiej chcesz, jest ktoś, kto przewyższa Cię własną kopią.

4) Indeksuj stronę za pomocą Screaming Frog

zakładam, że lubisz SEO i dlatego używasz Screaming Frog. Jeśli któraś z tych odpowiedzi brzmi nie, to dobra robota za to, że dotarłeś tak daleko do tego artykułu (niech zgadnę, jesteś programistą, który upuścił gówno i chce ukryć swój tyłek, zanim ktokolwiek inny się dowie?).

jeśli go nie masz, pobierz go tutaj.

w ustawieniach podstawowych zaznacz „Indeksuj wszystkie subdomeny”. Możesz również zaznaczyć ” Follow Internal 'nofollow'”, ponieważ niektóre środowiska testowe mogą to mieć.

po zakończeniu skanowania przejrzyj listę, aby sprawdzić, czy są jakieś wewnętrzne linki do stron testowych. Natknąłem się na to niedawno, gdzie pojawiła się nowa strona Drupala, ale wszystkie wewnętrzne linki w postach na blogu wskazujące na subdomenę beta:

Screaming Frog Crawl

możesz następnie kliknąć każdy testowy adres URL i kliknąć linki na dole, aby znaleźć obrażający wewnętrzny link ze strony live do testowej. W tym przypadku zmieniłem link kontaktowy na mapie witryny, aby wskazać testowy adres URL:

Screaming Frog linki wewnętrzne

po zauważeniu zmieniaj i przeszukiwaj, aż nie będzie więcej linków wewnętrznych zabierających gości gdzie indziej. Jeśli używasz WordPress, użyj wtyczki Szukaj / Zamień, aby znaleźć wszystkie testURLs i zastąpić je na żywo.

5) Sprawdź nazwy hostów Google Analytics

jeśli Twoja witryna testowa ma zainstalowany ten sam kod śledzenia konta Google Analytics, co Twoja witryna aktywna, będziesz mógł to zauważyć, jeśli przejdziesz do sekcji takiej jak „zachowanie” – > „zawartość witryny” – > „AllPages” i wybierz” Hostname ” jako dodatkowy wymiar:

nazwy hostów Google Analytics

Ponadto można również filtrować dane, wykluczając z raportu wszystkie wizyty w domenie głównej, co spowoduje pozostawienie wszystkich innych instancji na liście. Oprócz stron testowych, możesz również odkryć Spam ga uruchamiany na stronie 3rdparty:

Google Analytics wyklucza nazwę hosta

istnieją plusy i minusy posiadania tego samego IDrunning śledzenia GA zarówno w środowiskach live, jak i testowych, ale osobiście widzę, że noreason ma oddzielne konta i zamiast tego tworzy wiele widoków na jednym koncie. W przypadku witryny na żywo skonfiguruj filtr, aby uwzględniał tylko ruch do nazwy hosta na żywo i vice versafor witryny testowej.

jak usunąć i zapobiec Zindeksowaniu witryny testowej

więc odkryłeś swoją witrynę testową w indeksie za pomocą jednej z powyższych technik lub chcesz się upewnić, że nie nastąpi to w pierwszej kolejności. W tym pomoże:

1) Usuń adresy URL przez GSC

jeśli Twoja witryna jest indeksowana, niezależnie od tego, czy generuje ruch, najlepiej ją usunąć. Aby to zrobić, możesz użyć sekcji ” Usuń adresy URL „z” starego ” SGSC.

zauważ, że to nie zadziała na poziomie właściwości domeny, ponieważ nie są one zaspokajane w starych GSC. Aby to zrobić, musisz skonfigurować skonfiguruj właściwość dla pojedynczej domeny testowej.

po skonfigurowaniu „przejdź do starej wersji” i przejdź do „indeksu Google”-> „Usuń adresy URL”. Stąd wybierz „tymczasowo” i wprowadź jako pojedynczy ukośnik jako adres URL, który chcesz zablokować, co spowoduje wysłanie całej witryny do usunięcia:

GSC Usuń adresy URL

spowoduje to usunięcie witryny z serwerów SERP przez 90 dni, aby upewnić się, że nie wróci, musisz podjąć dalsze kroki. Wystarczy jedna z poniższych czynności (i powinna być wykonana niezależnie od tego, czy jesteś w stanie usunąć przez GSC)

2) Ustaw tag robotów na noindex na stronie testowej

poproś programistów o upewnienie się, że podczas uruchamiania na domenie testowej każda strona w całej witrynie generuje tag robots noindex:

<meta name="robots" content="noindex" />

jeśli Twoja witryna to WordPress, możesz to ustawić za pomocą „Ustawienia” – > „czytanie” i wybierając „Zniechęć Wyszukiwarki do indeksowania tej witryny”:

Ustawienia odczytu WordPress

niezależnie od kodu lub ustawień, których używasz, aby zapobiec indeksowaniu witryny testowej, musisz upewnić się, że nie jest ona migrowana do aktywnej witryny, gdy newcontent lub funkcjonalność są aktywne. Ustawienia witryny testowej uruchamiane są jednym z najczęstszych i najbardziej pewnych fireways, które zakłócają widoczność witryny na żywo.

3) hasło Chroń swoją witrynę testową

z Panelu sterowania sieci web lub za pośrednictwem serwera, hasswordchroń katalog, w którym znajduje się witryna testowa. Istnieje wiele sposobów, aby to zrobić – najlepiej jest poprosić firmę hostingową lub programistów o skonfigurowanie tego, lub istnieje wiele dobrych zasobów, które pokażą Ci, jak to zrobić, takich jak:

https://one-docs.com/tools/basic-auth

po zablokowaniu powinieneś zobaczyć okno alertu, gdy próbujesz uzyskać dostęp do witryny testowej:

https://alitis.co.uk/

strona zabezpieczona hasłem

zapobiegnie to indeksowaniu i indeksowaniu strony przez wyszukiwarki.

4) Usuń witrynę i zwróć status strony 410

jeśli nie potrzebujesz już swojej witryny testowej, możesz ją po prostu usunąć. Gdy Wyszukiwarki spróbują odwiedzić strony na dłużej, zobaczą, że strony są usuwane. Domyślnie uszkodzona strona zwróci status404 – „nie znaleziono”)-podczas gdy spowoduje to dezindeksowanie witryny w czasie, zajmie to trochę czasu, ponieważ będą kolejne wizyty, aby sprawdzić, czy uszkodzona strona powróciła.

zamiast tego ustaw status na 410 („permanentnie Gone”), który zwróci następujący komunikat:

 Status 410

aby to zrobić w całej domenie, Usuń witrynę i pozostawić .plik htaccess w miejscu za pomocą następującego polecenia:

Redirect 410 /

zapewni to, że strona zostanie deindeksowana przy pierwszym zapytaniu (lub przynajmniej szybciej niż 404)

5) Blokuj przez roboty.txt

możesz zablokować indeksowanie strony, implementując następujące polecenia w robotach witryny testowej.plik txt:

User-agent: *Disallow: /

zapobiegnie to przeszukiwaniu strony przez boty. Uwaga: jeśli Twoja witryna testowa jest obecnie indeksowana i poszedłeś drogą dodawania tagów noindex do witryny, nie dodawaj robotów.polecenie txt w dopóki wszystkie strony nie zostaną zindeksowane. Jeśli dodasz to, zanim wszystkie strony zostaną zindeksowane, zapobiegnie to ich indeksowaniu i wykryciu znacznika robotów, dzięki czemu strony pozostaną indeksowane.

i to wszystko-mam nadzieję, że powyższe wystarczy, aby znaleźć, deindex i zapobiec ponownemu indeksowaniu testu.

ale pamiętaj

nie mogę tego wystarczająco podkreślić – jeśli zdecydujesz się na implementację meta tagów lub robotów.txt, który uniemożliwia wszystkim botom indeksowanie i przeglądanie witryny testowej, upewnij się, że po uruchomieniu witryny testowej nie przenosisz tych konfiguracji do Witryny na żywo, ponieważ ryzykujesz całkowitą utratę widoczności.

i wszyscy tam byliśmy, prawda?

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.