27 ledna, 2022

Organic Digital Blog

Toto je blogový příspěvek na dvou (velkých) stránkách-živých a stagingových webech:

Část 1: Jak zkontrolovat, zda Google indexoval váš živý web

Část 2: Jak zkontrolovat, zda Google indexoval váš Staging / testovací Web

Jak mohu zjistit, zda Google indexoval můj živý web?

existují dva jednoduché způsoby, jak zjistit:

použijte web: operátor dotazu

Vyhledejte svou doménu na Googlu následovně: site:organicdigital.co
pokud je váš web indexován, zobrazí se seznam stránek:

operátor dotazu na web

pokud nejsou vráceny žádné výsledky, můžete mít problémy:

operátor dotazu na web bez výsledků

poznámka: na větších stránkách, zatímco uvidíte aproximaci toho, kolik stránek je indexováno, budete moci skutečně vidět asi 300 z nich v SERP.

zkontrolujte sekci pokrytí Google Search Console

každý web by měl mít účet GSC, je to podle mého názoru největší nástroj, který může vlastník webu nebo SEO použít, a poskytuje velké množství informací o organické viditelnosti a výkonu vašeho webu. Pokud ji nemáte, přejděte na oficiální stránku GSC, pokud tak učiníte, přejděte do sekce pokrytí, kde můžete vidět rozpis:

  • chyby při procházení stránek
  • stránky, které jsou blokovány
  • platné indexované stránky
  • stránky, které jsou vyloučeny
zpráva o pokrytí GSC

pokud má váš web problémy, budou tyto problémy hlášeny pod položkou „chyba “ nebo“ vyloučeno “ – a můžete zjistit důvody, proč nejsou zahrnuty do vyhledávání, jako například:

  • alternativní stránka se správnou kanonickou značkou
  • procházení-v současné době není indexováno
  • duplicitní bez uživatelem vybrané kanonické
  • vyloučeno značkou „noindex“
  • procházení anomálie
  • nenalezeno (404)

pokud se stránky vašeho webu nezobrazují v sekci“ platné“, můžete mít problémy.

použijte funkci URL Inspect v GSC

pokud jsou některé stránky indexovány a jiné ne, můžete také použít nástroj URL Inspect, abyste zjistili, zda Google dokáže procházet a indexovat konkrétní stránku, nebo zda existují jiné problémy, které jí brání v zobrazení ve Vyhledávání – to je v horním menu a umožní vám zkontrolovat jednu adresu URL najednou:

nástroj GSC URL Inspect

pokud je vaše stránka indexována, poskytne následující podrobnosti:

GSC indexovaná Data stránky

pokud ne, získáte tento stav, který ukazuje, kdy se Google pokusil procházet stránku, a nějaký pohled na to, proč není indexována:

GSC Neindexovaná data stránek

proč Google nebude procházet nebo indexovat mé stránky?

obecně existují dva důvody, proč stránku nelze procházet ani indexovat. Ty jsou obzvláště běžné, když byl spuštěn nebo migrován nový web, a nastavení z vývojového prostředí byla přenesena.

roboti.txt zakázat direktivu

to je místo, kde jsou stránky, adresář nebo stránka blokovány před procházením roboty.txt soubor.

každý web by měl mít roboty.txt soubor, To se používá k dát direktivy pro vyhledávače o tom, jaké části vašeho webu by měl a neměl být procházel.

pokud ji máte, najdete ji v kořenovém adresáři pod názvem robots.txt

https://organicdigital.co/robots.txt

směrnice, které by zabránily procházení webu, adresáře nebo stránky, by byly následující:

Disallow: /Disallow: /directory/Disallow: /specific_page.html

můžete také použít Screaming Frog k pokusu o procházení webu. Pokud to není možné, zobrazí se následující data procházení:

Screaming Frog Robots Issue

existuje mnoho platných důvodů pro blokování vyhledávačů pomocí této směrnice, ale pokud vidíte něco v souladu s výše uvedeným, musíte je změnit, abyste umožnili procházení vašeho webu.

jak změnit roboty.txt soubor ručně

pokud máte přístup k FTP nebo máte po ruce vývojáře, můžete roboty ručně změnit.txt soubor odstranit všechny směrnice, které blokují váš web z procházení.

obecně to provede následující příkaz:

User-agent: *Allow: /

jak změnit roboty.txt soubor v WordPress

pokud máte nainstalovaný plugin Yoast, můžete soubor upravit přímo pomocí nástroje – > sekce Editor souborů-pokyny, jak to provést, naleznete na tomto odkazu.

Yoast robots.txt Editor

jak změnit roboty.txt soubor v Magento

přejít na obsah – > Design – > konfigurace, klikněte do příslušného zobrazení obchodu a upravte „roboty vyhledávačů“

nastavení robotů Magento

Meta Tag robotů je kromě robotů nastaven na noindex a/nebo Nofollow

.txt soubor, můžete také zkontrolovat metaznačku robotů ve zdrojovém kódu vašeho webu a zajistit, aby to nebránilo vyhledávačům v procházení.

pokud zkontrolujete zdrojový kód, pokud nevidíte metaznačku robotů nebo je nastavena na „index“ nebo „index, následujte“ – pak to není problém. Pokud však uvidíte, že se říká „noindex“, znamená to, že vaše stránka může být procházena, ale nebude indexována:

Noindex Tag ve zdrojovém kódu

znovu můžete použít Screaming Frog ke kontrole stavu značek robotů na vašem webu. Pokud je vaše značka nastavena na noindex, nofollow se nedostane za domovskou stránku:

Screaming Frog Robots Noindex/Nofllow Issue

pokud je nastaven pouze na noindex, celý web lze stále procházet, ale ne indexovat:

Screaming Frog Robots noindex / Nofllow Issue

jak změnit soubor Meta tagů robotů ručně

znovu otevřete stránku/šablonu svého webu přímo a nahraďte / přidejte následující značku:

<meta name="robots" content="index, follow">

jak změnit metaznačku robotů v WordPress

existují dva způsoby, jak to udělat – pokud je problém na celém webu, přejděte na Nastavení – > čtení a zajistěte, aby „odradit vyhledávače od indexování tohoto webu“ nebylo zaškrtnuto:

 WordPress Noindex Nastavení webu

možná se mýlím, ale myslím, že jediný způsob, jak lze konkrétní stránku nebo příspěvek nastavit na index nebo noindex, pokud používáte Yoast, tak přejděte na stránku / příspěvek a zkontrolujte následující nastavení na úpatí stránky:

nastavení Yoast NoIndex

jak změnit metaznačku robotů v Magento

stejně jako dříve přejděte na obsah – > Design – > konfigurace, klikněte do příslušného zobrazení obchodu a změňte rozbalovací volbu “ výchozí roboty:

 roboti Meta v Magentu

Moje stránky / Stránky mohou být procházeny a indexovány společností Google-Co dál?

jakmile jste spokojeni, že vaše roboty.soubor txt a metaznačka robotů jsou správné, můžete znovu použít nástroj Inspect URL ke kontrole stránky a požádat, aby Google procházel a indexoval vaši stránku:

GSC Request indexování

mám také účet Bing Webmaster!

myslíte? Myslel jsem, že jsem jediný. Ok, můžete dělat skoro všechny stejné věci napsané v tomto článku v Bing Webmaster Tools, jak můžete v GSC-takže zkontrolujte URL a žádost indexování:

Bing Request indexování

Udělal jsem to všechno a moje stránky / stránky stále nejsou indexovány!

v takovém případě potřebujete hlubší ponoření do konfigurace a funkčnosti vašeho webu, abyste zjistili, jaké další problémy mohou být. Mohu vám pomoci, pokud vyplníte kontaktní formulář níže.

Část 2:

někdo, kdo si právě uvědomil svůj testovací Web, je indexován

jak: zkontrolujte, zda je Váš pracovní Web indexován společností Google

v životě jsou jisté pouze tři věci: smrt, daně a indexování vašeho testovacího webu společností Google.

velmi zřídka narazíte na spuštění nového webu, aniž byste si v určitém okamžiku uvědomili, že pracovní server byl ponechán otevřený robotům, aby přišli procházet a indexovat.

není to nutně konec světa, pokud vyhledávač indexoval testovací web, protože je to poměrně snadné vyřešit – ale pokud dlouhodobě používáte testovací prostředí, abyste vyvinuli nové funkce spolu s livesite, musíte se ujistit, že je chráněno správně co nejdříve, abyste se vyhnuli problémům s duplicitním obsahem a zajistili, že lidé v reálném životě nenavštěvují a interagují (tj. zkuste něco koupit).

jsem dříve vývojář a pravděpodobně jsem udělal tyto chyby sám více než jednou, ale tehdy jsem neměl SEO, že je bolest v zadku po celou dobu poukazující na tyto věci (tehdy, brožura staré školy-přijĎte-weboví designéři, kteří nerozuměli omezení tabulek a inline CSS, kde bolest v zadku).

následující techniky jsou všechny vyzkoušené a testované metodyže jsem použil k identifikaci těchto problémů ve volné přírodě, i když k ochraně identity mých klientů a jejich vývojářů jsem se rozhodl nastavit několik testovacích webů pomocí vlastního obsahu webových stránek, abych ilustroval, co musíte udělat, a to:

test.organicdigital.co
alitis.co.uk
ačkoli v době, kdy si to přečtete, budu se řídit svou vlastní radou a vezmu je dolů, potřebuji veškerou viditelnost, kterou mohu získat, poslední věc, kterou potřebuji, jsou indexované testovací weby, které mě drží zpátky.

1) vlastnost domény Google Search Console (GSC)

jednou z velkých věcí nového GSC je, že můžete nastavit vlastnosti domény, které vám poskytnou klíčové informace o všech subdoménách spojených s vaším webem-na HTTP i HTTPS. Chcete-li to nastavit, jednoduše vyberte možnost domény při přidávání vlastnosti (musíte také provést potenciálně ne tak jednoduchý úkol přidání záznamu TXT do DNS vaší domény):

GSC Domain Property

existuje celá řada důvodů, proč je vlastnost domény užitečná, v tomto případě je to proto, že pokud máte testovací web nastaven na subdoméně a vytváří dojem a kliknutí při vyhledávání, můžete si to všimnout v sekci „Výkon“ filtrováním nebo objednáním stránek:

údaje o výkonu GSC

kromě toho byste měli také zkontrolovat sekci “ pokrytí – – v některých případech Google indexuje váš obsah:

indexovaná Data GSC

zatímco v jiných případech zjistí, že máte na svém místě duplikát obsahu, a laskavě se zdrží indexování, v takovém případě byste jej našli v sekci „duplikovat, Google si vybral jiný kanonický než uživatel“:

GSC Different Canonical

i když je tomu tak, měli byste se stále snažit zajistit, aby nedošlo k procházení vpřed.

2) Zkontrolujte Google SERP pomocí link Clump

pokud nemáte přístup k vlastnostem domény GSC nebo k jakémukoli přístupu GSC (pokud ne, proč ne?) pak můžete zkontrolovat SERP a zjistit, zda se do indexu dostaly nějaké testovací adresy URL.

Toto je také užitečná technika při nadhazování pro nové podnikání, jaký lepší způsob, jak získat potenciálního klienta, než aby jejich interní vývojový tým orexternal vypadal, jako by se dicing s viditelností vyhledávání deathby umožněním, aby se to stalo na prvním místě, a že jste zde, abyste zachránili den.

kroky jsou následující:

i) nainstalujte rozšíření LinkClump Google Chrome, které vám umožní zkopírovat a vložit více adres URL ze stránky někam užitečnější, jako je Excel.

ii) změňte nastavení shluku odkazů následovně:

nastavení shluku odkazů

nejdůležitější je akce „zkopírována do schránky“– poslední věc, kterou se zde chcete stát, je otevřít až sto adres URL najednou.

iii) přejděte na svůj oblíbený (nebo místní) Google TLD, klikněte na „nastavení“, které byste měli vidět v pravém dolním rohu stránky, a vyberte „Nastavení vyhledávání“, kde můžete nastavit“ výsledky na stránku “ na 100.

iv) vraťte se na domovskou stránku Google a použijte“ site: „queryoperator a připojte svou doménu. Pokud používáte www nebo podobné, odstraňte to-takže příkaz by byl následující:
site:organicdigital.co

zobrazí se vzorek až 300 adres URL, které společnost Google v současné době indexuje ve všech subdoménách. I když byste mohli ručně zkontrolovat každý výsledek na místě nepoctivých webů:

testovací místo v SERPs

považuji za mnohem rychlejší a snazší kliknout pravým tlačítkem a přetáhnout celou cestu do dolní části stránky. Youwill vědět, zda Link Clump funguje, jak uvidíte následující vyskytují todenote odkazy jsou vybrány a zkopírovány:

odkaz shluk v akci
adresy URL v Excelu

opakujte toto v SERP 2 a 3, pokud jsou k dispozici, a jakmile jsou všechny položky vloženy do Excelu, použijte řazení podle A-Z pro snadnou identifikaci indexedcontent ve všech relevantních subdoménách.

3) Vyhledejte Text jedinečný pro váš web

výše uvedené metody fungují, pokud je váš testovací web hostován na asubdomain ve stejné doméně jako váš živý web. Pokud se však vaše testovací místo nachází jinde, např. test.webdevcompany.com pak nebudou fungovat. V takovém případě tato nebo následující metodamocně.

najděte nějaký obsah, o kterém si myslíte, že je pro váš web jedinečný – v mém případě jsem šel s linií: „Vylepšete organickou viditelnost a provoz Vašeho webu“ – pak to vyhledejte v uvozovkách. Pokud byl testovací web obsahující tento obsah indexován, toto vyhledávání by jej mělo odhalit:

testovací weby v SERP znovu

jak vidíte, zobrazí se domovské stránky na hlavním webu, testovací subdoména a samostatná testovací doména. Můžete také nechtěně spatřit konkurenta, který ošizil váš obsah. Někteří by to brali jako kompliment, jiní by vydávali DMCA – Je to na vás, ale poslední věc, kterou chcete, je někdo, kdo vás překoná vlastní kopií.

4) procházejte web pomocí Screaming Frog

předpokládám, že jste do SEO, a proto používejte Screaming Frog. Pokud některá z těchto odpovědí není, pak se dobře udělalo, že jste se dostali tak daleko do tohoto článku(dovolte mi hádat, že jste vývojář, který upustil bollock a snaží se zakrýt zadek, než to zjistí někdo jiný?).

pokud ji nemáte, stáhněte si ji zde.

v základním nastavení zaškrtněte „procházet všechny subdomény“. Můžete také zaškrtnout „sledovat interní ‚nofollow'“, protože některá testovací prostředí to mohou mít na svém místě.

jakmile je procházení dokončeno, prohlédněte si seznam a zjistěte, zda existují nějaké interní odkazy na testovací weby. Nedávno jsem narazil na to, kde byl spuštěn nový web Drupal, ale se všemi interními odkazy v blogových příspěvcích směřujících k beta subdoméně:

Screaming Frog Crawl

poté můžete kliknout na každou testovací adresu URL a kliknout na InLinks atthe dole a najít urážlivý interní odkaz z webu live to test. V tomto případě jsem změnil odkaz Kontaktujte nás na sitemap tak, aby odkazoval na testovací adresu URL:

Screaming Frog interní odkazy

jakmile si všiml, změnit a znovu procházet, dokud se nejedná o žádné další interní odkazy, které návštěvníky zavedou jinam. Pokud používáte WordPress, použijte plugin pro vyhledávání/nahrazení, abyste našli všechny testURLs a nahraďte je živým.

5) Zkontrolujte názvy hostitelů Google Analytics

pokud má váš testovací web nainstalován stejný kód účtu Google Analytics jako váš živý web, budete to moci spatřit, pokud přejdete do sekce, jako je „chování“ -> „obsah webu“ -> „AllPages“ a jako sekundární rozměr vyberte „Hostname“ :

názvy hostitelů Google Analytics

kromě toho můžete data dále filtrovat tím, že ze zprávy vyloučíte všechny návštěvy hlavní domény, což ponechá všechnyostatní instance v seznamu. Kromě testovacích webů, můžete také odhalit Spam ga spuštěný na webu 3rdparty:

Google Analytics vyloučit Hostname

existují klady a zápory, které mají stejný ga sledování IDrunning na obou vašich živých a testovacích prostředích, ale osobně, vidím noreason mít samostatné účty a místo toho by vytvořit více pohledů withinyour jeden účet. U živého webu nastavte filtr tak, aby zahrnoval pouze provoz na živý název hostitele a vice versafor testovací web.

jak odstranit a zabránit indexování vašeho testovacího webu

takže jste objevili svůj testovací web v indexu pomocí jedné z výše uvedených technik, nebo se chcete ujistit, že se to nestane na prvním místě. Následující vám pomohou:

1) Odstraňte adresy URL přes GSC

pokud je váš web indexován, ať už generuje provoz nebone, je nejlepší jej odstranit. K tomu můžete použít sekci „Odebrat adresy URL „ze“ starého “ GSC.

Všimněte si, že to nebude fungovat na úrovni vlastnictví domény, protože tyto vlastnosti nejsou zajištěny ve starém GSC. Chcete-li to provést, musíte nastavit nastavit vlastnost pro jednotlivé testdoménu.

po nastavení přejděte na starou verzi a přejděte na „Index Google“ – > „Odebrat adresy URL“. Odtud vyberte „TemporarilyHide“ a zadejte jako jediné lomítko jako adresu URL, kterou chcete zablokovat a která odešle celý váš web k odstranění:

GSC odstranit adresy URL

tím se váš web odstraní ze SERP po dobu 90 dnů, abyste se ujistili, že se nevrátí, musíte podniknout další kroky. Stačí jedna z následujících možností (a měla by býtbýt proveden bez ohledu na to, zda jste schopni odstranit pomocí GSC)

2) nastavte značku robotů na noindex na testovacím místě

požádejte vývojáře, aby zajistili, že při spuštění na testovací doméně každá stránka na webu vygeneruje značku robotů noindex:

<meta name="robots" content="noindex" />

pokud je váš web WordPress, můžete jej nastavit pomocí „nastavení“ – > „čtení“ a výběrem „odradit vyhledávače od indexování tohoto webu“:

 WordPress Reading Settings

bez ohledu na kód nebo nastavení, které používáte k zabránění indexování testovacího webu, musíte zajistit, aby nedošlo k migraci na živý web, když je newcontent nebo funkčnost spuštěna. Nastavení testovacího webu je jedním z nejběžnějších a nejjistějších způsobů, jak zviditelnit váš živý web.

3) heslo Chraňte svůj testovací Web

z ovládacího panelu webu nebo prostřednictvím serveru, passwordprotect adresář, ve kterém je váš testovací web umístěn. Existuje mnoho způsobů, jak to udělat – bestbet je požádat hostingovou společnost nebo vývojáře, aby to nakonfigurovali, nebo, existuje spousta dobrých zdrojů, které vám ukážou, jak to udělat, například:

https://one-docs.com/tools/basic-auth

po zablokování byste měli při pokusu o přístup k testovacímu webu zobrazit výstražné pole:

https://alitis.co.uk/

heslo chráněné stránky

to zabrání vyhledávačům v procházení a indexování stránky.

4) Smazat stav webu a vrátit stav stránky 410

pokud již nepotřebujete testovací web, můžete jej jednodušeodstranit. Když se vyhledávače snažínavštívit stránky na delší život, uvidí, že stránky jsou smazány. Ve výchozím nastavení se nefunkční stránka vrátí status404 („nenalezeno“) – i když to bude mít stránky de-indexovány v čase, bude to chvíli trvat, protože tam bude následné návštěvy zjistit, zda rozbité stránky se vrátil.

místo toho nastavte stav na 410 („trvale pryč“), který vrátí následující zprávu:

 stav 410

Chcete – li to provést v celé doméně, odstraňte web anechte .soubor htaccess na místě s následujícím příkazem:

Redirect 410 /

to zajistí, že web bude deindexován při prvním dotazování (nebo alespoň rychleji než 404)

5) blok přes roboty.txt

můžete zablokovat procházení webu implementací následujících příkazů v robotech testovacího webu.txt soubor:

User-agent: *Disallow: /

to zabrání robotům v procházení webu. Poznámka: pokud je váš testovací web aktuálně indexován a vy jste se vydali cestou přidání značek noindex na web, nepřidávejte roboty.příkaz txt, dokud nebudou všechny stránky deindexovány. Pokud to přidáte dříve, než budou všechny stránky deindexovány, zabrání to jejich procházení a detekci značky robotů, takže stránky zůstanou indexovány.

a to je vše-doufám, že výše uvedené bude stačit, abyste našli, deindex a zabránili tomu, aby se váš test znovu plazil.

ale nezapomeňte

nemohu to dostatečně zdůraznit – pokud se rozhodnete implementovatrobots meta tagy nebo roboty.txt, který zakazuje všem robotům procházet a kontrolovat testovací web, ujistěte se, že při spuštění testovacího webu nepřenášíte tyto konfigurace na živý web, protože riskujete, že ztratíte svou organickou viditelnost úplně.

a všichni jsme tam byli, že?

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.