27 tammikuun, 2022

The Organic Digital Blog

tämä on blogikirjoitus kahdella (suurella) sivulla-live-ja staging sites:

Osa 1: Miten tarkistaa, onko Google indeksoinut Live-sivustosi

Osa 2: Miten tarkistaa, onko Google indeksoinut Staging/Test-sivustosi

Mistä tiedän, onko Google indeksoinut Live-sivustoni?

on kaksi yksinkertaista tapaa selvittää:

käytä sivustoa: kyselyoperaattori

Etsi verkkotunnustasi Googlesta seuraavasti:site: organicdigital.co
jos sivustosi on indeksoitu, näet luettelon sivuista:

sivuston kyselyn operaattori

jos tuloksia ei palauteta, sinulla voi olla ongelmia:

sivuston kyselyn operaattori ilman tuloksia

Huomautus: isommilla sivustoilla näet likiarvon siitä, kuinka monta sivua on indeksoitu, mutta voit itse asiassa nähdä SERP-sivustoissa vain noin 300 sivua.

Tarkista Google Search Consolen peittoalue

jokaisella verkkosivustolla pitäisi olla GSC-tili, se on mielestäni suurin työkalu, jota sivuston omistaja tai SEO voi käyttää, ja antaa runsaasti tietoa sivustosi orgaanisesta näkyvyydestä ja suorituskyvystä. Jos sinulla ei ole sellaista, suuntaa GSC: n viralliselle sivulle, jos sinulla on, Siirry Coverage-osioon, jossa näet jaottelun:

  • sivuja ryömittäessä havaitut virheet
  • sivuja, jotka on estetty
  • kelvolliset indeksoidut sivut
  • sivuja, jotka on suljettu pois
GSC Coverage Report

jos sivustossasi on ongelmia, ne ilmoitetaan kohdassa ”virhe” tai ”poissuljettu” – ja voit selvittää syyt, miksi niitä ei sisällytetä hakuun, kuten:

  • vaihtoehtoinen sivu, jolla on asianmukainen kanoninen merkintä
  • Ryömitty-ei tällä hetkellä indeksoitu
  • kaksoiskappale ilman käyttäjän valitsemaa kanonista
  • suljettu pois ”noindex” – merkinnällä
  • Ryömintäpoikkeama
  • ei löytynyt (404)

jos sivustosi sivut eivät näy ”voimassa” – osiossa, sinulla voi olla ongelmia.

käytä URL-Tarkastustoimintoa pääsihteeristössä

jos jotkin sivut on indeksoitu ja toiset eivät, Voit myös tarkistaa URL-Tarkastustyökalulla, pystyykö Google indeksoimaan ja indeksoimaan tietyn sivun, tai jos on muita ongelmia, jotka estävät sen ilmestymisen hakuun – tämä on ylävalikossa ja voit tarkistaa yhden URL-osoitteen kerrallaan:

GSC URL tarkasta työkalu

jos sivu on indeksoitu, se antaa lisätietoja seuraavasti:

 GSC indeksoitu Sivuaineisto

jos ei, saat tämän tilan, joka näyttää, milloin Google on yrittänyt indeksoida sivua ja jonkin verran tietoa siitä, miksi sitä ei ole indeksoitu:

GSC Indeksoimattomat sivutiedot

miksi Google ei indeksoi tai indeksoi sivujani?

on yleensä kaksi syytä, miksi sivua ei voi joko ryömiä tai indeksoida. Nämä ovat erityisen yleisiä, kun uusi sivusto on käynnistetty tai siirretty, ja asetukset kehitysympäristöstä on siirretty.

robotit.txt Disallow Directive

This is where the site, a directory, or a page are bloked from being crawled by The robots.txt-tiedosto.

jokaisella työmaalla pitäisi olla robotti.txt-tiedosto, Tätä käytetään antamaan direktiivejä hakukoneille siitä, mitä osia sivustosi pitäisi ja ei pitäisi indeksoida.

jos sinulla on sellainen, löydät sen juurihakemistostasi nimellä robots.txt

https://organicdigital.co/robots.txt

direktiivit, jotka estäisivät sivuston, hakemiston tai sivun ryömimisen, olisivat seuraavat:

Disallow: /Disallow: /directory/Disallow: /specific_page.html

voit myös yrittää Screaming sammakon avulla ryömiä sivustollasi. Jos se ei pysty siihen, näet seuraavat ryömintätiedot:

Screaming Frog Robots Issue

on monia päteviä syitä estää hakukoneita käyttämällä tätä direktiiviä, mutta jos näet jotain edellä mainitun suuntaista, sinun täytyy muuttaa näitä mahdollistaaksesi sivustosi ryömimisen.

miten robottia muutetaan.txt tiedosto manuaalisesti

jos sinulla on pääsy FTP tai on kehittäjä käsillä, voit manuaalisesti muuttaa robotteja.txt tiedosto poistaa direktiivit, jotka estävät sivuston crawl.

yleensä seuraava komento tekee näin:

User-agent: *Allow: /

Miten muuttaa robotteja.txt-tiedosto WordPressissä

jos sinulla on Yoast-lisäosa asennettuna, voit muokata tiedostoasi suoraan tools – > File Editor-osiossa-seuraa tästä linkistä ohjeita tämän tekemiseen.

 Yoast robots.txt Editor

How To Amend a Robots.txt-tiedosto magentossa

Siirry sisältöön – > suunnittelu – > konfigurointi, klikkaa asiaankuuluvaan Myymälänäkymään ja muokkaa ”hakukonerobotit”

Magenton robottien Asetukset

robottien Meta-tagiksi on asetettu robottien lisäksi Noindex ja/tai nofollow

.txt tiedosto, Voit myös tarkistaa robotit meta tag sisällä sivuston lähdekoodi ja varmistaa, että se ei estä hakukoneita indeksoimasta.

jos tarkistat lähdekoodisi, jos et näe robottien meta-tagia, tai, se on asetettu ”index ”tai” index,follow ” – niin tämä ei ole ongelma. Kuitenkin, jos näet, että siinä lukee ”noindex”, tämä tarkoittaa, että sivu voidaan indeksoida, mutta sitä ei indeksoida.:

 noindex Tag lähdekoodissa

taas Screaming Frog-ohjelmalla voi tarkistaa robottien tagien tilan sivustollaan. Jos tagisi on asetettu noindexiin, nofollow se ei pääse kotisivun ulkopuolelle:

Screaming Frog Robots Noindex / Nofllow Issue

jos se on juuri asetettu noindexiin, Koko sivusto voidaan silti indeksoida, mutta ei indeksoida:

Screaming Frog Robots Noindex / Nofllow Issue

How To Amend The Robots Meta Tag File Manually

Again, access your site ’s page/template directly and replace / add the following tag:

<meta name="robots" content="index, follow">

Miten muuttaa Robots Meta Tag WordPress

on olemassa kaksi tapaa tehdä tämä – jos ongelma on sivuston laajuinen siirry Asetukset – > lukeminen ja varmistaa” estää hakukoneita indeksoimasta tämän sivuston ” ei ole rastittu:

 WordPress Noindex Site Setting

I may be wrong, but I think the only way a specific page or post can be set to index or noindex if you are using Yoast, so go to page/post and check the following setting at the foot of the page:

Yoast NoIndex Setting

How To Amend Robots Meta Tag in Magento

kuten ennenkin, siirry Content – > Design – > Configuration, napsauta asiaankuuluvaa Store-näkymää ja muuta” Default Robots ” – pudotusvalintaa:

 robotit Meta Magentossa

sivustoni / sivuni voi indeksoida Googlella-mitä seuraavaksi?

kun on tyytyväinen, että robotit.txt tiedosto ja robotit meta tag ovat oikein, voit jälleen käyttää tarkastaa URL työkalu tarkistaa sivun ja pyytää, että Google indeksoi ja indeksoi sivun:

GSC Request Indexing

Minulla on myös Bing Webmaster-tili!

Tiedätkö? Luulin olevani ainoa. Ok, voit tehdä melko paljon kaikki samat asiat kirjoitettu tässä artikkelissa Bing Webmaster Tools kuin voit GSC-niin tarkastaa URL ja pyytää indeksointi:

Bing Request Indexing

I ’ ve Done All This and My Site / Pages Still are not Indexed!

tässä tapauksessa, sinun täytyy syventää kokoonpanoa ja toiminnallisuutta sivustosi tunnistaa, mitä muita ongelmia voisi olla. Voin auttaa sinua, jos täytät yhteydenottolomakkeen alla.

Osa 2:

joku, joka on juuri oivaltanut Testipaikkansa, on indeksoitu

Miten: Tarkista, onko Lavastuspaikkasi Googlen Indeksoima

vain kolme asiaa on varmaa elämässä: kuolema, verot ja Testipaikkasi joutuminen Googlen indeksoimaksi.

hyvin harvoin törmää uuden sivuston lanseeraukseen ilman, että jossain vaiheessa tajuaa, että lavastuspalvelin on jätetty avoimeksi botteille, jotka tulevat ryömimään ja indeksoimaan.

ei ole välttämättä maailmanloppu, jos hakukone haluaa indeksoida testisivuston, koska se on melko helppo ratkaista – mutta jos testiympäristöä käytetään pitkällä aikavälillä uusien toimintojen kehittämiseen livesiten rinnalle, on varmistettava, että se on suojattu oikein mahdollisimman varhaisessa vaiheessa päällekkäisten sisältöongelmien välttämiseksi ja sen varmistamiseksi, että tosielämän ihmiset eivät vieraile ja interact (ts.yritä ostaa jotain).

olen entinen kehittäjä, ja luultavasti tehnyt nämä virheet itse useammin kuin kerran, mutta silloin minulla ei ollut SEO on kipu perseessäni koko ajan osoittamassa näitä asioita (tuolloin, old school brochure-come-web-suunnittelijat, jotka eivät ymmärtäneet taulukoiden rajoittamista ja inline CSS, jossa kipu perseessäni).

seuraavat tekniikat ovat kaikki kokeiltuja menetelmiä, joita olen käyttänyt tunnistaakseni nämä ongelmat luonnossa, vaikka suojellakseni asiakkaideni ja heidän kehittäjiensä identiteettiä, olen tehnyt epäitsekkään päätöksen perustaa pari testisivustoa omien verkkosivujeni sisällön avulla havainnollistaakseni, mitä sinun on tehtävä, nämä ovat:

test.organicdigital.co
alitis.co.uk
vaikka tämän lukiessa olen noudattanut omia neuvojani ja ottanut nämä ylös, tarvitsen kaiken näkyvyyden mitä saan, viimeinen asia mitä tarvitsen ovat indeksoidut testipaikat, jotka pidättelevät minua.

1) Google Search Console (GSC) Domain Property

yksi uuden GSC: n hienoista puolista on se, että voit määrittää domain – ominaisuudet, jotka antavat sinulle keskeiset tiedot kaikista verkkosivustoosi liittyvistä aliverkkotunnuksista-sekä HTTP-että HTTPS-palvelussa. Voit määrittää tämän, valitse verkkotunnus vaihtoehto, kun lisäät ominaisuuden (sinun täytyy myös suorittaa mahdollisesti ei niin yksinkertainen tehtävä lisätä txt tietueeseen verkkotunnuksen DNS):

 GSC Domain Property

on olemassa koko joukko syitä, miksi verkkotunnuksen ominaisuus on hyödyllinen, tässä tapauksessa se johtuu siitä, että jos testisivusi on perustettu alialueelle ja se luo vaikutelmaa ja napsautuksia haussa, voit havaita tämän ”suorituskyky” – osiosta suodattamalla tai tilaamalla sivusi:

GSC: n suorituskykytiedot

lisäksi kannattaa tarkistaa myös ”kattavuus” – osio-joissakin tapauksissa Google indeksoi sisältösi:

GSC-indeksoidut tiedot

kun taas muissa tapauksissa he huomaavat, että oletlisännyt sisältöä paikallaan, ja ystävällisesti pidättäytyvät indeksoimasta, jolloin löydät sen osiosta ”Duplicate, Google valitsi eri kanonisen käyttäjän”:

GSC eri kanoninen

vaikka näin olisikin, kannattaa silti pyrkiä varmistamaan, ettei se ryömi eteenpäin.

2) Tarkista Google SERP: t Link Clump

jos sinulla ei ole pääsyä GSC-verkkotunnuksen ominaisuuksiin tai käyttöoikeuksia GSC: hen (jos ei, miksi ei?) sitten voit tarkistaa SERPs nähdä, jos jokin testi URL on tehnyt tiensä hakemistoon.

tämä on myös kätevä tekniikka uutta liiketoimintaa varten, mikä olisikaan parempi tapa voittaa potentiaalinen asiakas puolelleen kuin saada heidän sisäinen tai sisäinen kehitystiiminsä näyttämään siltä, että he pilaavat hakunäkyvyyttä Death antamalla tämän tapahtua ylipäätään, ja että olet täällä pelastamassa päivän.

vaiheet ovat seuraavat:

i) asenna LinkClump Google Chrome-laajennus, jonka avulla voit kopioida ja liittää useita URL-osoitteita sivulta johonkin hyödyllisempään paikkaan, kuten Excel.

ii) muuta Link Clump-asetuksia seuraavasti:

Link Clump-Asetukset

tärkein huomioitava on toiminto ”kopioitu leikepöydälle”– viimeinen asia, jonka haluat tapahtuvan täällä, on avata jopa sata URL-osoitetta kerralla.

iii) Siirry suosikkiisi (tai paikalliseen) Google TLD-palveluun, napsauta ”asetukset”, jotka sinun pitäisi nähdä sivun oikeassa alareunassa, ja valitse” hakuasetukset”, jossa voit asettaa” tulokset sivua kohti ” – arvoksi 100.

iv)palaa Googlen etusivulle ja käytä ”site:” queryoperatoria ja lisää verkkotunnuksesi. Jos käytät www: tä tai vastaavaa, poista tämä-niin komento olisi seuraava:
site:organicdigital.co

sinulle esitetään otos, jossa on enintään 300 URL-osoitetta, jotka Google on tällä hetkellä indeksoinut kaikissa aliverkkotunnuksissa. Vaikka voit manuaalisesti tarkistaa jokaisen tuloksen paikalla rogue sivustoja:

testipaikka SERPs

minusta on paljon nopeampaa ja helpompaa napsauttaa hiiren oikealla painikkeella ja raahata se sivun alareunaan asti. Youwill tietää, jos linkki Clump toimii kuten näet seuraavat tapahtuvat todenote linkkejä valitaan ja kopioidaan:

 Link Clump in Action
URL Excel

Toista tämä SERP 2 ja 3, Jos saatavilla, ja kun allURLs on liitetty Excel, käytä Lajittele A-Z helposti tunnistaa indeksoitu sisältö kaikissa asiaankuuluvissa osa verkkotunnuksia.

3) Etsi sivustollesi ainutlaatuista tekstiä

yllä olevat menetelmät toimivat, jos testisivustosi on asubdomainissa samalla verkkotunnuksella kuin livesivustosi. Jos testipaikkasi kuitenkin sijaitsee muualla, esim. test.webdevcompany.com sitten ne eivät toimi. Siinä tapauksessa tämä tai seuraava menetelmävalinta.

etsi jotain sisältöä, jonka uskot olevan ainutlaatuista verkkosivustollasi – minun tapauksessani olen mennyt strapline: ”parantaa sivustosi orgaanista näkyvyyttä ja liikennettä” – sitten Etsi tämä lainausmerkeistä. Jos tätä sisältöä sisältävä testisivusto on indeksoitu, tämän haun pitäisi paljastaa se:

Testipaikat Serpissä jälleen

kuten näette, pääsivuston kotisivut, testialakohtainen verkkotunnus ja erillinen testialuetunnus näkyvät kaikki. Saatat myös vahingossa huomata kilpailijan, joka on repinyt sisältöäsi. Jotkut ottaisivat sen kohteliaisuutena, toiset antaisivat DMCAs-se on sinusta kiinni, mutta viimeinen asia mitä haluat on joku päihittää sinut omalla kopiolla.

4) ryömi sivusto käyttäen Screaming Frog

oletan, että olet innostunut SEO: sta ja siksi käytät Screaming Frog: ia. Jos jompikumpi näistä vastauksista on ei, niin hyvin tehty, jotta se näin pitkälle tähän artikkeliin (anna kun arvaan olet kehittäjä, joka on laskenut bollock ja haluavat kattaa perse ennen kuin kukaan muu saa selville?).

jos se ei näy, lataa se täältä.

perusasetusten sisällä rasti ”Crawl All Subdomains”. Voit myös rasti ”seuraa sisäistä ’nofollow'”, koska joissakin testausympäristöissä tämä voi olla paikallaan.

kun ryömintä on valmis, käy lista läpi nähdäksesi, onko olemassa sisäisiä linkkejä testipaikoille. Törmäsin tähän äskettäin, jossa uusi Drupal sivusto oli mennyt elää, mutta kaikki sisäiset linkit sisällä blogikirjoituksia osoittaa beta aliverkkotunnus:

Screaming Frog Crawl

voit sitten klikata jokaista testin URL-osoitetta ja klikata alareunassa olevia linkkejä löytääksesi rikkoneen sisäisen linkin live-testipaikalta. Tässä tapauksessa, muutin yhteyttä linkin sivukartta osoittaa testin URL:

Screaming Frog Internal Links

once spotted, amend and re-crawl until these are no moreinternal links taking visitors otherwhere. Jos käytät WordPress, käytä search / replace plugin löytää kaikki testURLs ja korvata ne live yksi.

5) Tarkista Google Analyticsin Palvelinnimet

jos testisivustollasi on sama Google Analytics-tilin tallennuskoodi asennettuna kuin livesivustollasi, voit havaita tämän, jos menet osioon ”Behavior” – >” Site Content ”- > ”Allpages” ja valitset” Hostname ” toissijaiseksi ulottuvuudeksi:

Google Analyticsin Palvelinnimet

tämän lisäksi voit myös suodattaa tietoja edelleen vähentämällä raportista kaikki vierailut pääalueeseen, jolloin kaikki muut esiintymät jäävät luetteloon. Lisäksi testi sivustoja, voit myös paljastaa GA roskapostia laukaistaan 3rdparty sivusto:

Google Analytics ei sisällä palvelinnimeä

on hyviä ja huonoja puolia, jos sinulla on sama GA-seuranta-IDrunning sekä live-että testiympäristöissä, mutta henkilökohtaisesti en näe syytä erillisille tileille ja sen sijaan loisi useita näkymiä yhdellä tililläsi. Määritä live-sivustolle suodatin, joka sisältää vain live-palvelinnimen liikenteen ja testisivuston vice versaforin.

kuinka poistaa ja estää Testipaikkasi indeksointi

niin olet löytänyt testipaikkasi indeksistä jollakin yllä mainituista tekniikoista, tai haluat varmistaa, ettei se tapahdu ensimmäisessä paikassa. Seuraavat kaikki auttavat tässä:

1) Poista URL-osoitteet GSC: n kautta

jos sivustosi on indeksoitu, oli se sitten liikennettä tai ei, se on parasta poistaa. Voit tehdä tämän käyttämällä” Poista URL ”- osiota” vanhasta ” GSC: stä.

huomaa, että tämä ei toimi domain-ominaisuustasolla, koska niitä ei ole järjestetty vanhassa GSC: ssä. Jotta voit tehdä tämän, sinun täytyy perustaa perustaa ominaisuus yksittäisen testidomain.

perustamisen jälkeen ”mene vanhaan versioon ”ja mene”Google Index ”->”Poista URL-osoitteet”. Täältä, valitse ”Temporilyhide” ja kirjoita yhden eteenpäin slash URL haluat estää, joka lähettää koko sivuston poistamista varten:

GSC Poista URL-osoitteet

Tämä poistaa sivustosi SERP-järjestelmistä 90 päiväksi, jotta varmistat, ettei se palaa, sinun on toteutettava lisätoimia. Yksi seuraavista riittää (ja se tulisi suorittaa riippumatta siitä, pystytkö poistamaan sen GSC: n kautta)

2) Aseta robottien tagi noindexiin testisivustolla

pyydä kehittäjiäsi varmistamaan, että kun suoritat testialuetta, jokainen sivu koko sivustolla luo robotit noindex-tagin:

<meta name="robots" content="noindex" />

jos sivustosi on WordPress, voit asettaa tämän ”Asetukset” – > ”lukeminen” ja valitsemalla ”Estä hakukoneita indeksoimasta tätä sivustoa”:

Wordpress Reading Settings

riippumatta siitä, millä koodilla tai asetuksilla estät testisivuston indeksoinnin, sinun on varmistettava, että tätä ei siirretä live-sivustoon, kun uusi sisältö tai toiminnallisuus tehdään eläväksi. Testisivuston asetukset going live on yksi yleisimmistä ja varmimmista paloteistä livesivuston näkyvyyden sotkemiseksi.

3) salasana suojaa testisivusto

web-ohjauspaneelista tai palvelimen kautta salasana suojaa hakemisto, jossa testisivusi sijaitsee. On olemassa lukuisia tapoja tehdä tämä – paras tapa on pyytää hosting-yritystä tai kehittäjiä määrittämään tämä, tai, on olemassa paljon hyviä resursseja, jotka näyttävät sinulle, miten tämä tehdään, kuten:

https://one-docs.com/tools/basic-auth

kun se on estetty, sinun pitäisi nähdä hälytysruutu, kun yrität käyttää testisivustoasi:

https://alitis.co.uk/

salasanalla suojattu sivusto

tämä estää hakukoneita ryömimästä ja indeksoimasta sivustoa.

4) Delete site and return page status 410

jos sinulla ei enää ole tarvetta testisivustollesi, voit yksinkertaisesti poistaa sen. Kun hakukoneet yrittävät tovisit sivut pidempään live, he näkevät sivut poistetaan. Oletusarvoisesti rikkinäinen sivu palaa status404 (”ei löytynyt”)-vaikka tämä saa sivuston poistettua indeksin ajoissa, se kestää jonkin aikaa, koska siellä on seurantakäyntejä nähdä, onko rikki sivu on palannut.

aseta sen sijaan tilaksi 410 (”pysyvästi poissa”), joka palauttaa seuraavan viestin:

 tilanne 410

voit tehdä tämän koko verkkotunnuksen, poistaa sivuston jaleave .htaccess-tiedosto paikallaan seuraavalla komennolla:

Redirect 410 /

tämä varmistaa sivuston saa de-indexed ensimmäisellä kerralla pyytää (tai ainakin nopeammin kuin 404)

5) Block kautta robotteja.txt

voit estää sivuston ryömimisen toteuttamalla seuraavat komennot testipaikan roboteissa.txt-tiedosto:

User-agent: *Disallow: /

tämä estää botteja ryömimästä sivustoa. Huomautus: jos testisivusto on tällä hetkellä indeksoitu,ja olet valinnut noindex-tunnisteiden lisäämisen sivustolle, älä lisää robotteja.txt-komento sisään, kunnes kaikki sivut on poistettu indeksistä. Jos lisäät tämän ennen kuin kaikki sivut on poistettu indeksistä, tämä estää niiden ryömimisen ja robottien tunnisteen havaitsemisen, joten sivut pysyvät indeksoituina.

ja siinäpä se-toivottavasti edellä mainittu riittää, että löydät, deindex ja estät koettasi ryömimästä enää koskaan.

mutta muista

en voi korostaa tätä tarpeeksi – jos päätät toteuttaa robottien meta-tunnisteita tai robotteja.txt joka kieltää kaikki botit indeksoimasta ja indexing testisivuston, varmista, kun laitat testisivuston live, että et kuljettaa näitä kokoonpanoja yli live-sivuston, koska olet vaarassa menettää oman orgaanisen näkyvyyden kokonaan.

ja me kaikki olemme olleet siellä, eikö niin?

Vastaa

Sähköpostiosoitettasi ei julkaista.