Vagy ez - vagy az ... vagy mindent egyszerre?

Dátum: 2009.06.05. 20:53, szerző: Balogh Attila (1) Hozzászólás

A post nyitó gondolata:

Először is a feedek indexelését hülyeség letiltani (mint ahogy a cache-elést is erőltetettnek érzem). Talán még nem hallottál a google blog search-ről? És akkor még nem is beszéltünk a többi feedeket indexelő robotról.

Via SMB

Az előző bejegyzésben a tartalom duplikációt elemeztük és mutattam egy lehetséges megoldást - egy plugin segítségével. Természetesen lehet finomítani, lehet pontosítani - azt nem tudom még, hogy mennyire szükséges. Tesztelem, egy kis időt adjatok.

Volt azonban egy felvetés a Google blog search-el kapcsolatban - ha tiltom az RSS indexelését, akkor a Google blog search funkció semmit nem fog találni nálam.

Teljesen jogos - köszön SMB-nek, hogy rávilágított a problémára. Nélküle ez a bejegyzés sem születhetett volna meg.

Szóval ott tartunk, hogy a feed-eket letiltottuk, mert parázunk a büntetéstől - semmi gond, munka mindig is lesz a bloggal, most éppen az, hogy bekerüljön a blog search adatbázisába.

Ez pedig egyszerűbb feladat, mint gondolnád!

A Google közleménye szerint ahhoz, hogy bekerüljön a keresőbe a friss blogtartalom, egyszerűen meg kell pingelni a szerverüket. Ennyi, mára végeztem is :).

Azért aki paranoiás, és attól tart, hogy nem lesz ez annyira eredményes, mehet biztosra - regisztrálja be a blogot.

Regisztráció után (meg egyébként is) a Beállítások / Írás menüpontnál adhatod meg az “Értesítő szolgáltatások” résznél azoknak a szervereknek a listáját, melyeket a wordpress automatikusan meg fog pingelni a tartalom frissítésekor.

blog ping

Ide beírhatod a második sorba: http://blogsearch.google.co.hu/ping/RPC2, ami a magyar blogsearch szerverét fogja informálni.

Persze nem biztos hogy csak a magyar piacon - és nem biztos hogy csak a google-nél vagy érdekelt szétkürtölni a frissítéseket. Egy viszonylag bő pinglistát találsz itt, szemezgess kedvedre: wordpress pinglist

Keresők indexelésének tiltása

Másik felvetés - az archive oldalak tiltása az indexelésből - szintén SMB :).

Igazából ezzel nem foglalkoznék, de kíváncsi vagyok. Az, hogy valamit hogy kellene megoldani és hogy nem - nos hát az sok mindentől függ. Egy adott problémának van 100 megoldása. Durvább leszek: egy adott problémának van 100 megoldása. Az ember ezek közül azt alkalmazza, ami neki leginkább megfelelő.

A kíváncsiságom tárgya pedig: neked, kedves olvasó hogy lenne jobb? Hogy ezt el tudd dönteni, az archive oldalak kódszintű index-tiltását mutatom be. Emlékszel még az előző bejegyzésnél hogy oldottuk ezt meg egyetlen kattintással?

Na akkor ezt nézd:

Ha még nem nagyon piszkáltál a forráskódban - meg egyébként is - érdemes a módosításokat off-line megoldani. Ehhez nem szükséges, hogy telepítsd a rendszert a saját gépedre is (bár ennek az előnyei számottevők a fejlesztési szakaszban).

Ha a saját gépeden szerkesztgetsz, akkor azt a módosítások elvégzése után frissítened kell, fel kell töltsd a szerverre (FTP-n keresztül). Feltételezem, hogy ez nem okoz gondot - hiszen a pluginokat is így kell felmásold.

Az index tiltásához az aktuálisan használt sablonod head.php állományát kell átszerkesztened, mégpedig úgy, hogy a <head></head> TAG-ek közé beilleszted a következő kódrészletet:

<?php if (is_day()) { ?>
	<meta name="robots" content="noindex,follow" />
<?php } elseif (is_month()) { ?>
	<meta name="robots" content="noindex,follow" />
<?php } elseif (is_year()) { ?>
	<meta name="robots" content="noindex,follow" />
<?php } elseif (is_search()) { ?>
	<meta name="robots" content="noindex,follow" />
<?php } elseif (is_author()) { ?>
	<meta name="robots" content="noindex,follow" />
<?php } elseif (stripos($_SERVER['SCRIPT_NAME'],"page/")) { ?>
	<meta name="robots" content="noindex,follow" />
<?php } elseif (isset($_GET['paged']) && !empty($_GET['paged'])) { ?>
	<meta name="robots" content="noindex,follow" />
<?php } ?>

A kód eredményeképpen sem követni, sem indexelni nem fogja a kereső a következő oldalakat:

  • napi archív oldalak
  • havi archív oldalak
  • éves archív oldalak
  • keresési eredmények oldalait
  • szerzők archív oldalait
  • minden olyan oldal, ami nem a főoldal

Micsoda??? Minden olyan oldalt zárjunk ki az indexből, ami nem a kezdő oldal (blog kezdő oldal, keresések első oldala, archívumok első oldala, stb… maradnak csupán - feltéve, hogy ezeket nem tiltottuk már előzőleg teljesen).

Hát ennek a tárgyalása már egy külön bejegyzésbe fog kerülni, de a vitát akár itt is el lehet indítani - a komemnteknél.

Most itt az ideje a szokásos szavazásosdinak - kaptál két lehetséges megoldást az archív oldalak indexből való kizárására. Egy pluginos módszert és egy kódolós-házibarkács módszert. Te melyiket preferálod? Legközelebb milyen megoldást mutassak?


Balogh Attila

Attila blogger, trainer és WordPress fanatikus.

Tetszett a bejegyzés? Ne maradj le a frissítésekről sem!
Iratkozz fel a blog hírlevélre vagy az RSS értesítőre!

Oszd meg, mentsd el! - TurboBookmark.com

Címkék: wordpress, duplikált tartalom, kiegészítő

A bejegyzés trackback címe:

Trackback:

Még nincs...

1 Hozzászólás

oliveR
2009.06.06. 18:00

Én az arhívumot noindex nofollow-ra állítottam a blogban, hiszen így duplikált tartalom.

Ami viszont még fontosabb: a MainContent (fő tartalom) mappám üres, MINDEN tartalmat egy kategóriába beteszek, azaz a tartalom így 2 helyen szerepel - a kategóriáimban és az arhívumban.

Ha ezt nem így tenném, 3 helyen szerepelne a tartalom: MainContent, Katgóriák, Archívum. Ezekből kettőt tiltani kell.

oliveR

U.I.: Az RSS feedek gondolat nagyon jogos. Ez a WP blogok ereje.


Jegyezd meg az adataim
Kérek e-mail értesítést a válaszokról