Archive for július, 2010

Egyre sűrűbben találkozom olyan “feltört” webhellyel, amely látszólag nem viseli magán a klasszikus fertőzés nyomait, így a “bejelentett támadó webhely” címkét sem kapja meg, mégis sok fejtörést okoz a gazdájának, már ha rájön, hogy illetéktelenek módosították a honlap fájlait.

Elsőre talán mitologikus a fenti megfogalmazás, lássuk mire is gondolok konkrétan.

Korábbi bejegyzésekben többször is volt már szó a bejelentett támadó webhelyekről, ezért most ezekre külön nem térnék ki. Röviden annyi a lényeg, hogy egy, vagy több fájlba elhelyezik a károkozó kódot, ami aztán a böngészőből futtatva láttatja magát és megfertőzi a honlapot megtekintő személy gépét is. Általában ezek a kódok gyorsan kiderülnek, a Google támadó webhelyként próbálja megakadályozni elérésüket.

A gonosz oldal emberei azonban nem pihennek és újabb ötletekkel állnak elő. Most bemutatok kettőt ezek közül.

Robots.txt

Látszólag ártatlan szöveges fájl, a legtöbb webmester nem is használja, létezéséről sem tud. Ha megnyitja, akkor sem vesz benne észre különösebb problémát. Pedig egyre gyakoribb, hogy ide helyezik el az ártó szándékú sort. Gyakorlottabb webmesterek már valószínűleg sejtik, hogy mire is gondolok: egy szimpla Disallow: / sor kerül elhelyezésre ebbe a fájlba, ami lényegében egyet jelent a keresőkből való kizárással. Innentől fogva ugyanis a keresők messziről elkerülik honlapunkat és idővel az indexükből is eltüntetik azt, mivel ez a sor nem jelent más, mint azt, hogy saját magunk kérjük a keresők távolmaradását honlapunktól.

.htaccess

Ez a fájl még inkább rejtve marad az avatlan szemek elől, hiszen a Linux terminológia szerint a ponttal kezdődő fájlnevek rejtett fájlok. A legtöbb FTP program ezt tiszteletben is tartja és csak akkor mutatja meg ezt a fájlt, ha külön kérjük a rejtett fájlok mutatását. A .htaccess fájlba általában pár olyan sor kerül bele, ami azt éri el, hogy a keresőkből érkezve egy idegen, fertőzőtt weboldalra érkezzen a látogató, míg közvetlenül a saját URL-ünket beírva a saját honlapunkat látjuk. A módszer elég aljas és csak akkor észrevehető, ha saját honlapunkra a keresőből érkezünk – ami valljuk be, nem túl gyakori. Látogatóinkat viszont gyorsan elveszthetjük, ráadásul ők honlapunk helyett egy fertőzött weboldalon találják magukat.

Érdemes tehát résen lenni és figyelni! Ugyanakkor csak akkor kezdjünk bele a munkálatokba, felderítésbe, ha tudjuk mit csinálunk. A .htaccess fájl avatatlan módosítása az egész honlapunk leállását is eredményezheti! Ha csak lehet, bízzuk a munkát hozzáértőkre!

Igen is, meg nem is… A komolyabb keresőkben a honlap pár hét után automatikusan megjelenik. A keresőrobotok járják az internetet és ha új honlapot találnak (egy másik linkről érkezve), annak a tartalmát begyűjtik adatbázisukba, majd kis idő után elérhetővé teszik a keresőknek.

Valóban ilyen egyszerű a történet?

Az indexelés a Google, a Bing és a legtöbb nagy kereső részéről automatikus, azonban szó szerint nem is garantálnak semmit, így azt sem, hogy mikor fog egy oldal bekerülni, sőt, azt sem, hogy valaha be fog kerülni minden honlap. (Idézet a Googletől: “Nem adunk minden elküldött URL-t az indexünkhöz, és nem tudjuk sem előre jelezni, sem garantálni, hogy mikor kerül sor az Ön URL-jére, illetve hogy egyáltalán sor kerül-e rá.”).”

Biztosítsuk be a bizonytalant!

Ezzel kapcsolatban idézet a Google-től:
“Érdemes webhelye oldalairól részletes Webhelytérképet készítenie, és azt elküldenie nekünk. A Webhelytérképek szolgáltatás egyszerű módot nyújt arra, hogy az összes URL-címét elhelyezze a Google indexében, és részletes jelentéseket kapjon arról, hogy oldalai hogyan jelennek meg a Google rendszerben. A Webhelytérképekkel automatikusan tájékoztathat bennünket aktuális oldalairól, valamint az oldalakon végzett frissítésekről. Vegye figyelembe, hogy a webhelytérkép elküldése nem jelent garanciát arra, hogy webhelyének összes oldalát indexeljük, illetve feltüntetjük keresési eredményeink között.”

  • Az internet más webhelyeiről szerezzünk minél több hivatkozást (linket)
  • Vegyük fel honlapunkat linkgyűjteményekbe, apróhirdetési oldalakra, cégadatbázisokba (hasonló célközönségű, de nem konkurens weboldalakra gondolok). A legjobb persze, ha maguktól vesznek fel minket…
  • Adjuk hozz URL-ünket  a Google-hoz, Bing-hez, …
  • Készítsük el robots.txt fájlunkat, hogy tudassuk a keresőkkel: mit szabad és mit nem indexelniük (ugyanezt az oldal fejrészében is megtehetjük, a megfelelő meta tegek segítségével)

Mindezek előtt…

Természetesen nem feledkezhetünk meg az oldalunk minőségéről sem: szabványos CSS, HTML és minőségi tartalom nélkül ne is küldjük be oldalunkat a keresőkhöz, hanem dolgozzunk még rajta! … de ennél jóval többet is tehetünk, olvassuk el a minőségi irányelveket és cselekedjünk (többek között) ezek szerint!

Fontos: a mennyiségnél fontosabb a minőség!