- Foorumi
- Keskustelu
- Community Magazine käännetyt julkaisut
- Tarpeettomat sivukopiot Joomlassa, artikkelin käännös
Tarpeettomat sivukopiot Joomlassa, artikkelin käännös
- Kharadus
-
Aiheen kirjoittaja
- Vieras
-
07.06.2013 09:25 - 07.06.2013 09:29 #5254
: Kharadus
Tässä viestissä on tiedosto liitetiedostona.
Kharadus loi aiheen: Tarpeettomat sivukopiot Joomlassa, artikkelin käännös
Alkuperäinen artikkeli löytyy osoitteesta:
magazine.joomla.org/issues/issue-june-2013/item/10...joomla-causes-errors-solutions
Sivujen tarpeettomat kopiot Joomlassa: Syyt, yleisimmät virheet sekä ratkaisuja
Jokainen Joomla-sivuston omaava törmää ennen pitkää sivujen tarpeettomiin kopioihin. Tutkaillaan tämän ongelman ydintä, otamme selvää mitä sivujen tarpeettomat kopiot ovat, kuinka hakukoneet reagoivat niihin ja kuinka näistä pahoista kaksosista päästään eroon.
Tarpeettomat sivukopiot ovat identtisiä dokumentteja sivustolla, joihin pääsee käsiksi erillisten URL-osoitteiden kautta. Tarpeettomat sivukopiot ovat itse asiassa ongelma suurimmassa osassa CMS:iä, eivät pelkästään Joomlassa. Kaikki nämä sivut ovat harmittomia, kunnes ne indeksoidaan crawlerien toimesta. Indeksoitaessa on tärkeää huomata ja välittömästi poistaa nämä sivut tuloksista, tosin helpointa on välttää tilanne kokonaan sivustoa luotaessa luomalla sivuston rakenne oikein.
Pääasiallinen syy tarpeettomien sivukopioiden syntyyn on sivuston väärä rakenne. Ensimmäisenä tekijän tulisi miettiä tarkkaan kategorioiden ja valikoiden nimikkeiden sisäinen arvojärjestys. Luotaessa useita kategorioita etukäteen tämä voi estää tarpeettomien kopioiden syntymisen tulevaisuudessa.
Katsastellaan yleisimpiä virheitä. Luotaessa esimerkiksi kategoriaa ”News”, joka sisältää alakategoriat ”Politics”, ”Economy” jne. Kaikki lisättävä materiaali linkitetään suoraan alakategorioihin. Luotaessa vain valikon nimikkeenä olevia alakategorioita, kuten ”Politics”, syntyvien linkkien muoto voi olla mikä vain seuraavista (materiaalille):
website.com/politics/23-material
website.com/1-newsi/politics/23-material
website.com/1-newsi/2-politics/23-material
website.com/index.php?option=com_content&task=view&id=23&Itemid=1
Ja niin edespäin, URL-osoitteiden muodostumiselle on useita tapoja, jotka kaikki ovat vain yksittäisen sivun kopioita. Tämä on malliesimerkki siitä, miten asioita EI pitäisi hoitaa. Sen lisäksi hakukoneet saattavat indeksoida teknisiä kopioita, jotka ovat tarjolla ”Print”, ”PDF”, ”Send to a friend” –linkkien kautta.
Luotaessa uutta sivustoa, tulee sen rakennetta miettiä tarkasti etukäteen ja päättää pää- ja alakategoriat. Sivuston sisällön lisääntyessä ei ole tarvetta muuttaa olemassa olevaa rakennetta jos sivusto on hyvin suunniteltu, vaan käyttäjä voi vain lisätä sivustoon uusia osioita. Sivuston uudelleenrakennus sen kehityskaaren huipulla on raskas homma, joka voi työllistää sivuston kehittäjän kuukausiksi. Jotkin sivut, ehkä jopa kaikki niistä, vaihtavat osoitteensa, joka johtaa vääjäämättömään laskuun hakukoneiden hauissa ja käyntien määrässä.
Miten hakukoneet löytävät tarpeettomat kopiot sivuista?
Yleisin syy ovat lisäosat ja komponentit, joita kehittäjät asentavat Joomla-sivustolleen. Esimerkiksi News-moduuli kotisivulla voi antaa eri osoitteen. Joskus nämä tarpeettomat kopiot näkyvät jopa sivuston kartalla, esimerkiksi Xmapin ollessa asennettuna.
Jos sivusto on jo indeksoitu, ei tarpeettomien kopioiden löytäminen ole vaikeaa, kopioi pari pätkää sivustolta, ja liitä se heittomerkkien sisällä Googlen hakukenttään. Jos sivusto ei ole indeksoitu eikä järin suuri, voidaan käyttöö XENUa, joka etsii kaikki mahdolliset tavat sivuston löytämiseen.
Miksi tarpeettomista kopioista tarvitsee päästä eroon?
Hakukoneet eivät ”pidä” ja yrittävät välttää indeksoimasta sivustoja, joilla on suuri määrä tarpeettomia kopioita sivuista, koska niiden hakemisen tarpeellisuus on kyseenalaista. Optimoitaessa sivuja tietyille avainsanoille oleellisimmat sivut valitaan ja sisältö optimoidaan niille. Jos näillä sivuilla on kopioita, päivitystä tehtäessä hakukone saattaa korvata oleellisen sivun sen kopiolla (jota seuraa jyrkkä lasku sijoituksessa johtaen liikenteen vähenemiseen sivustolla).
Kuusi tapaa päästä ongelmista eroon
Jokainen sivusto on uniikki, mutta tarkastellaanpa yleisiä ratkaisuja, jotka toimivat aivan mainiosti 99 prosentissa tapauksista. Näistä ratkaisusta voi valita yhden tai käyttää useampaa yhdessä, miten vain haluaa. Nämä ovat suurimmaksi osaksi yleispäteviä ohjeita, jotka toimivat muillakin CMS:llä.
1. StyleWare sisällön säännönmukaisuus –liitännäinen
Sisällön säännönmukaistamisliitännäinen ratkaisee yksittäisen sivun usean URL-osoitteen ongelman. Esimerkkinä jos sivustolla on component/content/article/32-something.html ja something.html, molemmat indeksoidaan yhdestä URL-osoitteesta (something.html). Tämän on erinomainen liitännäinen, joka tekee kaiken mitä lupaa.
2. Robots.txt Joomlalle
Tiedosto on osana Joomlan perusasennuspaketin juurihakemistoa, ja siihen pääsee käsiksi linkin yourwebsite.com/robots.txt kautta. Se tarjoaa hakukoneille ohjeet, kuinka sivusto pitää indeksoida. Sen avulla voidaan sulkea käyttäjän haluamia osia sivustosta. Lisäksi voidaan myös käyttää seuraavaa opastusta tiedostossa olevaan pohjadataan käsiinpääsemiseksi:
Disallow: /*? #tällä merkillä merkityt linkit jätetään indeksoimatta
Vain yhden rivin kirjoittamisella säästää suuria määriä tallennuskapasiteettia eri lähteistä, kuten:
• tulostamisen sivumateriaalit
• linkit rss-syötteeseen
• sivun hakutulokset
• sulkee myös sivuntaiton
• käytössä olevista lisäosista riippuen muitakin säätöjä
Käyttääkö tätä riviä vai on täysin käyttäjästä kiinni, mutta on tärkeätä muistaa, että liian suuren robots-tiedoston katsotaan olevan täysin salliva. Huom! Rivi ei saa peittää tärkeitä kohteita, kuten sivustokarttaa, joten voidaan lisätä rivi Allow: /site_map. Sivustokartasta voi lukea lisää Google-helpistä.
3. Uudelleenohjaa 301 (Redirect 301)
Uudelleenohjaa 301 on aiheellinen valinta, jos URL-osoitteita on vaihdettu, mutta kaikki varsinaiset dokumentit ovat edelleen olemassa. Tässä tapauksessa oikean asiayhteyden luomiseksi käytetään Uudelleenohjaus 301:stä. htaccess-tiedostossa. Hakukoneet näkevät, että tiedosto on siirretty uuteen osoitteeseen, mahdollistaen sivuston toimivuuden sekä tunnistettavuuden säilymisen.
301 Uudelleenohjausta voidaan käyttää myös sitomaan yhteen sivujen tarpeettomia kopioita. Joomla-aiheisena esimerkkinä toimii hyvin yleinen kopiokaksikko, Joomla-sivuston kotisivun /index.php ja Home(Pää-)-valikon alias, esimerkiksi /home tai /homepage, jotka voidaan varsin helposti liittää toisiinsa: avataan .htaccess-tiedosto ja lisätään siihen:
Redirect 301 /index.php site.com/
...or else you can make the redirect 301 in the index file of your template:
<?php
if($_SERVER == '/index.php') {
header("Location: /",TRUE,301);
exit();
}
?>
Seuraavana hieno esimerkki sivuston URL-osoitteesta www:n kanssa ja ilman.
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.example.com$ [NC]
RewriteRule ^(.*)$ example.com/$1 [R=301,L]
*example.com korvataan halutun sivuston osoitteella
Uudelleenohjaus 301:n muita käyttötapoja löydät osoitteesta: blog.templatemonster.com/2012/06/21/how-to-use-redirect-301/
4. Metatagirobotit
Sivuston tarpeettomien kopioiden indeksoinnin estämisen tapoja on monta, yksi niistä on metatagirobottien käyttö:
<meta name="robots" content="noindex"/>
Vielä kirjoittamishetkellä tämä tapa on paljon robots.txt-tiedoston säätämistä parempi Googlen hakujen suhteen. Esimerkiksi suljettaessa sivuversio tulostusta varten tarvitaan osoite, joka saadaan avaamalla component.php-tiedosto käytössä olevan sivupohjan juuressa ja lisätään tagi
?tmpl = component osioon <head> </ head>.
Hakutulossivujen sulkemiseksi voidaan käyttää yleistä com_searchia index.phpssä:
<?php if ($option == 'com_search') : ?>
<meta name="robots" content="noindex"/>
<?php endif; ?>
Ensin tulee kuitenkin määritellä muuttuja:
$option = JRequest::getVar('option', null);
5. URL-osoitteden poisto Ylläpitopaneelista
Vaihtoehtoisesti tarpeettomista kopioista voidaan hankkiutua eroon poistamalla ne manuaalisesti Ylläpitopaneelin kautta, Googlen kohdalla esimerkiksi osoitteesta www.google.com/webmasters/tools/home?hl=en
6. X-Robots-Taginimike
Google suosittelee käyttämään X-Robots-Tagia vaihtoehtona tämän listauksen neljännelle tavalle.
HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
...
X-Robots-Tag: noindex
...
Kuten näkyy, on monia tapoja hankkiutua eroon tarpeettomista sivun kopioista, mutta jokaisen eri tavan toimintamalli on ymmärrettävä ennen niiden käyttämistä, jotta voidaan valita tilanteeseen parhaiten sopiva keino.
Artikkeli PDF-muodossa:
Sivujen tarpeettomat kopiot Joomlassa: Syyt, yleisimmät virheet sekä ratkaisuja
Jokainen Joomla-sivuston omaava törmää ennen pitkää sivujen tarpeettomiin kopioihin. Tutkaillaan tämän ongelman ydintä, otamme selvää mitä sivujen tarpeettomat kopiot ovat, kuinka hakukoneet reagoivat niihin ja kuinka näistä pahoista kaksosista päästään eroon.
Tarpeettomat sivukopiot ovat identtisiä dokumentteja sivustolla, joihin pääsee käsiksi erillisten URL-osoitteiden kautta. Tarpeettomat sivukopiot ovat itse asiassa ongelma suurimmassa osassa CMS:iä, eivät pelkästään Joomlassa. Kaikki nämä sivut ovat harmittomia, kunnes ne indeksoidaan crawlerien toimesta. Indeksoitaessa on tärkeää huomata ja välittömästi poistaa nämä sivut tuloksista, tosin helpointa on välttää tilanne kokonaan sivustoa luotaessa luomalla sivuston rakenne oikein.
Pääasiallinen syy tarpeettomien sivukopioiden syntyyn on sivuston väärä rakenne. Ensimmäisenä tekijän tulisi miettiä tarkkaan kategorioiden ja valikoiden nimikkeiden sisäinen arvojärjestys. Luotaessa useita kategorioita etukäteen tämä voi estää tarpeettomien kopioiden syntymisen tulevaisuudessa.
Katsastellaan yleisimpiä virheitä. Luotaessa esimerkiksi kategoriaa ”News”, joka sisältää alakategoriat ”Politics”, ”Economy” jne. Kaikki lisättävä materiaali linkitetään suoraan alakategorioihin. Luotaessa vain valikon nimikkeenä olevia alakategorioita, kuten ”Politics”, syntyvien linkkien muoto voi olla mikä vain seuraavista (materiaalille):
website.com/politics/23-material
website.com/1-newsi/politics/23-material
website.com/1-newsi/2-politics/23-material
website.com/index.php?option=com_content&task=view&id=23&Itemid=1
Ja niin edespäin, URL-osoitteiden muodostumiselle on useita tapoja, jotka kaikki ovat vain yksittäisen sivun kopioita. Tämä on malliesimerkki siitä, miten asioita EI pitäisi hoitaa. Sen lisäksi hakukoneet saattavat indeksoida teknisiä kopioita, jotka ovat tarjolla ”Print”, ”PDF”, ”Send to a friend” –linkkien kautta.
Luotaessa uutta sivustoa, tulee sen rakennetta miettiä tarkasti etukäteen ja päättää pää- ja alakategoriat. Sivuston sisällön lisääntyessä ei ole tarvetta muuttaa olemassa olevaa rakennetta jos sivusto on hyvin suunniteltu, vaan käyttäjä voi vain lisätä sivustoon uusia osioita. Sivuston uudelleenrakennus sen kehityskaaren huipulla on raskas homma, joka voi työllistää sivuston kehittäjän kuukausiksi. Jotkin sivut, ehkä jopa kaikki niistä, vaihtavat osoitteensa, joka johtaa vääjäämättömään laskuun hakukoneiden hauissa ja käyntien määrässä.
Miten hakukoneet löytävät tarpeettomat kopiot sivuista?
Yleisin syy ovat lisäosat ja komponentit, joita kehittäjät asentavat Joomla-sivustolleen. Esimerkiksi News-moduuli kotisivulla voi antaa eri osoitteen. Joskus nämä tarpeettomat kopiot näkyvät jopa sivuston kartalla, esimerkiksi Xmapin ollessa asennettuna.
Jos sivusto on jo indeksoitu, ei tarpeettomien kopioiden löytäminen ole vaikeaa, kopioi pari pätkää sivustolta, ja liitä se heittomerkkien sisällä Googlen hakukenttään. Jos sivusto ei ole indeksoitu eikä järin suuri, voidaan käyttöö XENUa, joka etsii kaikki mahdolliset tavat sivuston löytämiseen.
Miksi tarpeettomista kopioista tarvitsee päästä eroon?
Hakukoneet eivät ”pidä” ja yrittävät välttää indeksoimasta sivustoja, joilla on suuri määrä tarpeettomia kopioita sivuista, koska niiden hakemisen tarpeellisuus on kyseenalaista. Optimoitaessa sivuja tietyille avainsanoille oleellisimmat sivut valitaan ja sisältö optimoidaan niille. Jos näillä sivuilla on kopioita, päivitystä tehtäessä hakukone saattaa korvata oleellisen sivun sen kopiolla (jota seuraa jyrkkä lasku sijoituksessa johtaen liikenteen vähenemiseen sivustolla).
Kuusi tapaa päästä ongelmista eroon
Jokainen sivusto on uniikki, mutta tarkastellaanpa yleisiä ratkaisuja, jotka toimivat aivan mainiosti 99 prosentissa tapauksista. Näistä ratkaisusta voi valita yhden tai käyttää useampaa yhdessä, miten vain haluaa. Nämä ovat suurimmaksi osaksi yleispäteviä ohjeita, jotka toimivat muillakin CMS:llä.
1. StyleWare sisällön säännönmukaisuus –liitännäinen
Sisällön säännönmukaistamisliitännäinen ratkaisee yksittäisen sivun usean URL-osoitteen ongelman. Esimerkkinä jos sivustolla on component/content/article/32-something.html ja something.html, molemmat indeksoidaan yhdestä URL-osoitteesta (something.html). Tämän on erinomainen liitännäinen, joka tekee kaiken mitä lupaa.
2. Robots.txt Joomlalle
Tiedosto on osana Joomlan perusasennuspaketin juurihakemistoa, ja siihen pääsee käsiksi linkin yourwebsite.com/robots.txt kautta. Se tarjoaa hakukoneille ohjeet, kuinka sivusto pitää indeksoida. Sen avulla voidaan sulkea käyttäjän haluamia osia sivustosta. Lisäksi voidaan myös käyttää seuraavaa opastusta tiedostossa olevaan pohjadataan käsiinpääsemiseksi:
Disallow: /*? #tällä merkillä merkityt linkit jätetään indeksoimatta
Vain yhden rivin kirjoittamisella säästää suuria määriä tallennuskapasiteettia eri lähteistä, kuten:
• tulostamisen sivumateriaalit
• linkit rss-syötteeseen
• sivun hakutulokset
• sulkee myös sivuntaiton
• käytössä olevista lisäosista riippuen muitakin säätöjä
Käyttääkö tätä riviä vai on täysin käyttäjästä kiinni, mutta on tärkeätä muistaa, että liian suuren robots-tiedoston katsotaan olevan täysin salliva. Huom! Rivi ei saa peittää tärkeitä kohteita, kuten sivustokarttaa, joten voidaan lisätä rivi Allow: /site_map. Sivustokartasta voi lukea lisää Google-helpistä.
3. Uudelleenohjaa 301 (Redirect 301)
Uudelleenohjaa 301 on aiheellinen valinta, jos URL-osoitteita on vaihdettu, mutta kaikki varsinaiset dokumentit ovat edelleen olemassa. Tässä tapauksessa oikean asiayhteyden luomiseksi käytetään Uudelleenohjaus 301:stä. htaccess-tiedostossa. Hakukoneet näkevät, että tiedosto on siirretty uuteen osoitteeseen, mahdollistaen sivuston toimivuuden sekä tunnistettavuuden säilymisen.
301 Uudelleenohjausta voidaan käyttää myös sitomaan yhteen sivujen tarpeettomia kopioita. Joomla-aiheisena esimerkkinä toimii hyvin yleinen kopiokaksikko, Joomla-sivuston kotisivun /index.php ja Home(Pää-)-valikon alias, esimerkiksi /home tai /homepage, jotka voidaan varsin helposti liittää toisiinsa: avataan .htaccess-tiedosto ja lisätään siihen:
Redirect 301 /index.php site.com/
...or else you can make the redirect 301 in the index file of your template:
<?php
if($_SERVER == '/index.php') {
header("Location: /",TRUE,301);
exit();
}
?>
Seuraavana hieno esimerkki sivuston URL-osoitteesta www:n kanssa ja ilman.
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.example.com$ [NC]
RewriteRule ^(.*)$ example.com/$1 [R=301,L]
*example.com korvataan halutun sivuston osoitteella
Uudelleenohjaus 301:n muita käyttötapoja löydät osoitteesta: blog.templatemonster.com/2012/06/21/how-to-use-redirect-301/
4. Metatagirobotit
Sivuston tarpeettomien kopioiden indeksoinnin estämisen tapoja on monta, yksi niistä on metatagirobottien käyttö:
<meta name="robots" content="noindex"/>
Vielä kirjoittamishetkellä tämä tapa on paljon robots.txt-tiedoston säätämistä parempi Googlen hakujen suhteen. Esimerkiksi suljettaessa sivuversio tulostusta varten tarvitaan osoite, joka saadaan avaamalla component.php-tiedosto käytössä olevan sivupohjan juuressa ja lisätään tagi
?tmpl = component osioon <head> </ head>.
Hakutulossivujen sulkemiseksi voidaan käyttää yleistä com_searchia index.phpssä:
<?php if ($option == 'com_search') : ?>
<meta name="robots" content="noindex"/>
<?php endif; ?>
Ensin tulee kuitenkin määritellä muuttuja:
$option = JRequest::getVar('option', null);
5. URL-osoitteden poisto Ylläpitopaneelista
Vaihtoehtoisesti tarpeettomista kopioista voidaan hankkiutua eroon poistamalla ne manuaalisesti Ylläpitopaneelin kautta, Googlen kohdalla esimerkiksi osoitteesta www.google.com/webmasters/tools/home?hl=en
6. X-Robots-Taginimike
Google suosittelee käyttämään X-Robots-Tagia vaihtoehtona tämän listauksen neljännelle tavalle.
HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
...
X-Robots-Tag: noindex
...
Kuten näkyy, on monia tapoja hankkiutua eroon tarpeettomista sivun kopioista, mutta jokaisen eri tavan toimintamalli on ymmärrettävä ennen niiden käyttämistä, jotta voidaan valita tilanteeseen parhaiten sopiva keino.
Artikkeli PDF-muodossa:
Tämä liitetiedosto on piilotettu vierailta.
Kirjaudu sisään tai rekisteröidy nähdäksesi se.
Kirjaudu sisään tai rekisteröidy nähdäksesi se.
Tässä viestissä on tiedosto liitetiedostona.
Kirjaudu sisään tai rekisteröidy nähdäksesi se.
Last Edit: 07.06.2013 09:29 : Kharadus.
Kirjaudu tai Rekisteröidy liittyäksesi keskusteluun.
Valvojat: jkwebdesign, Gamoss, JiiKoo
- Foorumi
- Keskustelu
- Community Magazine käännetyt julkaisut
- Tarpeettomat sivukopiot Joomlassa, artikkelin käännös
Sivu luotiin ajassa: 0.083 sekuntia