Formation des URL et duplicate content

MoniqueMonique Member
Bonjour,

Je me suis (enfin) décidée à passer mon site pro sous Pluxml :cool:
Je travaille maintenant à le remplir...

J'ai conservé mon PR 6 et Google a déjà bien indexé mes pages, ce qui serait parfait si la plupart n'étaient indexées 2 fois, sous les formes
webatou.be/?12-audit-accessibilite
webatou.be/index.php?12-audit-accessibilite

Quand on accède au site depuis l'URL webatou.be (et quand on communique l'adresse d'un site, ce n'est jamais avec une URL du type ./index.php) tous les liens du menu sont sous la première forme, de même si on revient à la page d'accueil en cliquant sur le titre du site dans l'entête.
Par contre si on clique sur "Accueil" dans le menu, on se retrouve avec des URL de la seconde forme.
Ce qui donne donc 2 URL différentes pour la même cible sur une page... j'aime pas trop cela :/

... et Google non plus.
En principe il ne devrait pas y avoir de pénalisation dramatique mais comme le moteur ne retiendra finalement qu'une seule adresse, il risque d'y avoir dispersion de l'effet des backlinks :(

Solution ?
Redirection, URL rewriting... je ne suis pas bien experte dans ce domaine.

Amicalement,
Monique

Réponses

  • Salut, à la place de index.php tu peut le remplacer par :
    <?php echo $pluxml->config['racine']; ?>
    
    ;)
  • Merci pour ta réponse... mais où devrais-je placer ce bout de code ?
    Dans le fichier template.php, après le titre h2 ?
    <h2>Navigation</h2>
    			<?php __('catlist', 'Accueil'); ?>
    
    J'essaie de comprendre et dans le fichier lib/functions.php, je vois
    case 'maintitle':
    			if($option == 'link'){
    				echo '<a href="'.$pluxml->config['racine'].'">'.$pluxml->config['title'].'</a>';
    
    => URL sans index.php
    case 'catlist':
    			echo '<ul>';
    			if ($option != ''){
    				echo '<li><a href="index.php">'.$option.'</a></li>';
    			}
    			foreach($pluxml->cat_used as $cat_num => $cat_info) {
    				echo '<li><a href="?'.$cat_num.'/'.$cat_info['url'].'">'.$cat_info['name'].'</a></li>';
    			}
    			echo "</ul>\n";
    		break;
    
    => URL avec index.php

    J'imagine que Skyline n'a pas fait ce choix au hasard, mais j'avoue que la logique m'en échappe :(
  • DitiDiti Member
    Ben, à ton avis ?
    Les URL sans index.php, je sais pas pour toi mais moi je trouve ça pratique et plus beau.
    Et imagine maintenant que, pour protester contre le vote Sarkozy (au hasard hein, on va savoir les résultats ce soir), un auteur de blog place un fichier index.html expliquant pourquoi on ne peut pas accéder au blog.

    Un visiteur visitant le blog et cliquant sur le lien pour revenir à l'accueil, ne comprendrait pas pourquoi cette page de protestation l'empêche de visiter le blog !
  • Diti a écrit:
    Ben, à ton avis ?
    Les URL sans index.php, je sais pas pour toi mais moi je trouve ça pratique et plus beau.
    C'est l'évidence :P
    Et imagine maintenant que, pour protester contre le vote Sarkozy (au hasard hein, on va savoir les résultats ce soir), un auteur de blog place un fichier index.html expliquant pourquoi on ne peut pas accéder au blog.
    Je te suis toujours... mais dans ce cas l'auteur sait ce qu'il fait, pourquoi il le fait, non ?
    Un visiteur visitant le blog et cliquant sur le lien pour revenir à l'accueil, ne comprendrait pas pourquoi cette page de protestation l'empêche de visiter le blog !
    Ben ce serait voulu et expliqué par le blogueur contestataire dans sa page html... donc je ne vois pas en quoi cela justifie les 2 formes d'URL pour une même page selon la manière dont on entre sur le site :/

    Bon, pour l'adresse du site nous sommes bien d'accord, pas d'index.php, mais pour les liens profonds il ne devrait pas y avoir 2 formes possibles (webatou.be/?12-audit-accessibilite ou webatou.be/index.php?12-audit-accessibilite).
  • DitiDiti Member
    Je suis d'accord avec toi, c'est peut-être pas voulu ces 2 formes :)
    Perso j'avais jamais remarqué :o
  • Bonjour,

    Mon attention a été attirée
    - par mon habitude d'examiner les liens et leur intitulé dans le cadre des directives d'accessibilité
    - par mon vif intérêt pour la mise en application de techniques de référencement naturel

    Je serais vivement intéressée par le point de vue de Skyline à ce sujet :)

    Amicalement,
    Monique
  • Monique a écrit:
    Bonjour,

    Je me suis (enfin) décidée à passer mon site pro sous Pluxml :cool:
    Je travaille maintenant à le remplir...

    J'ai conservé mon PR 6 et Google a déjà bien indexé mes pages, ce qui serait parfait si la plupart n'étaient indexées 2 fois, sous les formes
    webatou.be/?12-audit-accessibilite
    webatou.be/index.php?12-audit-accessibilite

    Quand on accède au site depuis l'URL webatou.be (et quand on communique l'adresse d'un site, ce n'est jamais avec une URL du type ./index.php) tous les liens du menu sont sous la première forme, de même si on revient à la page d'accueil en cliquant sur le titre du site dans l'entête.
    Par contre si on clique sur "Accueil" dans le menu, on se retrouve avec des URL de la seconde forme.
    Ce qui donne donc 2 URL différentes pour la même cible sur une page... j'aime pas trop cela :/

    ... et Google non plus.
    En principe il ne devrait pas y avoir de pénalisation dramatique mais comme le moteur ne retiendra finalement qu'une seule adresse, il risque d'y avoir dispersion de l'effet des backlinks :(

    Solution ?
    Redirection, URL rewriting... je ne suis pas bien experte dans ce domaine.

    Amicalement,
    Monique
    Bonjour Monique,

    En effet un problème se pose puisque les serveurs sont faits pour que les adresses "http://bidule.org/"; et "http://bidule.org/index.php" retournent la même page. La solution la plus simple serait de faire en sorte que nul part sur le site apparaissent le "/index.php" (ce qui implique de revoir quelques ligne de code) mais dans ce cas les adresses en "
    webatou.be/index.php?12-audit-accessibilite" fonctionneraient toujours. Sinon y a l'utilisation des redirections via les .htaccess et les regex, par contre cette solution dépasse des connaissances, il faudra se renseigner sur ces technologies.
  • MoniqueMonique Member
    avril 2007 modifié
    Skyline a écrit:
    Bonjour Monique,

    En effet un problème se pose puisque les serveurs sont faits pour que les adresses "http://bidule.org/"; et "http://bidule.org/index.php" retournent la même page. La solution la plus simple serait de faire en sorte que nul part sur le site apparaissent le "/index.php" (ce qui implique de revoir quelques ligne de code) mais dans ce cas les adresses en "
    webatou.be/index.php?12-audit-accessibilite" fonctionneraient toujours. Sinon y a l'utilisation des redirections via les .htaccess et les regex, par contre cette solution dépasse des connaissances, il faudra se renseigner sur ces technologies.
    Bon... je suis parfois têtue, je sais...

    Quand on entre sur le site depuis "http://www.webatou.be/", toutes les URL prennent automatiquement la forme webatou.be/?12-audit-accessibilite (ce qui est aussi le cas si on retourne à la page d'accueil en cliquant sur le titre du site).
    Aussi longtemps qu'on navigue en ne cliquant que sur les catégories, elles restent de cette forme-là.

    Mais si on clique sur "Accueil" dans le menu, elles prennent automatiquement toutes la forme webatou.be/index.php?12-audit-accessibilite puisque l'URL sur cet item est "http://www.webatou.be/index.php".
    Ce serait donc uniquement cette URL qu'il faudrait changer... mais comment ?
    Dans le fichier template je vois
    <h2>Navigation</h2>
    			<?php __('catlist', 'Accueil'); ?>
    
    'Accueil' c'est une fonction ? une classe ? (désolée si je dis une bêtise, je ne suis pas experte php) Que faudrait-il modifier, et où, pour obtenir l'URL sans index.php ?
    J'ai fouillé dans les différents fichiers, mais pas trouvé.
    C'est tout ce qui manque encore à mon bonheur... :P

    Amicalement,
    Monique
  • Fichier 'lib/functions.php' - Modification de "catlist" :
    case 'catlist':
    
    			echo '<ul>';
    
    			if ($option != ''){
    
    				echo '<li><a href="'.$pluxml->config['racine'].'">'.$option.'</a></li>';
    
    			}
    
    			if($pluxml->uCats){
    
    			foreach($pluxml->uCats as $cat_num => $cat_info) {
    
    				echo '<li><a href="?'.$cat_num.'/'.$cat_info['url'].'">'.$cat_info['name'].'</a></li>';
    
    			}
    
    			}
    
    			echo "</ul>\n";
    
    		break;
    
  • Aaaaah, c'est tout bon !
    Super !!!
    Merciiiii :D

    Petite suggestion en passant, cela pourrait être adopté pour le fichier en téléchargement, non ?

    Amicalement,
    Monique
  • Même mieux, cela sera inclut dans les prochaines version :)
Connectez-vous ou Inscrivez-vous pour répondre.