Voici.fr,

Encore lui, a été à l’origine d’un record sur notre architecture. La rédaction à vraiment acquis un savoir faire web / SEO qui donne un résultat conséquent et mesurable.

Ce record démontre l’intérêt d’une optimisation pour les caches web de ez Publish et démontre également que les performances reverse proxy de SQUID sont importantes pour encaisser les coup de butoir de l’audience.

Record de BP grace a voici.fr

80Mb/s, chapeau

Nous somme bien partie pour dépasser le million de pages vue en 24h sur la plate-forme. Je rappel que Voici.fr ce n’est que 3 reverses proxys mutualisé et 4 frontaux php5 également mutualisé avec Gala.fr, Geo.fr et quelque brouille.

Mise à jour

Haa l’actualité est riche, après analyse c’est le résultat de la conjonction d’une remonté d’article dans Google Actualité et Yahoo Actualité plus une newsletter tardive et non maitrisée.

 

L’OJD ouvre un site web dédié à son activité de tiers certificateur des audiences web de ces membres.

Ces chiffres à destination des agences, annonceurs, éditeurs, journalistes… sont établis à partir de normes reconnues sur le plan international. L’OJD est membre fondateur de l’International Federation of Audit Bureaux of Circulations (IFABC) qui regroupe les pays les plus avancés et les plus actifs dans ce domaine (Etats-Unis, Allemagne, Grande-Bretagne, Espagne…).

Comme je l’expliquais sur mon billet à propose de l‘audience de septembre Tele-loisir.fr et de Voici.fr. L’OJD, est l’unique organisme de certification en France des données de fréquentation de l’Internet, publie chaque mois les résultats de trafic et d’audience de tous ses adhérents qui regroupe les plus grand site français.

L’OJD vous permet de ainsi de comparer les audience en terme de visite et visiteur unique ainsi que le véritable effort de production en pages vue des grands sites web de presse français toutes les données certifiées sont accessibles en accès gratuit sur ce site.

 

Les chiffres OJD d’audience de Septembre 2009 sont publié. Il contabilise les pages vue, visite et visiteur unique des adhérent OJG. Adhérent qui regroupe de plus en plus de grand acteur français ton la quasi intégralité des sites de presse.

Tele-loisir.fr : 14% de pages vues supplémentaire selon l’OJD

Dans le classement OJD des sites grand public français Télé-loisir.fr est huitième devant Liberation.fr ou leparisien.fr avec 27 059 401 93 532 009 pages vues. Je commentais récemment du fait que nous avions battu notre record de production en septembre. Ce record explique le bon de 14% de pages vues supplémentaire.

Dans cet articles je donnais quelque une des pistes technique suivies pour soutenir une tel audience.

Voici.fr : le plus puissant des sites people selon Nielsen

Je vais citer le communiqué de presse de Prisma : Le site Voici.fr a enregistré en août un nouveau record d’audience avec 2 346 000 visiteurs uniques selon Nielsen, soit une progression de 14% (vs juillet 2009). Une performance qui permet à Voici.fr de passer devant son principal concurrent et de prendre la place de leader des sites d’actualité people français.

Je pense que que la stratégie du SEO Backling Discovery à du contribuer à ce résultat. Le pouvoir du mod_rewrite est immense… Un énorme potentiel de liens pas en valeur car débouchant sur des 404 ou du duplicate content que vous formatez correctement à coup de 301 c’est le coup d’accélérateur décisif.

Je pense également que la stabilité et la qualité constante de la diffusion même au moment du pic d’audience historique de la mort de Michael Jackson ne sont pas étrangés à ce succès.

 

Record de pages vues

Nous avons vue tomber notre record de production le dimanche 27 septembre 5 150 253 pages vue xiti sur Télé-loisirs.fr. La raison de ce record m’échappe mais visiblement les internautes avait une bonne raison de consulter notre site.

Bp.TEL.Record.5M.png

L’effet sur la bande passante d’un serveur

Analyse

Quel sont les particularités du site Télé-loisirs.fr ? De son contenue ? De son audience ?

  1. 80% de l’audience ce fait entre 18h et 21h. Cela correspond aux personnes qui ce demande quel programme regarder ce soir
  2. Chaque fiche programme comporte et dois comporter une images pour illustration et identification du contenu.
  3. Très peu de visiteur interagisse avec le contenu, peu de commentaire sur les programmes, peu de notation etc. L’utilisation du site est « informatif ».

En fonction des ces constatations des choix on été fait et des arbitrages rendus :

  1. Le moteur de recherche, le forum et autre commentaire sont débrayer durant la pointe d’audience
  2. Une séparation en silos du contenu, d’un coter les images, css, javascript purement statique, de l’autre les pages web qui sont plus mouvante et changeante.
  3. Un système de cache pour les pages web sur un durée minimum évitant leur recalcule
  4. Une mise à jour des donnée variable qui n’est pas immédiate. Cela concerne le nombre de commentaire, la notation (nb étoile).
  5. Une mise à jour de la grille des programmes par ordonateur.

En pratique

Ces choix ce traduise dans la pratique par plusieurs solution:

  • Les pages web sont généré en php, un fois calculer sont stocké au format html. L’application leur attribue un temps de vie. Elles ne sont régénérés que à l’expiration de leur temps de vie. Ainsi on limite l’utilisation des frontaux web.
  • Le serveur web utilisé est lighttpd, plus rapide pour les éléments statique que apache.
  • Un sous domaine est dédié aux éléments statiques.
  • Un service de cache type CDN est utilisé pour les éléments statique. En conséquence la plate-forme ne crache vraiment que du html.
  • Au moment de l’audience maximum le temps de vie des pages mise à cache est « figé ». Aucune pages ne vieilli et donc plus aucun recalcule php est réalisé.
  • Un peu avant l’audience maximum la grille de programme est figé et ne fais plus l’objet de mise à jour. Mise à jour qui de toute façon sont extrêmement rare.
  • Le serveur de base de donnée Mysql est configurer pour la lecture. Toute écriture en base est donc plus longue. L’utilisation de script de tunnig Mysql est nécessaire à cette étape.
  • Utilisation du mod_compress de lighttpd pour « zipper » les fichiers css. Les fichiers css, parfois lourd du fait de refonte de design multiple, sont plus léger et on économise de la bande passante.
  • Utilisation du mod_expire de lighttpd pour configurer les mises en cache navigateur des images et css. Les images et css sont donc moins souvent demandées.

TEL.jpg

Plan de l’architecture

Et pour faire mieux ?

Pour faire mieux et sans réfléchir bien longtemps je pense à différente possibilité, entre autre :

  1. Laisser lighttpd et revenir à apache
  2. Ne plus faire de cache statique avec l’application
  3. Utiliser une couche de reverse proxy en amont des frontaux (squid ou CDN)
  4. Utiliser deux serveurs de base de donnée, un pour le contenue statique, l’autre pour le contenu dynamique. Le premier serveur serait configurer pour favoriser la lecture le second pour l’écriture.
  5. Peut être un partage de donnée entre frontaux basé sur OCFS2
 

L’audience et la page vue

Je vous parle parfois de forte audience sur voici.fr ou gala.fr par exemple au moment de la mort de Mickael Jaskson. J’évoque des fortes charge absorbé avec l’aide de NAS, squid et autre. Mais comme être sur de ce que j’avance ? Comment comparer avec votre architecture ? Est ce que ce les techniques ou solution que je dis utiliser sont si efficace ? Et les autres ils bourrent à combien sur leurs babasse ?

Bref « il est gros à quel point ton site ? »

Continue reading »

© 2012 Karlesnine Suffusion theme by Sayontan Sinha