Sphinx 0.9.8.1

Ja podem descarregar la nova Sphinx 0.9.8.1, una versió prévia a la 0.9.9 que corregeix diversos errors de la versió anterior:

  • added configure script to libsphinxclient
  • changed proximity/quorum operator syntax to require whitespace after length
  • fixed handling of incomplete remote replies (caused over-degraded distributed results, in rare cases)
  • fixed sending of big remote requests (caused distributed requests to fail, in rare cases)
  • fixed FD_SET() overflow (caused searchd to crash on startup, in rare cases)
  • fixed MVA vs distributed indexes (caused loss of 1st MVA value in result set)
  • fixed tokenizing of exceptions terminated by specials (eg. “GPS AT&T” in extended mode)
  • fixed buffer overrun in stemmer on overlong tokens occasionally emitted by proximity/quorum operator parser (caused crashes on certain proximity/quorum queries)
  • fixed wordcount ranker (could be dropping hits)
  • fixed –merge feature (numerous different fixes, caused broken indexes)
  • fixed –merge-dst-range performance
  • fixed prefix/infix generation for stopwords
  • fixed ignore_chars vs specials
  • fixed misplaced F_SETLKW check (caused certain build types, eg. RPM build on FC8, to fail)
  • fixed dictionary-defined charsets support in spelldump, added x-style wordchars support
  • fixed Java API to properly send long strings (over 64K; eg. long document bodies for excerpts)
  • fixed Python API to accept offset/limit of ‘long’ type
  • fixed default ID range (that filtered out all 64-bit values) in Java and Python APIs

A més hi ha novetats interessants amb les aportacions de tercers al motor de cerques, com el port a PECL API o el mòdul de Drupal. I a banda de les novetats pel que a software es refereix, també s’ha afegit documentació i presentacions del motor.

Universia.es de PR10 a PR6

¡Y sin pasar por la casilla de salida! Universia.es pasará a la historia como la primera web española que consiguió un PageRank 10 pero seguramente también como la web que más rápido lo perdió.

Ahora mismo el portal tiene un PR6, bajo mi punto de vista, a causa de alguna penalización por enlaces patrocinados.

Veremos si hacen una petición de reconsideración y como resulta.

Actualización: Vuelve a tener un PR10, ¿baile de PR? ¿Tendrá algo que ver la redirección a “index.htm” que ahora hacen y antes no hacían?

SEO: Múltiples idiomas, dominios, subdominios, …

Ante la típica duda SEO de como planetar un site multiidioma a nivel de dominios o URLs, Matt Cutts responde lo siguiente en el Webmaster Chat del mes de Octubre:

Suppose my website supports English and French. Should the English version of a particular page and the French version have different URLs? Any other best practices for multi-lingual site architecture?
Matt Cutts: If you can afford it, I would do domain.com and domain.fr. If that’s not possible, I would consider doing en.domain.com and fr.domain.com. If that’s not possible, then domain.com/en and domain.com/fr can work. In webmaster tools, you can geographically target a site (and I believe parts of a site such as fr.domain.com), which will help as well.

Si nos cogemos al pié de la letra lo que responde Matt, podemos suponer que la apuesta ganadora es en primer lugar usar dominios diferentes, subdominios si no es posible trabajar con multi-dominios y en último caso los subdirectorios en un mismo dominio.

Lógicamente,  esta decisión será relevante para nuestro posicionamiento, pero tiene que ir acompañada de más decisiones acertadas. Ya sabemos que una única decisión adecuada no es concluyente en esta labor.

5 razones para añadir vídeo en tu blog

Interesante artículo el de Dee Barizo en Business Logs en el que comenta cinco razones para añadir el vídeo en tu blog. A modo de resumen, incluyo enumero las cinco razones, aunque recomiendo leer el detalle del post.

  1. El vídeo incrementa la percepción de valor de tu site.
  2. A mucha gente no le gusta leer.
  3. Los sites que comparten vídeos tienen mucho tráfico.
  4. Los vídeos incrementan los ratios de conversión.
  5. El vídeo añade valor diferencial a tu site.

Amagant informació de l’Apache i del PHP

Sempre que acabo la instal·lació d’un Apache he de buscar com amagar les capçaleres que informen de les versions del programari instal·lades al servidor, quelcom així:

Server: Apache/2.2.3 (Debian) PHP/5.2.0-8+etch13 mod_ssl/2.2.3 OpenSSL/0.9.8c
X-Powered-By: PHP/5.2.0-8+etch13

Avui m’apunto les directives:

  1. A la config de l’Apache:
    ServerTokens ProductOnly
    ServerSignature Off
  2. A la config del PHP:
    expose_php Off

Apa doncs, recarreguem l’Apache i llestos, ens queda una capçalera la mar de discreta:

Server: Apache

WordPress 2.6.3

Tot just ahir vaig avisar a una gent que tenien el blog ple d’spam per una vulnerabilitat de WordPress de l’any de la pica, els hi recomano actualitzar de WordPress i abans no acaben de fer-ho… pam! Nova versió 😉

Aquest cop l’actualització de WordPress afecta a una llibreria que s’empra per a tractar els feeds que apareixen al Dashboard.

Apa doncs, a actualitzar! Sort que fa un temps vaig decidir reinstal·lar els WordPress del servidor via SVN i ara fer actualitzacions és bufar i fer ampolles 😉

svn sw http://svn.automattic.com/wordpress/tags/2.6.3/ .

I a córrer!

La CMT abre un blog en WordPress.com

Parece mentira, pero no lo es.  La CMT ha hecho un paso hacia adelante en la comunicación con el mundo y ha abierto un blog y una cuenta de Twitter.

La plataforma escogida para crear el blog a sido WordPress.com, descartando las plataformas made in Spain a pesar de que los mensajes del gobierno sobre la importancia de consumir productos españoles. Será que consideran que no hay ningún producto español que ofrezca lo mismo que la plataforma de estos chicos.

En cualquier caso, parece que los órganos públicos empiezan a romper la barrera del papel y entran en contacto con nuevos medios con objetivos diversos, el del blog de la CMT está claro:

Ponemos en marcha este blog para hablar de regulación y de telecomunicaciones en general, con el objetivo de explicar qué se esconde detrás de acrónimos impronunciables y de tecnicismos amenazantes. Queremos también abrir un nuevo canal de comunicación con aquellas personas interesadas en el sector y el conjunto de los usuarios, con el fin de divulgar y dar a conocer de manera directa las acciones de la Comisión.

Saltarse Canguro Net, ahora en vídeo

Viendo que mucha gente necesita ayuda para desactivar Canguro Net he optado por hacer tres vídeos explicativos de cómo activar un proxy que nos ayudará a evitar Canguro Net sin necesidad de llamar al servicio de atención telefónica.

Veréis que todos empiezan en la web que os recomendé con un listado de proxys gratuitos. El proxy elegido en los vídeos es al azar, deberéis probar cual os funciona mejor.

  1. Saltarse Canguro Net en Internet Explorer 6
  2. Saltarse Canguro Net en Internet Explorer 7
  3. Saltarse Canguro Net en Firefox

Espero que os sirva de ayuda, aunque la mejor opción es contratar una ADSL que no tenga Canguro Net

😉

¿Software vulnerable peor SEO?

El pasado jueves, en el Official Google Webmaster Central Blog anunciaban que Google está testeando la notificación, vía WebmasterTools, de la peligrosidad de tu CMS.

Aviso Google WebmasterTools

Esto es, si tienes una versión de WordPress antigua y vulnerable, recibirás un aviso a través de las Google WebmasterTools que te informará de la peligrosidad de usar esa versión del CMS y recomendándote una actualización.

Esta nueva herramienta o utilidad de Google puede ser de gran interés para los Webmasters despitados que disponen de versiones antiguas y vulnerables de su CMS en producción. Pero cabe que nos preguntemos algo más ¿afectarán estas notificaciones, o esta información, al posicionamiento de nuestra página en Google?

Siguiendo la misma lógica que se usa para dar importancia al hosting de nuestro site a la hora de rankear (mayor fiabilidad del hosting = mejor posicionamiento), parece lógico pensar que para Google un site vulnerable es menos de fiar que uno que no lo sea, ya que en cualquier momento puede ser hackeado y sus contenidos pueden cambiar radicalmente.

Está claro que si Google recoge esta información, algún motivo (a parte de informar al usuario gratuitamente) debe tener.

Y si aceptamos que este factor puede influir en el SEO de nuestra página nos podemos hacer muchas preguntas:

  • ¿Será mejor, hablando únicamente de SEO,  no usar un CMS genérico para nuestro site?
  • ¿Deberemos esconder nuestro CMS o nuestra versión del mismo a los crawlers?
  • ¿Empezará a hacer Google testeos de vulnerabilidades sobre dominios para penalizar sites vulnerables?

¿Estamos ante un nuevo parámetro del algoritmo? ¿O quizás no es tan nuevo?