Patente de Google que filtra posts en Blog Search genera polémica

El año 2011 y por lo que se vé el 2012 seguirá la misma tendencia, será recordado como el año de la censura en Internet. La amenaza de la Ley SOPA, que quedó postergada, fué seguida de una intervención activa de las autoridades norteamericanas efectuando el cierre de dominios que según sus investigaciones no cumplían con la Ley de Derechos de Autor y cometían piratería digital.

Alineado con esa tendencia, Google ha patentado un software que filtra posts existentes en su base de datos antes de presentarlos en una lista de resultados con criterios muy estrictos que eliminan a los que no cumplen con estas exigencias.

creditos: seobythesea

Las reglas que Google utiliza para detectar contenido no deseado y por tanto eliminarlo de la lista de resultados en Google Blog Search, se pueden resumir en las siguientes:

Número de enlaces salientes – Si un mensaje tiene más de un cierto número de enlaces salientes, que podrían ser un número predeterminado, como cincuenta, entonces puede ser eliminado. Estos enlaces salientes podría incluir publicidad oculta.

La falta de enlaces entrantes – Si no hay enlaces entrantes para un post, también podría ser rechazado. Por ejemplo, una entrada de blog puede tener cero enlaces entrantes debido a que la entrada en el blog no contiene toda la información útil y nadie está interesado en él. Esta entrada del blog inútil puede ser eliminado del banco de datos.

Umbral de puntuación de Enlace – Si hay por lo menos un vínculo de acceso al post, este enlace debería alcanzar al menos un nivel mínimo. De no ser así, el post podría no ser incluído en el banco de datos de blogs.

La falta de título – Si la puntuación basada en el enlace es lo suficientemente alta, el siguiente paso podría ser la de determinar si el mensaje tiene un título. Si no tiene título, podría ser rechazada: Por ejemplo, una entrada en el blog sin un título puede indicar que la entrada en el blog no es de confianza y / o su contenido no deseado. Si la entrada del blog tiene un título, entonces la entrada en el blog puede permanecer en el almacén de blogs y no ser rechazado.

Enlaces a dominio de sí mismo - Blogs con vínculos hacia el mismo dominio, ya sea para el post por sí mismo o hacia otras páginas en el mismo dominio, también podría ser removido del almacén de datos, aunque la patente nos dice que esos vínculos dentro del mismo dominio podría ser ignorado en su lugar.

Enlaces a medios de comunicación electrónicos – Mensajes con enlaces a los medios de comunicación electrónicos, tales como imágenes, películas o de audio, es posible que también podría ser rechazados. No se indica en la patente, pero es posible que el rechazo se puede basar en el tipo de contenido al que se está ligados, al igual que los tipos de contenido no deseado mencionado anteriormente.

Longitud suficiente – Si un mensaje no es de una longitud suficiente, también podría ser eliminado. Mientras que la longitud podría ser necesario para ser una cierta cantidad de palabras, por ejemplo, también podría ser una cantidad determinada por un proceso de aprendizaje de la máquina.

Distancia de los enlaces desde el comienzo del post-Si los enlaces de salida en un puesto no aparecen dentro de una cierta distancia predeterminada desde el inicio de un mensaje, también podría ser rechazada. Esta parece ser la intención de evitar que los mensajes que pueden contener demasiados enlaces.

La experiencia reciente de los mensajes – Mensajes que tengan más de cierta cantidad de tiempo predeterminado, como por ejemplo 2 semanas, no se podría incluir en los resultados de búsqueda.

Sin duda Google corta “grueso” y genera polémicas sobre los criterios aplicados, ya que muchos blogs se podrán ver afectados en forma injusta, por considerarlos erróneamente que no contienen calidad de información. Se reciben opiniones.


fuente: seobythesea

Artículos relacionados: