Un 'detective web' permite recuperar o 81% dos enlaces rotos

Buscar

Susbcrición Newsletter

Introducir e-mail

Arquivo mensual

Vindeiros eventos

Non hai eventos polo momento
Para acabar co molesto problema dos links erróneos, un grupo de investigadores da UNED desenvolveu un sinxelo sistema baseado en seguir a pista que este contido deixa na web. Segundo os investigadores, a nova ferramenta permite recuperar ata o 81% dos enlaces obsoletos.

Algúns estudos calculan que o 67% das direccións de Internet se converten en erróneas tras un período de catro anos de vida. Nalgunhas ocasións, o enlace é incorrecto porque a páxina desapareceu e, noutros casos, porque a información foi movida de sitio. Investigadores da UNED desenvolveron un sistema que fai a función dun 'detective privado' para atopar as pistas dese contido e seguir así o seu rastro.

"Estas pistas consisten en referencias e enlaces obsoletos en motores de busca, librerías dixitais, servizos web e redes sociais", explica Juan Martínez-Romo, investigador do grupo de procesamento de linguaxe natural e recuperación de Información da UNED e autor principal do proxecto.

Solicitadas as pistas, o sistema ao que se denominou Detective Brooklynk elabora dinamicamente unha estratexia para atopar a páxina desaparecida ou unha equivalente da forma máis eficiente, é dicir, consumindo os mínimos recursos e o menor tempo. Deste modo, inserindo o link erróneo, o programa devolve ao usuario unha lista de enlaces nos que pode estar a información que busca, xa sexa da mesma páxina ou ben doutras que o recolleran.

Para comprobar a efectividade da ferramenta, cuxo desenvolvemento se publicou na revista Information Processing and Management' os investigadores seleccionaron aleatoriamente un conxunto de páxinas con enlaces rotos e intentaron recuperar o seu contido. "Co sistema que desenvolvemos, conseguimos recuperar o 81% dos links erróneos", asegura Martínez-Romo.

Os motores de busca penalizan

O problema dos enlaces obsoletos é unha das materias pendentes de Internet, e prexudica tanto a usuarios coma a creadores. "É evidente que, de cara a un internauta, atopar este tipo de problemas dificulta e entorpece as súas buscas, pero, ademais, isto repercute nunha perda de fiabilidade e prestixio para o dono da páxina", comenta o investigador.

A estas molestias súmase o feito de que os motores de busca penalizan ás páxinas á hora de mostralas na lista de resultados. Nos últimos anos, apareceron algoritmos que propoñen a modificación do PageRank (algoritmo de ranking utilizado polos motores de busca) para que teña en conta esa clase de erros.

O sistema desenvolvido pola UNED evitaría esta penalización, explica o responsable do proxecto. Á espera da súa versión definitiva, é un prototipo que utiliza parte das estratexias presentadas no artigo.

(Fonte: UNED)