HTML-DublinCore

 view release on metacpan or  search on metacpan

t/test.html  view on Meta::CPAN

permite extraer una serie de coincidencias: </p>
<ul>
  <li>En los estudios que analizan el tama&ntilde;o del &iacute;ndice, los resultados eran 
  favorables al motor Alta Vista hasta que en los mismos se reflej&oacute; la presencia 
  de Google, siendo este motor el que ocupa la posici&oacute;n de privilegio desde 
  entonces. </li>
  <li>Cuando los estudios se basan en el an&aacute;lisis de las posibilidades de 
  b&uacute;squeda, es Alta Vista el m&aacute;s veces destacado </li>
  <li>No existe una tendencia com&uacute;n de resultados en los estudios analizan la 
  interfase gr&aacute;fica de usuario. </li>
</ul>
<h2>Estudios experimentales.</h2>

<p>A continuaci&oacute;n se presentan los estudios m&aacute;s significativos que, dentro de 
este campo, han sido desarrollados en los &uacute;ltimos cinco a&ntilde;os. El prop&oacute;sito de 
esta revisi&oacute;n no es otro que mostrar c&oacute;mo han evolucionado estos procesos de 
an&aacute;lisis y c&oacute;mo se han ido incorporando medidas cada vez m&aacute;s complejas, que van 
adapt&aacute;ndose a las caracter&iacute;sticas del contexto en el que trabajamos, la web.</p>

<h3>Chu y Rosenthal (1996).</h3>
<p>El punto de partida de esta revisi&oacute;n, no puede ser otro que el trabajo 
elaborado por Chu y Rosenthal para la Conferencia Anual de ASIS de 1996, quienes 
comentaban que las diferencias de opini&oacute;n de los estudios expl&iacute;citos resid&iacute;an 
b&aacute;sicamente en la ausencia de una metodolog&iacute;a clara para la evaluaci&oacute;n y se 
preguntaban &quot;si pod&iacute;amos llegar a pensar en desarrollar esa metodolog&iacute;a que 
facilite unos resultados que ayuden al usuario a discernir qu&eacute; herramienta es la 
m&aacute;s apropiada para sus necesidades&quot; (<a href="#Chu, H">Chu, 1996</a>)). </p>
<p>Los autores reutilizan las medidas propuestas por Cleverdon (cobertura, 
exhaustividad, precisi&oacute;n, tiempo de respuesta, esfuerzo del usuario y formato de 
presentaci&oacute;n de los documentos), adaptadas al entorno de la web, considerando 
que siguen siendo v&aacute;lidas casi cuatro d&eacute;cadas despu&eacute;s de enunciarse. As&iacute;, los 
autores plantean un m&eacute;todo de evaluaci&oacute;n donde se valoran cuatro criterios: </p>
<ol>
  <li>Composici&oacute;n de los &iacute;ndices: la Cobertura, la Frecuencia de actualizaci&oacute;n y 
  la Porci&oacute;n de p&aacute;gina indexada. </li>
  <li>Capacidades de b&uacute;squeda: las prestaciones que los distintos motores poseen 
  a la hora de recuperar informaci&oacute;n y la serie de operadores de b&uacute;squeda 
  disponibles. </li>
  <li>Ejecuci&oacute;n de la recuperaci&oacute;n de informaci&oacute;n: la Precisi&oacute;n, la 
  Exhaustividad y el Tiempo de respuesta, procedentes todos ellos de las 
  propuestas cl&aacute;sicas de Lancaster y Fayen (<a href="#Lancaster, F. W.">Lancaster, 1973</a>). </li>
  <li>Esfuerzo del usuario: la Documentaci&oacute;n y la Interfase del sistema (<a href="#Chu, H">Chu,
    1996</a>)). </li>
</ol>
<p>Esta propuesta constituye un substancial salto cualitativo frente a las 
anteriores evaluaciones expl&iacute;citas, al mismo tiempo que se aprovecha de aqu&eacute;llas 
los par&aacute;metros m&aacute;s fiables, se incorpora una serie de cuantificaciones que 
proporcionan una mejor ponderaci&oacute;n de la efectividad de los SRI en la web. Otro 
aspecto a resaltar de este estudio es su fecha de realizaci&oacute;n, apenas dos a&ntilde;os 
despu&eacute;s de la popularizaci&oacute;n de los sitios web y casi contempor&aacute;neo al 
desarrollo de los primeros motores de b&uacute;squeda, lo que le confiere un car&aacute;cter 
ciertamente embrionario dentro de una l&iacute;nea seguida a continuaci&oacute;n por otros 
autores. El &uacute;nico aspecto negativo a se&ntilde;alar de este estudio es el escaso n&uacute;mero 
de motores analizados: Alta Vista, Lycos y Excite, por lo que hace falta 
recurrir a otras experimentaciones para alcanzar una idea m&aacute;s completa sobre el 
estado de la cuesti&oacute;n, aunque quiz&aacute; el escaso n&uacute;mero de motores desarrollados en 
ese momento limit&oacute; el alcance del mismo.</p>
<h3>Leighton y Srivastava (1995-1999).</h3>
<p>De similar importancia al trabajo anterior son las aportaciones de Leighton y 
Srivastava. En el primero de sus trabajos, Leighton evaluaba cuatro motores: 
Infoseek, Lycos, Webcrawler y WWWWorm. Tras la formulaci&oacute;n y ejecuci&oacute;n de ocho 
preguntas, calculaba una serie de medidas basadas en la relevancia, considerando 
adem&aacute;s la ratio de acierto &uacute;nico (documentos recuperados s&oacute;lo en un motor), y el 
n&uacute;mero de enlaces err&oacute;neos junto al n&uacute;mero de documentos duplicados. El 
resultado final de este estudio destaca a Lycos e Infoseek sobre los otros dos. 
El impacto de este trabajo sorprendi&oacute; hasta al mismo autor, quien al principio 
de la p&aacute;gina web donde se recoge una copia de este art&iacute;culo, indica 
textualmente: “me encuentro sorprendido con la popularidad de este estudio”. 
Sorprendido porque los datos incluidos en el mismo ten&iacute;an un corto per&iacute;odo de 
vida y estoy seguro de que los resultados se encuentran absolutamente obsoletos” 
(<a href="#Leighton, 1995">Leighton, 1995</a>). </p>
<p>Esta plena conciencia de obsolescencia le lleva a realizar otros trabajos en 
el mismo campo, contando ya con la colaboraci&oacute;n de Srivastava. En el primero de 
ellos procede a la evaluaci&oacute;n de cinco motores de b&uacute;squeda: Alta Vista, Excite, 
Hotbot, Infoseek, y Lycos . El per&iacute;odo de evaluaci&oacute;n abarcaba de enero a marzo 
de 1997 y en el mismo, los autores introdujeron una interesante variante a la 
t&iacute;pica manera de calcular la precisi&oacute;n, dise&ntilde;ando una funci&oacute;n de evaluaci&oacute;n que 
confiere un peso espec&iacute;fico a la capacidad de colocar documentos relevantes 
dentro de los primeros veinte entregados como respuesta al usuario. Esta 
funci&oacute;n, denominada “First 20 Precision” mide, al mismo tiempo, la precisi&oacute;n y 
el acierto de mostrar los documentos relevantes antes que los documentos que no 
son relevantes. En este estudio se penaliza la existencia de enlaces inactivos, 
de manera que aquellas p&aacute;ginas que no hayan sido actualizadas hace bastante 
tiempo influir&aacute;n de forma decisiva en los resultados (<a href="#Leighton, 1997">Leighton, 1997</a>). Los 
resultados obtenidos en el estudio de la precisi&oacute;n destacan a Alta Vista, Excite 
e Infoseek (por este orden). Cuando se considera el alineamiento, se aprecian 
pocas diferencias pero cambia el orden: Infoseek, Excite y Alta Vista (<a href="#Leighton, 1999">Leighton, 
1999</a>). </p>
<h3>Arents (1995-2001).</h3>
<p>Algunos estudios expl&iacute;citos han evolucionado en estudios experimentales en 
sus sucesivas repeticiones. Un ejemplo es el trabajo desarrollado por Arents 
desde 1995. Este autor selecciona distintos motores de b&uacute;squeda y los clasifica 
seg&uacute;n una escala: {Mejor-Muy bueno-Bueno-Útil}, basando sus apreciaciones en la 
facilidad de uso y en la efectividad del motor, entendida &eacute;sta como la cantidad, 
precisi&oacute;n y legibilidad de los documentos recuperados.</p>
<h3>Bharat y Broder (1997).</h3>
<p>Este estudio pretende medir “los tama&ntilde;os relativos de los &iacute;ndices de los 
motores de b&uacute;squeda analizados y su grado de solapamiento” (<a href="#Bharat, 1998a">Bharat,
1998a)</a>. Los 
motores analizados fueron cuatro: Alta Vista, Excite, Hot Bot e Infoseek, y se 
tomaron datos en dos per&iacute;odos de tiempo, junio y noviembre de 1997. Con relaci&oacute;n 
al solapamiento, los cambios producidos en este per&iacute;odo de seis meses fueron 
insignificantes, estim&aacute;ndose del 1.4%. Los tama&ntilde;os relativos estimados presentan 
cifras consistentes de un experimento a otro, aunque cambia el orden, ya que en 
junio Hot Bot supera a Alta Vista, Excite e Infoseek (por este orden) y en 
noviembre, Alta Vista supera a Hot Bot. </p>
<h3>Ralph (1997).</h3>
<p>Ralph realiz&oacute; veinticinco preguntas, la mayor parte de ellas correspondientes 
a t&eacute;rminos individuales, nombres de personas o instituciones o materias, sobre 
siete motores y un directorio (Yahoo). As&iacute; analiz&oacute; el n&uacute;mero de documentos 
recuperados, la precisi&oacute;n, la exhaustividad relativa y el alineamiento. Para 
estudiar este &uacute;ltimo aspecto, valoraron la presencia de los documentos 
relevantes al principio de la secuencia de documentos entregados como resultado. 
Los resultados de la precisi&oacute;n obtenidos en este estudio dividen a los motores 
analizados en dos grupos claramente diferenciados. El primero de ellos agrupa a 
Alta Vista, Excite, Hot Bot e Infoseek (que alcanzan porcentajes superiores al 
60%), frente al resto de motores cuyos valores oscilan entre el 30% de Lycos y 
el 35% de Webcrawler. El motor que mejor porcentaje alcanza de exhaustividad 
relativa es Hot Bot, que supera ligeramente el 25%. La ponderaci&oacute;n del 
alineamiento de los documentos igualaba a Hot Bot y Excite. </p>
<h3><a href="#Wishard">Wishard</a> (1998).</h3>

t/test.html  view on Meta::CPAN

  <td width="52" align="center">&nbsp;</td><td width="27" align="center">&nbsp;</td>
  <td align="center" width="76">5</td></tr>
<tr><td height="19" width="99">Gwidzka</td>
  <td width="40" align="center">X</td><td width="37" align="center">&nbsp;</td>
  <td width="38" align="center">&nbsp;</td><td width="49" align="center">&nbsp;</td>
  <td width="52" align="center">&nbsp;</td><td width="27" align="center">&nbsp;</td>
  <td align="center" width="76">6</td></tr>
<tr><td height="19" width="99">Ming</td>
  <td width="40" align="center">X</td><td width="37" align="center">&nbsp;</td>
  <td width="38" align="center">&nbsp;</td><td width="49" align="center">&nbsp;</td>
  <td width="52" align="center">&nbsp;</td><td width="27" align="center">&nbsp;</td>
  <td align="center" width="76">5</td></tr>
<tr><td height="19" width="99">Notess</td>
  <td width="40" align="center">&nbsp;</td><td width="37" align="center">&nbsp;</td>
  <td width="38" align="center">&nbsp;</td><td width="49" align="center">&nbsp;</td>
  <td width="52" align="center">&nbsp;</td><td width="27" align="center">X</td>
  <td align="center" width="76">5</td></tr>
<tr><td height="19" width="99">Lojsland, 1999</td>
  <td width="40" align="center">X</td><td width="37" align="center">&nbsp;</td>
  <td width="38" align="center">&nbsp;</td><td width="49" align="center">&nbsp;</td>
  <td width="52" align="center">&nbsp;</td><td width="27" align="center">&nbsp;</td>
  <td align="center" width="76">1</td></tr>
<tr><td height="19" width="99">Lojsland, 2000</td>
  <td width="40" align="center">&nbsp;</td><td width="37" align="center">&nbsp;</td>
  <td width="38" align="center">&nbsp;</td><td width="49" align="center">&nbsp;</td>
  <td width="52" align="center">X</td><td width="27" align="center">&nbsp;</td>
  <td align="center" width="76">5</td></tr>
<tr><td height="19" width="99">Thomas, 2002</td>
  <td width="40" align="center">&nbsp;</td><td width="37" align="center">X</td>
  <td width="38" align="center">&nbsp;</td><td width="49" align="center">&nbsp;</td>
  <td width="52" align="center">&nbsp;</td><td width="27" align="center">&nbsp;</td>
  <td align="center" width="76">2</td></tr>
</table>

<p>La mayor&iacute;a de las veces se analizan, como m&aacute;ximo, seis motores (9 de 14 
veces). En cuanto al n&uacute;mero de par&aacute;metros de cada estudio, el de Chu y Rosenthal 
(curiosamente el primero) llega a emplear nueve, siendo m&aacute;s normal analizar 
cinco o seis variables (hecho ocurrido 7 de las 12 ocasiones restantes). 
Siguiendo la l&iacute;nea marcada por este estudio, al analizar un n&uacute;mero considerable 
de par&aacute;metros en pocos motores, lo normal ser&iacute;a que este grupo mayoritario de 
estudios analizase un conjunto reducido de motores, aunque no existe una 
tendencia clara en este punto, ya que su cobertura es muy diversa.</p>

<h2>Propuestas globales de evaluaci&oacute;n.</h2>

<p>Oppenheim presenta una sugerencia de criterios m&iacute;nimos necesarios para el 
dise&ntilde;o de una metodolog&iacute;a de evaluaci&oacute;n, fruto de una exhaustiva s&iacute;ntesis de las 
medidas empleadas en otros trabajos anteriores (Oppenheim, 2000). A este trabajo 
le sigue un interesante estudio realizado por Savoy y Picard (<a href="#Savoy, J.">Savoy, 2001</a>), 
donde analizan la efectividad de los distintos modelos sobre los que se basan 
los SRI en la web, en lugar de analizar el comportamiento de un motor espec&iacute;fico 
frente a otro. El tercero de los trabajos que se presenta expone la necesidad de 
encontrar una metodolog&iacute;a ajena a los juicios de relevancia, basada en unos 
par&aacute;metros de sensibilidad y utilidad de los documentos. Por &uacute;ltimo, el cuarto 
trabajo recogido presenta una propuesta global de evaluaci&oacute;n de los SRI en la 
web elaborada desde el punto de vista del usuario final (<a href="#Johnson, F.C">Johnson, 2001</a>).</p>

<h3>Oppenheim (2000).</h3>

<p>A partir de la s&iacute;ntesis de estudios de evaluaci&oacute;n anteriores, los autores 
formulan una metodolog&iacute;a de evaluaci&oacute;n de los motores de b&uacute;squeda, agrupando los 
m&eacute;todos m&aacute;s empleados en cuatro categor&iacute;as: </p>
<ul>
  <li>Evaluaciones a peque&ntilde;a escala </li>
  <li>Evaluaciones basadas en los tests Cranfield </li>
  <li>Evaluaciones basadas en los tests Cranfield con estimaci&oacute;n del tama&ntilde;o del 
  motor </li>
  <li>Evaluaciones que eluden la exhaustividad </li>
</ul>

<p>La Tabla 8 sintetiza el conjunto de criterios empleados y las conclusiones 
que de su estudio se extrajeron.</p>

<table bgcolor="#FBFFDF" align="center" cellpadding="4">
<caption align="bottom"><strong>Tabla 8: </strong>Resumen de caracter&iacute;sticas 
empleadas en las evaluaciones de los SRI. Fuente: <a href="#Oppenheim, C.">Oppenheim, 2000</a>.</caption>
<tr><th>Criterio</th>	<th>Conclusiones generales</th></tr>
<tr><td align="left"><span lang="ES">N&uacute;mero de p&aacute;ginas 
  cubiertas y cobertura</span></td><td align="justify">
  <p align="justify"><span lang="ES">Ning&uacute;n motor de 
  b&uacute;squeda por s&iacute; solo indexa toda la web. Los resultados adem&aacute;s proyectan 
  algunas dudas sobre la validez de usar la exhaustividad relativa como medida.</span></td></tr>
<tr><td align="left"><span lang="ES">Actualizaci&oacute;n del 
  &iacute;ndice y n&uacute;mero de enlaces err&oacute;neos</span> </td><td align="justify">
  <span lang="ES">La frecuencia de actualizaci&oacute;n es un 
  par&aacute;metro casi tan importante como el tama&ntilde;o del &iacute;ndice del motor.</span></td></tr>
<tr><td align="left"><span lang="ES">Relevancia</span></td>
  <td align="justify">	<span lang="ES">Normalmente se 
  hace uso de una visi&oacute;n binaria de la relevancia (s&iacute;-no), aunque otros 
  introducen escalas.</span></td></tr>
<tr><td align="left"><span lang="ES">Sintaxis</span></td>
  <td align="justify"><span lang="ES">Se identifican 
  tres categor&iacute;as: frases, lenguaje natural y booleanas.</span></td></tr>
<tr><td align="left"><span lang="ES">Materias</span></td>
  <td align="justify"><span lang="ES">Campo no muy 
  estudiado. Es normal que un motor ofrezca mejores resultados en un &aacute;rea que en 
  otra.</span></td></tr>
<tr><td align="left"><span lang="ES">La din&aacute;mica 
  naturaleza de la web</span></td><td align="justify">
  <span lang="ES">Una p&aacute;gina puede cambiar o 
  desaparecer al poco de ser indexada. Esto implica que los resultados ofrecidos 
  por distintos motores sean diferentes. Los experimentos deben contemplar este 
  dinamismo y las evaluaciones deben hacerse en fechas pr&oacute;ximas y repetirse a 
  para incorporar los cambios que se vayan produciendo.</span></td></tr>
<tr><td align="left"><span lang="ES">Tiempo de 
  respuesta</span></td><td align="justify">
  <span lang="ES">Par&aacute;metro de dif&iacute;cil c&aacute;lculo y muy 
  supeditado al tr&aacute;fico de la red</span></td></tr>
<tr><td align="left"><span lang="ES">Caracter&iacute;sticas 
  diferentes del sistema</span></td><td align="justify">
  <span lang="ES">Las caracter&iacute;sticas de cada sistema 
  influyen considerablemente en sus usuarios. Destacan varios trabajos que 
  recomiendan hacer uso de motores <i>ad hoc</i> para cada necesidad particular 
  de informaci&oacute;n.</span></td></tr>
<tr><td align="left"><span lang="ES">Opciones de 
  b&uacute;squeda</span></td><td align="justify">
  <span lang="ES">Si los motores hacen uso de 
  b&uacute;squedas simples y/o avanzadas. Algunos emplean otros tipos de b&uacute;squedas m&aacute;s 
  complejas. Tambi&eacute;n se estudian las preferencias de b&uacute;squeda de los usuarios</span></td></tr>
<tr><td align="left"><span lang="ES">Factores humanos 
  y cuestiones de la interface</span></td><td align="justify">



( run in 0.672 second using v1.01-cache-2.11-cpan-df04353d9ac )