EL RESUMEN EN LOS TIEMPOS DEL RSS
-INTRODUCCIÓN.
1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.
2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.
3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN COMÚN.
4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0: RSS.
5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.
-INTRODUCCIÓN.
En este post
mi intención es analizar el RSS
como herramienta para el resumen documental,
o lo que es lo mismo averiguar si en el universo 2.0 hay un hueco para
el resumen documental igual que vimos que si existía para la indización. La
respuesta antes de efectuar en sí el análisis, es si y no. Sí, porque no siendo
una herramienta específica de resumen documental, su potencialidad y usos es
enorme. No, porque en esencia no es lo mismo que el resumen documental. Veremos
si después del análisis del RSS nuestra impresión es la misma que la que parece
a simple vista.
Una vez
establecido la intención de este post, creo que es conveniente definir los
conceptos resumen documental y rss.
1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.
Resumen documental según la wikipedia
es: “Una representación abreviada, objetiva y precisa del contenido de un
documento o recurso, sin interpretación crítica y sin mención expresa del autor
del resumen”
El resumen es
un documento secundario muy provechoso para los profesionales y estudiosos por
su potencial informativo, sin embargo, que sea un documento secundario no
quiere decir que no sea un verdadero texto autónomo del anterior, es decir es
independiente con respecto al texto al que hace referencia. Otra característica
es que se pueden hacer distintos resúmenes de un mismo texto, por lo que pueden
ser muy diversos.
Una vez definido
el qué, es ineludible explicar por qué
surge y con qué fin, a la vez que
expresamos brevemente la evolución
del resumen documental en el tiempo.
Cuando no
habían aparecido las nuevas tecnologías en el mundo de la documentación, se
estimaba que un investigador de media tardaba un 70% de su tiempo de
investigación en encontrar información, de tal forma que tardaba más tiempo en
buscar información que en la investigación propiamente dicha. A partir de ese
momento, se decidió incluir resúmenes en los trabajos científicos, de tal forma
que el investigador pudiera dedicar más tiempo a su investigación. Pero el
problema sólo se solucionó en parte, muchas veces encontrar los documentos que
uno necesitaba era tedioso, engorroso y sumamente lento, cuando no imposible,
perdiéndose tiempo en realizar investigaciones que ya habían sido realizadas.
Igualmente no se encontraban investigaciones que mostraban descubrimientos
críticos para nuestras propias investigaciones. Es por esto que se decidió
crear unas revistas exclusivas de resúmenes para que los investigadores
tuvieran constancia de aquellos avances y pudieran saber que ese documento existía
e incluso encargarlo a un centro de documentación. Aunque esto supuso un gran
avance y un gran ahorro de tiempo para el investigador, esas revistas eran
caras y difíciles de realizar, por lo que había pocos ejemplares. Con la
llegada de las nuevas tecnologías y gracias a los resúmenes, el investigador ha
podido usar la mitad de su tiempo en encontrar información y la otra mitad en
analizarla y realizar investigaciones.
Como
conclusión el resumen tiene por objeto exponer de forma breve los contenidos principales
de un documento con el fin de facilitar su indización, búsqueda y recuperación,
así como dar a conocer de antemano el contenido del documento o recurso para
que el usuario decida sobre la conveniencia de consultar o no el texto
completo.
Hay que decir
por último que la importancia del resumen es tal que se han realizado normas
ISO y UNE para definir y clasificar a este tipo de documento. En concreto son
la norma ISO 214-1976: Documentation
Abstracts for publications and documentation y la norma UNE 50-103-1990 de Documentación
y preparación de resumenes.
2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.
Por otro lado
el RSS según la wikipedia son “las
siglas de Really Simple Syndication,
un formato XML para sindicar o compartir contenido en la web. Se utiliza para
difundir información actualizada frecuentemente a usuarios que se han suscrito
a la fuente de contenidos”.
Siguiendo con la wikipedia “Cuando hablamos de RSS
nos referimos usualmente a la tecnología completa para distribución de
contenidos de los sitios web. Pero un RSS es realmente un formato de archivo,
basado en XML, que sirve para recoger contenidos publicados en páginas web. Los
RSS tienen extensión .rss o bien .xml, pero en realidad son un simple archivo
de texto donde aparecen referencias a contenidos publicados, en un formato
específico, creado a partir de XML.
En el archivo RSS simplemente están los datos de las
novedades del sitio, como el título, fecha de publicación o la descripción. El
programa que lea el RSS será encargado de darle estilo o apariencia a los datos
que se incluyan en el archivo y presentarlos de una manera atractiva al usuario
y de fácil lectura.
Que RSS sea un formato basado en XML significa que
el archivo RSS se compone por una serie de etiquetas definidas que tendrán un
formato dado, que respetará las reglas generales de XML.”
Mostremos ahora algunas de las utilidades del RSS:
- Feed de blog- cada entrada de blog es resumida como un item de feed. Esto hace que los posts de los blogs sean más fáciles de buscar, habilitando a los visitantes para que encuentren lo que les interesa.
- Feed de artículos- esto alerta a los lectores cuando hay nuevos artículos y contenidos web disponibles.
- Feed de foros-esto permite a los usuarios recibir post de foros y los temas de las últimas discusiones.
- Feed de actividades -esto permite a los usuarios (escuelas, clubs, y otras organizaciones) publicar nuevos eventos o anunciar cambios en sus calendarizaciones.
- Feeds especiales o de descuentos – esto habilita a los usuarios (como tiendas de retail y online) entregar ofertas y descuentos de último minuto.
- Ego o Monitoreo de noticias – esto habilita a los usuarios para recibir titulares filtrados o noticias basadas en cierta frase o palabra clave.
Aparte de las ventajas obvias del RSS como son estar
al día de las últimas noticias y que es el usuario el que decide que le llega,
habría que citar también las siguientes:
- En el RSS no existe el SPAM, no recibes otra información que la que el usuario ha ido eligiendo
- Facilidad de uso, tanto para darse de alta en contenidos como para darse de baja.
- Gratuidad del servicio, lógicamente si se trata de documentos de una revista de pago por ejemplo, debes estar suscrito a la revista.
3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN
COMÚN.
Una vez
definidos ambos conceptos, subsiste la tesis de que efectivamente no son la
misma cosa, sin embargo ello no quiere decir que no tengan puntos en común.
Diferencias.
1º Como hemos visto realmente el RSS no resume el
recurso, más bien coge una serie de datos para que nuestro lector RSS sea capaz
de interpretarlos y mostrarlos.
2º No sólo no resume el recurso sino que nos lo
muestra completo o en forma de lista, lo cual da apariencia de resumen (puesto
que nos muestra el título y las primeras letras), pero en todo caso ello es una
forma de presentación de nuestro lector RSS.
3º A día de hoy cualquier proceso automatizado (y
este lo es) trabaja con datos y no con información, por lo que al no haber
detrás del proceso una persona que se lea el artículo completo y que haga un
resumen científico, o bien que el propio autor se tome la molestia de
realizarlo, difícilmente una máquina podrá realizar esa labor. En la carrera
hemos tenido una asignatura en la cual se leían artículos rápidamente y se
evaluaba críticamente si tanto el título, palabras clave y el resumen, eran
adecuados, o por el contrario no se ajustaban realmente al contenido del
artículo. El problema está en que ni siquiera los autores (con mala intención o
no) son capaces muchas veces de hacer buenos resúmenes, al igual que algunos
documentalistas. Es por ello que veo difícil por no decir imposible que un
proceso automatizado realice las labores de resumen documental.
4º Igualmente el RSS funciona bien con páginas webs
que se actualizan con cierta regularidad, no así con otras páginas que
contienen documentos ya almacenados y de los que tu quieres información. Si
bien es cierto que desde que te suscribes a un determinado contenido el RSS no
sólo te informará de publicaciones futuras, sino también de las pasadas, no le
veo su utilidad tradicional en bases de datos por ejemplo que no se vayan
renovando.
Puntos en común:
1º Al igual que el resumen documental,
el RSS se ha inventado como una herramienta que nos hace ganar tiempo. Si
existen varias páginas web que te interesan que van actualizando sus contenidos
y te gustaría mantenerte informado, un lector RSS te ahorrará mucho tiempo en
esta tarea. Gracias al RSS, no tendrás que visitar cada una de las páginas web
que te interesan para ver si han añadido o no algún artículo que te pueda
interesar. Estas páginas te informarán a ti (a través de tu lector de RSS).
Cuando ingreses a tu Lector RSS (o Rss Reader), estarás automáticamente
informado sobre todas las novedades que se han producido en todas las páginas
web que has dado de alta.
2º Si un usuario ha elegido bien
los contenidos que quiere recibir por RSS, de alguna manera él mismo ha elegido
que quiere recibir, es decir establece una criba entre lo que le interesa y lo
que no de distintas fuentes de contenidos, de esta manera “resume” lo que le
interesa, desechando aquello que no le es de interés.
4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0:
RSS.
Una
vez explicado todo lo anterior veamos cuales son los principales huecos u oportunidades que nos brinda
el RSS en lo que concierne al resumen documental y por último que hace falta para que ello se de de
forma satisfactoria.
En
cuanto a los huecos u oportunidades:
1º Citar en primer lugar lo que
ha quedado expresado en la última narrativa del trabajo donde relacionamos los
tesauros y el RSS dentro de la red social LinkedIn, apuntar que para ello ha
sido necesaria una correcta indización que se conseguiría a través del tesauro,
en ello profundizaremos en el último punto del post. De forma breve es lo
siguiente:
A. El
usuario puede o no suscribirse a la etiqueta de su perfil del tesauro o a otras
de su interés, para que cada vez que se incorpore algún perfil nuevo, ya sea de
un usuario, una empresa, una oferta de empleo, unas jornadas, este lo reciba en
su lector de RSS, y así estar al tanto de las novedades del sector. Nótese que
si ha concretado mucho en su perfil profesional esta herramienta puede ser más
útil que si ha puesto como descriptor un descriptor general.
B. También
el usuario puede suscribirse a una etiqueta o descriptor que ha creado o
modificado, para ver la evolución del término y de sus relaciones con otros
términos, de esta manera puede ser notificado por ejemplo de la creación de un
término relacionado o admitido que sea más de su gusto y mantener de esta
manera una indización más satisfactoria para el usuario.
2. Tras meternos en el website de
nature, para poder ver un ejemplo de lo que hoy en día ya se puede hacer con el
RSS en una de las revistas más prestigiosas del mundo, lo primero que
comprobamos dentro de nuestra ignorancia es que dicha revista, no es una sola
revista, sino que son múltiples, es decir, hay una revista general llamada
nature, pero también hay muchas revistas independientes, por ejemplo de
biología molecular, astrofísica, etc. Si le das a nature web feeds, nos muestra
las múltiples revistas a las que te puedes suscribir. También te deja hacer una
búsqueda por temática, dentro de ella te lleva a numerosos campos del
conocimiento y si pichas dentro de cualquier campo te muestra las revistas asociadas.
De esta forma la web que evidentemente está muy bien organizada, te permite
suscribirte a las novedades de cada una de las revistas, incluso por lo menos
dentro de la revista principal te deja suscribirte a la tabla de contenidos, últimas
investigaciones, por campos de investigación, etc. Todo esto está muy bien, sin
embargo sería de mayor utilidad en mi opinión, que te dejase suscribirte a un
término concreto. Expliquémoslo, si dentro de la revista, metiéndote a través
de la VPN y a través de ésta a la revista nature, llegamos a un artículo
cualquiera, en él se nos muestra el resumen del mismo y las palabras clave,
pinchando en las mismas (puesto que son enlaces), por ejemplo en biología
molecular, nos muestra los artículos que dentro del año 2012 en un determinado
mes hablan de ese tema (sólo podemos escoger los últimos tres años), dejándonos
como es lógico pinchar en cualquiera de ellos y realizar la misma operación.
Esta forma de actuar limita enormemente, en nuestra opinión, la forma de
buscar, debido a que debería dejar la opción de mostrarnos los artículos, de al
menos, estos últimos tres años todos juntos, aunque eso sin duda es lo de menos.
Lo de más sería que nos dejase la posibilidad de suscribirnos a ese determinado
término. Eso sin duda se haría de una forma más eficiente a través de un
tesauro (obsérvese en el último punto como en nuestra opinión, el RSS y en
consecuencia el resumen documental en la 2.0 siempre dependen de una buena
indización de los términos.)
3. Otro de los huecos es el que
hemos comprobado en clase, asociando una búsqueda RSS en las noticias de Google,
con el lector RSS y publicándolo todo automáticamente en el twitter, aunque
aquí aportaremos una posibilidad de extrapolarlo a otras bases de datos. Como
luego explicaremos sería conveniente tener toda la publicación mundial tanto
científica como no científica en un determinado espacio web, donde se puedan
hacer búsquedas rápidas sobre toda la información mundial. Pues bien, lo más
parecido a ello es Google y otros buscadores. El RSS, por su propia naturaleza,
funciona bien cuando salen nuevos documentos, nuevas noticias, etc. es por eso
que se asociaría al google noticias por ejemplo y recibiríamos todas las
novedades “resumidas” en nuestro lector, el cual lo publicaría automáticamente
en el twitter, aunque ello evidentemente no es obligatorio, simplemente es una
forma de compartir una información con alguien.
Al final Google es una base de
datos de tamaño ingente, donde en el buscador pones unos determinados términos,
los cuales te enlazan a una serie de resultados que según su algoritmo se
consideran más o menos relevantes. Por tanto eso se podría extrapolar a todo
tipo de bases de datos, la novedad respecto al ejercicio de clase que se
propone, iría orientada a bases de datos de menor tamaño, donde tu propondrías
un término o conjunto de términos de búsqueda, a esa búsqueda en la base de
datos se le haría una suscripción, como ya hicimos en clase con Google. De
alguna manera el RSS guardaría los documentos que existen en la base de datos
antes de la suscripción sin mostrarlos el visor (puesto que el número sería
demasiado grande e inservible), esa búsqueda se iría repitiendo en el tiempo
automáticamente y los documentos que se añadiesen dentro de la búsqueda nos
llegarían por RSS.
5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.
Un primer aspecto para que esto
se lleve a cabo, es la correcta indización de los documentos de la base de
datos, sin eso todo lo demás pierde importancia, son dos aspectos íntimamente
relacionados, es obvio que el RSS es un proceso automatizado, te va a llegar lo
que tú has solicitado, si los documentos de una posible búsqueda tanto en un
buscador tipo google, como para el buscador de cualquier base de datos no están
correctamente indizados, evidentemente te va a llegar al lector RSS documentos
que no son relevantes. Estamos hablando de la recuperación de la información
como tantas veces hemos hecho hincapié en la asignatura y su relación con la
indización, en este caso el RSS es una clara herramienta de Difusión Selectiva
de la Información (DSI).
En mi opinión, la formación de
archivero que poseo deja bien a las claras que la indización de los documentos
tiene que llegar desde la producción de los mismos, me estoy refiriendo a los
documentos electrónicos y a los metadatos, una buena solución son los metadatos
normalizados Dublin Core. Igualmente los documentos deben ser clasificados
según su tipología desde la producción de los mismos, esa es la labor
fundamental de un archivero, documentalista, bibliotecario y de todos los
profesionales de las ciencias de la información. No cabe duda que estos tienen
que buscar al público que consuma esos documentos, pero lo fundamental es que
estos documentos lleguen al público y a los profesionales de una manera
adecuada y que se dé la posibilidad al usuario a acceder a los mismos de la
forma que ellos elijan. Por supuesto no se trata de bombardearlos y ahí
precisamente es donde entra el RSS como herramienta de DSI, es el usuario el
que decide que quiere, sin duda este concepto entra de lleno dentro de la
filosofía 2.0 y por supuesto dentro de la idiosincrasia de este tipo de
profesiones de servir al ciudadano.
Otro aspecto
que me gustaría analizar, es que aunque con los resúmenes documentales y con el
RSS se ganaría tiempo, no hay que olvidar que el usuario normal o el científico
se tendría que dirigir a múltiples páginas webs y bases de datos en internet
para encontrar todo lo que se pública sobre su parcela de interés, como ya
dijimos antes quizás los buscadores de internet te permiten bucear tímidamente
por todos los contenidos, la propia creación de internet se ha hecho con un
mínimo control y es por así decirlo, un universo aparte, que, no podría ser de
otra manera, tiene su diversidad y múltiples formas de crear. A pesar de la
bondad de como se ha ido creando esta World Wide Web, sería conveniente que al
menos dentro de la órbita del conocimiento científico se procurase crear una
web que aglutinase por ramas del saber todo el conocimiento científico que se
va publicando a base de monografías, artículos, informes, etc. Un intento de
todo esto es la Web Of Knowledge o web del conocimiento, no soy un experto en
la materia pero estoy casi seguro que no posee todos los artículos publicados
mundialmente en cualquier revista científica dada de alta como tal, sino que
tendrá los artículo de las revistas llamadas de impacto.
Sería
conveniente que ese esfuerzo se realizará de abajo a arriba y de arriba abajo,
es decir que desde las cúpulas de poder se intentase reunir toda esa
información y que además todos los autores de artículos científicos del mundo
se preocupasen en colgar sus novedades en esa web, con la firme convicción de
que así sus artículos se leerían más y por tanto tendrían más posibilidades de
ser citados por otros científicos, etc, etc. Todo ello redundaría en su propio
beneficio, si cada documento estuviera perfectamente indizado por cada creador
(como requisito para poder publicarlo) y asociado a un tesauro, ello nos
llevaría a una recuperación de la información más precisa y a darle un mejor
uso al RSS. La inversión quizás sea costosa en tiempo y dinero, tanto para los
creadores y coordinadores como para los autores, pero sin duda redundaría en un
beneficio a ellos mismos, siendo altamente rentable.