Técnicas de indización y resumen: EL RESUMEN EN LOS TIEMPOS DEL RSS

EL RESUMEN EN LOS TIEMPOS DEL RSS

-INTRODUCCIÓN.

1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.

2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.

3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN COMÚN.

4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0: RSS.

5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.

-INTRODUCCIÓN.

En este post mi intención es analizar el RSS como herramienta para el resumen documental, o lo que es lo mismo averiguar si en el universo 2.0 hay un hueco para el resumen documental igual que vimos que si existía para la indización. La respuesta antes de efectuar en sí el análisis, es si y no. Sí, porque no siendo una herramienta específica de resumen documental, su potencialidad y usos es enorme. No, porque en esencia no es lo mismo que el resumen documental. Veremos si después del análisis del RSS nuestra impresión es la misma que la que parece a simple vista.

Una vez establecido la intención de este post, creo que es conveniente definir los conceptos resumen documental y rss.

1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.

Resumen documental según la wikipedia es: “Una representación abreviada, objetiva y precisa del contenido de un documento o recurso, sin interpretación crítica y sin mención expresa del autor del resumen”

El resumen es un documento secundario muy provechoso para los profesionales y estudiosos por su potencial informativo, sin embargo, que sea un documento secundario no quiere decir que no sea un verdadero texto autónomo del anterior, es decir es independiente con respecto al texto al que hace referencia. Otra característica es que se pueden hacer distintos resúmenes de un mismo texto, por lo que pueden ser muy diversos.

Una vez definido el qué, es ineludible explicar por qué surge y con qué fin, a la vez que expresamos brevemente la evolución del resumen documental en el tiempo.

Cuando no habían aparecido las nuevas tecnologías en el mundo de la documentación, se estimaba que un investigador de media tardaba un 70% de su tiempo de investigación en encontrar información, de tal forma que tardaba más tiempo en buscar información que en la investigación propiamente dicha. A partir de ese momento, se decidió incluir resúmenes en los trabajos científicos, de tal forma que el investigador pudiera dedicar más tiempo a su investigación. Pero el problema sólo se solucionó en parte, muchas veces encontrar los documentos que uno necesitaba era tedioso, engorroso y sumamente lento, cuando no imposible, perdiéndose tiempo en realizar investigaciones que ya habían sido realizadas. Igualmente no se encontraban investigaciones que mostraban descubrimientos críticos para nuestras propias investigaciones. Es por esto que se decidió crear unas revistas exclusivas de resúmenes para que los investigadores tuvieran constancia de aquellos avances y pudieran saber que ese documento existía e incluso encargarlo a un centro de documentación. Aunque esto supuso un gran avance y un gran ahorro de tiempo para el investigador, esas revistas eran caras y difíciles de realizar, por lo que había pocos ejemplares. Con la llegada de las nuevas tecnologías y gracias a los resúmenes, el investigador ha podido usar la mitad de su tiempo en encontrar información y la otra mitad en analizarla y realizar investigaciones.

Como conclusión el resumen tiene por objeto exponer de forma breve los contenidos principales de un documento con el fin de facilitar su indización, búsqueda y recuperación, así como dar a conocer de antemano el contenido del documento o recurso para que el usuario decida sobre la conveniencia de consultar o no el texto completo.

Hay que decir por último que la importancia del resumen es tal que se han realizado normas ISO y UNE para definir y clasificar a este tipo de documento. En concreto son la norma ISO 214-1976: Documentation Abstracts for publications and documentation y la norma UNE 50-103-1990 de Documentación y preparación de resumenes.

2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.

Por otro lado el RSS según la wikipedia son “las siglas de Really Simple Syndication, un formato XML para sindicar o compartir contenido en la web. Se utiliza para difundir información actualizada frecuentemente a usuarios que se han suscrito a la fuente de contenidos”.

Siguiendo con la wikipedia “Cuando hablamos de RSS nos referimos usualmente a la tecnología completa para distribución de contenidos de los sitios web. Pero un RSS es realmente un formato de archivo, basado en XML, que sirve para recoger contenidos publicados en páginas web. Los RSS tienen extensión .rss o bien .xml, pero en realidad son un simple archivo de texto donde aparecen referencias a contenidos publicados, en un formato específico, creado a partir de XML.

En el archivo RSS simplemente están los datos de las novedades del sitio, como el título, fecha de publicación o la descripción. El programa que lea el RSS será encargado de darle estilo o apariencia a los datos que se incluyan en el archivo y presentarlos de una manera atractiva al usuario y de fácil lectura.

Que RSS sea un formato basado en XML significa que el archivo RSS se compone por una serie de etiquetas definidas que tendrán un formato dado, que respetará las reglas generales de XML.”

Mostremos ahora algunas de las utilidades del RSS:

Feed de blog- cada entrada de blog es resumida como un item de feed. Esto hace que los posts de los blogs sean más fáciles de buscar, habilitando a los visitantes para que encuentren lo que les interesa.
Feed de artículos- esto alerta a los lectores cuando hay nuevos artículos y contenidos web disponibles.
Feed de foros-esto permite a los usuarios recibir post de foros y los temas de las últimas discusiones.
Feed de actividades -esto permite a los usuarios (escuelas, clubs, y otras organizaciones) publicar nuevos eventos o anunciar cambios en sus calendarizaciones.
Feeds especiales o de descuentos – esto habilita a los usuarios (como tiendas de retail y online) entregar ofertas y descuentos de último minuto.
Ego o Monitoreo de noticias – esto habilita a los usuarios para recibir titulares filtrados o noticias basadas en cierta frase o palabra clave.

Aparte de las ventajas obvias del RSS como son estar al día de las últimas noticias y que es el usuario el que decide que le llega, habría que citar también las siguientes:

En el RSS no existe el SPAM, no recibes otra información que la que el usuario ha ido eligiendo
Facilidad de uso, tanto para darse de alta en contenidos como para darse de baja.
Gratuidad del servicio, lógicamente si se trata de documentos de una revista de pago por ejemplo, debes estar suscrito a la revista.

3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN COMÚN.

Una vez definidos ambos conceptos, subsiste la tesis de que efectivamente no son la misma cosa, sin embargo ello no quiere decir que no tengan puntos en común.

Diferencias.

1º Como hemos visto realmente el RSS no resume el recurso, más bien coge una serie de datos para que nuestro lector RSS sea capaz de interpretarlos y mostrarlos.

2º No sólo no resume el recurso sino que nos lo muestra completo o en forma de lista, lo cual da apariencia de resumen (puesto que nos muestra el título y las primeras letras), pero en todo caso ello es una forma de presentación de nuestro lector RSS.

3º A día de hoy cualquier proceso automatizado (y este lo es) trabaja con datos y no con información, por lo que al no haber detrás del proceso una persona que se lea el artículo completo y que haga un resumen científico, o bien que el propio autor se tome la molestia de realizarlo, difícilmente una máquina podrá realizar esa labor. En la carrera hemos tenido una asignatura en la cual se leían artículos rápidamente y se evaluaba críticamente si tanto el título, palabras clave y el resumen, eran adecuados, o por el contrario no se ajustaban realmente al contenido del artículo. El problema está en que ni siquiera los autores (con mala intención o no) son capaces muchas veces de hacer buenos resúmenes, al igual que algunos documentalistas. Es por ello que veo difícil por no decir imposible que un proceso automatizado realice las labores de resumen documental.

4º Igualmente el RSS funciona bien con páginas webs que se actualizan con cierta regularidad, no así con otras páginas que contienen documentos ya almacenados y de los que tu quieres información. Si bien es cierto que desde que te suscribes a un determinado contenido el RSS no sólo te informará de publicaciones futuras, sino también de las pasadas, no le veo su utilidad tradicional en bases de datos por ejemplo que no se vayan renovando.

Puntos en común:

1º Al igual que el resumen documental, el RSS se ha inventado como una herramienta que nos hace ganar tiempo. Si existen varias páginas web que te interesan que van actualizando sus contenidos y te gustaría mantenerte informado, un lector RSS te ahorrará mucho tiempo en esta tarea. Gracias al RSS, no tendrás que visitar cada una de las páginas web que te interesan para ver si han añadido o no algún artículo que te pueda interesar. Estas páginas te informarán a ti (a través de tu lector de RSS). Cuando ingreses a tu Lector RSS (o Rss Reader), estarás automáticamente informado sobre todas las novedades que se han producido en todas las páginas web que has dado de alta.

2º Si un usuario ha elegido bien los contenidos que quiere recibir por RSS, de alguna manera él mismo ha elegido que quiere recibir, es decir establece una criba entre lo que le interesa y lo que no de distintas fuentes de contenidos, de esta manera “resume” lo que le interesa, desechando aquello que no le es de interés.

4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0: RSS.

Una vez explicado todo lo anterior veamos cuales son los principales huecos u oportunidades que nos brinda el RSS en lo que concierne al resumen documental y por último que hace falta para que ello se de de forma satisfactoria.

En cuanto a los huecos u oportunidades:

1º Citar en primer lugar lo que ha quedado expresado en la última narrativa del trabajo donde relacionamos los tesauros y el RSS dentro de la red social LinkedIn, apuntar que para ello ha sido necesaria una correcta indización que se conseguiría a través del tesauro, en ello profundizaremos en el último punto del post. De forma breve es lo siguiente:

A. El usuario puede o no suscribirse a la etiqueta de su perfil del tesauro o a otras de su interés, para que cada vez que se incorpore algún perfil nuevo, ya sea de un usuario, una empresa, una oferta de empleo, unas jornadas, este lo reciba en su lector de RSS, y así estar al tanto de las novedades del sector. Nótese que si ha concretado mucho en su perfil profesional esta herramienta puede ser más útil que si ha puesto como descriptor un descriptor general.

B. También el usuario puede suscribirse a una etiqueta o descriptor que ha creado o modificado, para ver la evolución del término y de sus relaciones con otros términos, de esta manera puede ser notificado por ejemplo de la creación de un término relacionado o admitido que sea más de su gusto y mantener de esta manera una indización más satisfactoria para el usuario.

2. Tras meternos en el website de nature, para poder ver un ejemplo de lo que hoy en día ya se puede hacer con el RSS en una de las revistas más prestigiosas del mundo, lo primero que comprobamos dentro de nuestra ignorancia es que dicha revista, no es una sola revista, sino que son múltiples, es decir, hay una revista general llamada nature, pero también hay muchas revistas independientes, por ejemplo de biología molecular, astrofísica, etc. Si le das a nature web feeds, nos muestra las múltiples revistas a las que te puedes suscribir. También te deja hacer una búsqueda por temática, dentro de ella te lleva a numerosos campos del conocimiento y si pichas dentro de cualquier campo te muestra las revistas asociadas. De esta forma la web que evidentemente está muy bien organizada, te permite suscribirte a las novedades de cada una de las revistas, incluso por lo menos dentro de la revista principal te deja suscribirte a la tabla de contenidos, últimas investigaciones, por campos de investigación, etc. Todo esto está muy bien, sin embargo sería de mayor utilidad en mi opinión, que te dejase suscribirte a un término concreto. Expliquémoslo, si dentro de la revista, metiéndote a través de la VPN y a través de ésta a la revista nature, llegamos a un artículo cualquiera, en él se nos muestra el resumen del mismo y las palabras clave, pinchando en las mismas (puesto que son enlaces), por ejemplo en biología molecular, nos muestra los artículos que dentro del año 2012 en un determinado mes hablan de ese tema (sólo podemos escoger los últimos tres años), dejándonos como es lógico pinchar en cualquiera de ellos y realizar la misma operación. Esta forma de actuar limita enormemente, en nuestra opinión, la forma de buscar, debido a que debería dejar la opción de mostrarnos los artículos, de al menos, estos últimos tres años todos juntos, aunque eso sin duda es lo de menos. Lo de más sería que nos dejase la posibilidad de suscribirnos a ese determinado término. Eso sin duda se haría de una forma más eficiente a través de un tesauro (obsérvese en el último punto como en nuestra opinión, el RSS y en consecuencia el resumen documental en la 2.0 siempre dependen de una buena indización de los términos.)

3. Otro de los huecos es el que hemos comprobado en clase, asociando una búsqueda RSS en las noticias de Google, con el lector RSS y publicándolo todo automáticamente en el twitter, aunque aquí aportaremos una posibilidad de extrapolarlo a otras bases de datos. Como luego explicaremos sería conveniente tener toda la publicación mundial tanto científica como no científica en un determinado espacio web, donde se puedan hacer búsquedas rápidas sobre toda la información mundial. Pues bien, lo más parecido a ello es Google y otros buscadores. El RSS, por su propia naturaleza, funciona bien cuando salen nuevos documentos, nuevas noticias, etc. es por eso que se asociaría al google noticias por ejemplo y recibiríamos todas las novedades “resumidas” en nuestro lector, el cual lo publicaría automáticamente en el twitter, aunque ello evidentemente no es obligatorio, simplemente es una forma de compartir una información con alguien.

Al final Google es una base de datos de tamaño ingente, donde en el buscador pones unos determinados términos, los cuales te enlazan a una serie de resultados que según su algoritmo se consideran más o menos relevantes. Por tanto eso se podría extrapolar a todo tipo de bases de datos, la novedad respecto al ejercicio de clase que se propone, iría orientada a bases de datos de menor tamaño, donde tu propondrías un término o conjunto de términos de búsqueda, a esa búsqueda en la base de datos se le haría una suscripción, como ya hicimos en clase con Google. De alguna manera el RSS guardaría los documentos que existen en la base de datos antes de la suscripción sin mostrarlos el visor (puesto que el número sería demasiado grande e inservible), esa búsqueda se iría repitiendo en el tiempo automáticamente y los documentos que se añadiesen dentro de la búsqueda nos llegarían por RSS.

5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.

Un primer aspecto para que esto se lleve a cabo, es la correcta indización de los documentos de la base de datos, sin eso todo lo demás pierde importancia, son dos aspectos íntimamente relacionados, es obvio que el RSS es un proceso automatizado, te va a llegar lo que tú has solicitado, si los documentos de una posible búsqueda tanto en un buscador tipo google, como para el buscador de cualquier base de datos no están correctamente indizados, evidentemente te va a llegar al lector RSS documentos que no son relevantes. Estamos hablando de la recuperación de la información como tantas veces hemos hecho hincapié en la asignatura y su relación con la indización, en este caso el RSS es una clara herramienta de Difusión Selectiva de la Información (DSI).

En mi opinión, la formación de archivero que poseo deja bien a las claras que la indización de los documentos tiene que llegar desde la producción de los mismos, me estoy refiriendo a los documentos electrónicos y a los metadatos, una buena solución son los metadatos normalizados Dublin Core. Igualmente los documentos deben ser clasificados según su tipología desde la producción de los mismos, esa es la labor fundamental de un archivero, documentalista, bibliotecario y de todos los profesionales de las ciencias de la información. No cabe duda que estos tienen que buscar al público que consuma esos documentos, pero lo fundamental es que estos documentos lleguen al público y a los profesionales de una manera adecuada y que se dé la posibilidad al usuario a acceder a los mismos de la forma que ellos elijan. Por supuesto no se trata de bombardearlos y ahí precisamente es donde entra el RSS como herramienta de DSI, es el usuario el que decide que quiere, sin duda este concepto entra de lleno dentro de la filosofía 2.0 y por supuesto dentro de la idiosincrasia de este tipo de profesiones de servir al ciudadano.

Otro aspecto que me gustaría analizar, es que aunque con los resúmenes documentales y con el RSS se ganaría tiempo, no hay que olvidar que el usuario normal o el científico se tendría que dirigir a múltiples páginas webs y bases de datos en internet para encontrar todo lo que se pública sobre su parcela de interés, como ya dijimos antes quizás los buscadores de internet te permiten bucear tímidamente por todos los contenidos, la propia creación de internet se ha hecho con un mínimo control y es por así decirlo, un universo aparte, que, no podría ser de otra manera, tiene su diversidad y múltiples formas de crear. A pesar de la bondad de como se ha ido creando esta World Wide Web, sería conveniente que al menos dentro de la órbita del conocimiento científico se procurase crear una web que aglutinase por ramas del saber todo el conocimiento científico que se va publicando a base de monografías, artículos, informes, etc. Un intento de todo esto es la Web Of Knowledge o web del conocimiento, no soy un experto en la materia pero estoy casi seguro que no posee todos los artículos publicados mundialmente en cualquier revista científica dada de alta como tal, sino que tendrá los artículo de las revistas llamadas de impacto.

Sería conveniente que ese esfuerzo se realizará de abajo a arriba y de arriba abajo, es decir que desde las cúpulas de poder se intentase reunir toda esa información y que además todos los autores de artículos científicos del mundo se preocupasen en colgar sus novedades en esa web, con la firme convicción de que así sus artículos se leerían más y por tanto tendrían más posibilidades de ser citados por otros científicos, etc, etc. Todo ello redundaría en su propio beneficio, si cada documento estuviera perfectamente indizado por cada creador (como requisito para poder publicarlo) y asociado a un tesauro, ello nos llevaría a una recuperación de la información más precisa y a darle un mejor uso al RSS. La inversión quizás sea costosa en tiempo y dinero, tanto para los creadores y coordinadores como para los autores, pero sin duda redundaría en un beneficio a ellos mismos, siendo altamente rentable.

Técnicas de indización y resumen

Vistas de página en total

martes, 19 de junio de 2012

EL RESUMEN EN LOS TIEMPOS DEL RSS

EL RESUMEN EN LOS TIEMPOS DEL RSS

-INTRODUCCIÓN.

1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.

2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.

3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN COMÚN.

4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0: RSS.

5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.

No hay comentarios:

Publicar un comentario

Datos personales

Archivo del blog