Técnicas de indización y resumen

miércoles, 19 de noviembre de 2014

lunes, 20 de octubre de 2014

martes, 19 de junio de 2012

EL RESUMEN EN LOS TIEMPOS DEL RSS

-INTRODUCCIÓN.

1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.

2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.

3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN COMÚN.

4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0: RSS.

5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.

-INTRODUCCIÓN.

En este post mi intención es analizar el RSS como herramienta para el resumen documental, o lo que es lo mismo averiguar si en el universo 2.0 hay un hueco para el resumen documental igual que vimos que si existía para la indización. La respuesta antes de efectuar en sí el análisis, es si y no. Sí, porque no siendo una herramienta específica de resumen documental, su potencialidad y usos es enorme. No, porque en esencia no es lo mismo que el resumen documental. Veremos si después del análisis del RSS nuestra impresión es la misma que la que parece a simple vista.

Una vez establecido la intención de este post, creo que es conveniente definir los conceptos resumen documental y rss.

1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.

Resumen documental según la wikipedia es: “Una representación abreviada, objetiva y precisa del contenido de un documento o recurso, sin interpretación crítica y sin mención expresa del autor del resumen”

El resumen es un documento secundario muy provechoso para los profesionales y estudiosos por su potencial informativo, sin embargo, que sea un documento secundario no quiere decir que no sea un verdadero texto autónomo del anterior, es decir es independiente con respecto al texto al que hace referencia. Otra característica es que se pueden hacer distintos resúmenes de un mismo texto, por lo que pueden ser muy diversos.

Una vez definido el qué, es ineludible explicar por qué surge y con qué fin, a la vez que expresamos brevemente la evolución del resumen documental en el tiempo.

Cuando no habían aparecido las nuevas tecnologías en el mundo de la documentación, se estimaba que un investigador de media tardaba un 70% de su tiempo de investigación en encontrar información, de tal forma que tardaba más tiempo en buscar información que en la investigación propiamente dicha. A partir de ese momento, se decidió incluir resúmenes en los trabajos científicos, de tal forma que el investigador pudiera dedicar más tiempo a su investigación. Pero el problema sólo se solucionó en parte, muchas veces encontrar los documentos que uno necesitaba era tedioso, engorroso y sumamente lento, cuando no imposible, perdiéndose tiempo en realizar investigaciones que ya habían sido realizadas. Igualmente no se encontraban investigaciones que mostraban descubrimientos críticos para nuestras propias investigaciones. Es por esto que se decidió crear unas revistas exclusivas de resúmenes para que los investigadores tuvieran constancia de aquellos avances y pudieran saber que ese documento existía e incluso encargarlo a un centro de documentación. Aunque esto supuso un gran avance y un gran ahorro de tiempo para el investigador, esas revistas eran caras y difíciles de realizar, por lo que había pocos ejemplares. Con la llegada de las nuevas tecnologías y gracias a los resúmenes, el investigador ha podido usar la mitad de su tiempo en encontrar información y la otra mitad en analizarla y realizar investigaciones.

Como conclusión el resumen tiene por objeto exponer de forma breve los contenidos principales de un documento con el fin de facilitar su indización, búsqueda y recuperación, así como dar a conocer de antemano el contenido del documento o recurso para que el usuario decida sobre la conveniencia de consultar o no el texto completo.

Hay que decir por último que la importancia del resumen es tal que se han realizado normas ISO y UNE para definir y clasificar a este tipo de documento. En concreto son la norma ISO 214-1976: Documentation Abstracts for publications and documentation y la norma UNE 50-103-1990 de Documentación y preparación de resumenes.

2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.

Por otro lado el RSS según la wikipedia son “las siglas de Really Simple Syndication, un formato XML para sindicar o compartir contenido en la web. Se utiliza para difundir información actualizada frecuentemente a usuarios que se han suscrito a la fuente de contenidos”.

Siguiendo con la wikipedia “Cuando hablamos de RSS nos referimos usualmente a la tecnología completa para distribución de contenidos de los sitios web. Pero un RSS es realmente un formato de archivo, basado en XML, que sirve para recoger contenidos publicados en páginas web. Los RSS tienen extensión .rss o bien .xml, pero en realidad son un simple archivo de texto donde aparecen referencias a contenidos publicados, en un formato específico, creado a partir de XML.

En el archivo RSS simplemente están los datos de las novedades del sitio, como el título, fecha de publicación o la descripción. El programa que lea el RSS será encargado de darle estilo o apariencia a los datos que se incluyan en el archivo y presentarlos de una manera atractiva al usuario y de fácil lectura.

Que RSS sea un formato basado en XML significa que el archivo RSS se compone por una serie de etiquetas definidas que tendrán un formato dado, que respetará las reglas generales de XML.”

Mostremos ahora algunas de las utilidades del RSS:

Feed de blog- cada entrada de blog es resumida como un item de feed. Esto hace que los posts de los blogs sean más fáciles de buscar, habilitando a los visitantes para que encuentren lo que les interesa.
Feed de artículos- esto alerta a los lectores cuando hay nuevos artículos y contenidos web disponibles.
Feed de foros-esto permite a los usuarios recibir post de foros y los temas de las últimas discusiones.
Feed de actividades -esto permite a los usuarios (escuelas, clubs, y otras organizaciones) publicar nuevos eventos o anunciar cambios en sus calendarizaciones.
Feeds especiales o de descuentos – esto habilita a los usuarios (como tiendas de retail y online) entregar ofertas y descuentos de último minuto.
Ego o Monitoreo de noticias – esto habilita a los usuarios para recibir titulares filtrados o noticias basadas en cierta frase o palabra clave.

Aparte de las ventajas obvias del RSS como son estar al día de las últimas noticias y que es el usuario el que decide que le llega, habría que citar también las siguientes:

En el RSS no existe el SPAM, no recibes otra información que la que el usuario ha ido eligiendo
Facilidad de uso, tanto para darse de alta en contenidos como para darse de baja.
Gratuidad del servicio, lógicamente si se trata de documentos de una revista de pago por ejemplo, debes estar suscrito a la revista.

3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN COMÚN.

Una vez definidos ambos conceptos, subsiste la tesis de que efectivamente no son la misma cosa, sin embargo ello no quiere decir que no tengan puntos en común.

Diferencias.

1º Como hemos visto realmente el RSS no resume el recurso, más bien coge una serie de datos para que nuestro lector RSS sea capaz de interpretarlos y mostrarlos.

2º No sólo no resume el recurso sino que nos lo muestra completo o en forma de lista, lo cual da apariencia de resumen (puesto que nos muestra el título y las primeras letras), pero en todo caso ello es una forma de presentación de nuestro lector RSS.

3º A día de hoy cualquier proceso automatizado (y este lo es) trabaja con datos y no con información, por lo que al no haber detrás del proceso una persona que se lea el artículo completo y que haga un resumen científico, o bien que el propio autor se tome la molestia de realizarlo, difícilmente una máquina podrá realizar esa labor. En la carrera hemos tenido una asignatura en la cual se leían artículos rápidamente y se evaluaba críticamente si tanto el título, palabras clave y el resumen, eran adecuados, o por el contrario no se ajustaban realmente al contenido del artículo. El problema está en que ni siquiera los autores (con mala intención o no) son capaces muchas veces de hacer buenos resúmenes, al igual que algunos documentalistas. Es por ello que veo difícil por no decir imposible que un proceso automatizado realice las labores de resumen documental.

4º Igualmente el RSS funciona bien con páginas webs que se actualizan con cierta regularidad, no así con otras páginas que contienen documentos ya almacenados y de los que tu quieres información. Si bien es cierto que desde que te suscribes a un determinado contenido el RSS no sólo te informará de publicaciones futuras, sino también de las pasadas, no le veo su utilidad tradicional en bases de datos por ejemplo que no se vayan renovando.

Puntos en común:

1º Al igual que el resumen documental, el RSS se ha inventado como una herramienta que nos hace ganar tiempo. Si existen varias páginas web que te interesan que van actualizando sus contenidos y te gustaría mantenerte informado, un lector RSS te ahorrará mucho tiempo en esta tarea. Gracias al RSS, no tendrás que visitar cada una de las páginas web que te interesan para ver si han añadido o no algún artículo que te pueda interesar. Estas páginas te informarán a ti (a través de tu lector de RSS). Cuando ingreses a tu Lector RSS (o Rss Reader), estarás automáticamente informado sobre todas las novedades que se han producido en todas las páginas web que has dado de alta.

2º Si un usuario ha elegido bien los contenidos que quiere recibir por RSS, de alguna manera él mismo ha elegido que quiere recibir, es decir establece una criba entre lo que le interesa y lo que no de distintas fuentes de contenidos, de esta manera “resume” lo que le interesa, desechando aquello que no le es de interés.

4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0: RSS.

Una vez explicado todo lo anterior veamos cuales son los principales huecos u oportunidades que nos brinda el RSS en lo que concierne al resumen documental y por último que hace falta para que ello se de de forma satisfactoria.

En cuanto a los huecos u oportunidades:

1º Citar en primer lugar lo que ha quedado expresado en la última narrativa del trabajo donde relacionamos los tesauros y el RSS dentro de la red social LinkedIn, apuntar que para ello ha sido necesaria una correcta indización que se conseguiría a través del tesauro, en ello profundizaremos en el último punto del post. De forma breve es lo siguiente:

A. El usuario puede o no suscribirse a la etiqueta de su perfil del tesauro o a otras de su interés, para que cada vez que se incorpore algún perfil nuevo, ya sea de un usuario, una empresa, una oferta de empleo, unas jornadas, este lo reciba en su lector de RSS, y así estar al tanto de las novedades del sector. Nótese que si ha concretado mucho en su perfil profesional esta herramienta puede ser más útil que si ha puesto como descriptor un descriptor general.

B. También el usuario puede suscribirse a una etiqueta o descriptor que ha creado o modificado, para ver la evolución del término y de sus relaciones con otros términos, de esta manera puede ser notificado por ejemplo de la creación de un término relacionado o admitido que sea más de su gusto y mantener de esta manera una indización más satisfactoria para el usuario.

2. Tras meternos en el website de nature, para poder ver un ejemplo de lo que hoy en día ya se puede hacer con el RSS en una de las revistas más prestigiosas del mundo, lo primero que comprobamos dentro de nuestra ignorancia es que dicha revista, no es una sola revista, sino que son múltiples, es decir, hay una revista general llamada nature, pero también hay muchas revistas independientes, por ejemplo de biología molecular, astrofísica, etc. Si le das a nature web feeds, nos muestra las múltiples revistas a las que te puedes suscribir. También te deja hacer una búsqueda por temática, dentro de ella te lleva a numerosos campos del conocimiento y si pichas dentro de cualquier campo te muestra las revistas asociadas. De esta forma la web que evidentemente está muy bien organizada, te permite suscribirte a las novedades de cada una de las revistas, incluso por lo menos dentro de la revista principal te deja suscribirte a la tabla de contenidos, últimas investigaciones, por campos de investigación, etc. Todo esto está muy bien, sin embargo sería de mayor utilidad en mi opinión, que te dejase suscribirte a un término concreto. Expliquémoslo, si dentro de la revista, metiéndote a través de la VPN y a través de ésta a la revista nature, llegamos a un artículo cualquiera, en él se nos muestra el resumen del mismo y las palabras clave, pinchando en las mismas (puesto que son enlaces), por ejemplo en biología molecular, nos muestra los artículos que dentro del año 2012 en un determinado mes hablan de ese tema (sólo podemos escoger los últimos tres años), dejándonos como es lógico pinchar en cualquiera de ellos y realizar la misma operación. Esta forma de actuar limita enormemente, en nuestra opinión, la forma de buscar, debido a que debería dejar la opción de mostrarnos los artículos, de al menos, estos últimos tres años todos juntos, aunque eso sin duda es lo de menos. Lo de más sería que nos dejase la posibilidad de suscribirnos a ese determinado término. Eso sin duda se haría de una forma más eficiente a través de un tesauro (obsérvese en el último punto como en nuestra opinión, el RSS y en consecuencia el resumen documental en la 2.0 siempre dependen de una buena indización de los términos.)

3. Otro de los huecos es el que hemos comprobado en clase, asociando una búsqueda RSS en las noticias de Google, con el lector RSS y publicándolo todo automáticamente en el twitter, aunque aquí aportaremos una posibilidad de extrapolarlo a otras bases de datos. Como luego explicaremos sería conveniente tener toda la publicación mundial tanto científica como no científica en un determinado espacio web, donde se puedan hacer búsquedas rápidas sobre toda la información mundial. Pues bien, lo más parecido a ello es Google y otros buscadores. El RSS, por su propia naturaleza, funciona bien cuando salen nuevos documentos, nuevas noticias, etc. es por eso que se asociaría al google noticias por ejemplo y recibiríamos todas las novedades “resumidas” en nuestro lector, el cual lo publicaría automáticamente en el twitter, aunque ello evidentemente no es obligatorio, simplemente es una forma de compartir una información con alguien.

Al final Google es una base de datos de tamaño ingente, donde en el buscador pones unos determinados términos, los cuales te enlazan a una serie de resultados que según su algoritmo se consideran más o menos relevantes. Por tanto eso se podría extrapolar a todo tipo de bases de datos, la novedad respecto al ejercicio de clase que se propone, iría orientada a bases de datos de menor tamaño, donde tu propondrías un término o conjunto de términos de búsqueda, a esa búsqueda en la base de datos se le haría una suscripción, como ya hicimos en clase con Google. De alguna manera el RSS guardaría los documentos que existen en la base de datos antes de la suscripción sin mostrarlos el visor (puesto que el número sería demasiado grande e inservible), esa búsqueda se iría repitiendo en el tiempo automáticamente y los documentos que se añadiesen dentro de la búsqueda nos llegarían por RSS.

5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.

Un primer aspecto para que esto se lleve a cabo, es la correcta indización de los documentos de la base de datos, sin eso todo lo demás pierde importancia, son dos aspectos íntimamente relacionados, es obvio que el RSS es un proceso automatizado, te va a llegar lo que tú has solicitado, si los documentos de una posible búsqueda tanto en un buscador tipo google, como para el buscador de cualquier base de datos no están correctamente indizados, evidentemente te va a llegar al lector RSS documentos que no son relevantes. Estamos hablando de la recuperación de la información como tantas veces hemos hecho hincapié en la asignatura y su relación con la indización, en este caso el RSS es una clara herramienta de Difusión Selectiva de la Información (DSI).

En mi opinión, la formación de archivero que poseo deja bien a las claras que la indización de los documentos tiene que llegar desde la producción de los mismos, me estoy refiriendo a los documentos electrónicos y a los metadatos, una buena solución son los metadatos normalizados Dublin Core. Igualmente los documentos deben ser clasificados según su tipología desde la producción de los mismos, esa es la labor fundamental de un archivero, documentalista, bibliotecario y de todos los profesionales de las ciencias de la información. No cabe duda que estos tienen que buscar al público que consuma esos documentos, pero lo fundamental es que estos documentos lleguen al público y a los profesionales de una manera adecuada y que se dé la posibilidad al usuario a acceder a los mismos de la forma que ellos elijan. Por supuesto no se trata de bombardearlos y ahí precisamente es donde entra el RSS como herramienta de DSI, es el usuario el que decide que quiere, sin duda este concepto entra de lleno dentro de la filosofía 2.0 y por supuesto dentro de la idiosincrasia de este tipo de profesiones de servir al ciudadano.

Otro aspecto que me gustaría analizar, es que aunque con los resúmenes documentales y con el RSS se ganaría tiempo, no hay que olvidar que el usuario normal o el científico se tendría que dirigir a múltiples páginas webs y bases de datos en internet para encontrar todo lo que se pública sobre su parcela de interés, como ya dijimos antes quizás los buscadores de internet te permiten bucear tímidamente por todos los contenidos, la propia creación de internet se ha hecho con un mínimo control y es por así decirlo, un universo aparte, que, no podría ser de otra manera, tiene su diversidad y múltiples formas de crear. A pesar de la bondad de como se ha ido creando esta World Wide Web, sería conveniente que al menos dentro de la órbita del conocimiento científico se procurase crear una web que aglutinase por ramas del saber todo el conocimiento científico que se va publicando a base de monografías, artículos, informes, etc. Un intento de todo esto es la Web Of Knowledge o web del conocimiento, no soy un experto en la materia pero estoy casi seguro que no posee todos los artículos publicados mundialmente en cualquier revista científica dada de alta como tal, sino que tendrá los artículo de las revistas llamadas de impacto.

Sería conveniente que ese esfuerzo se realizará de abajo a arriba y de arriba abajo, es decir que desde las cúpulas de poder se intentase reunir toda esa información y que además todos los autores de artículos científicos del mundo se preocupasen en colgar sus novedades en esa web, con la firme convicción de que así sus artículos se leerían más y por tanto tendrían más posibilidades de ser citados por otros científicos, etc, etc. Todo ello redundaría en su propio beneficio, si cada documento estuviera perfectamente indizado por cada creador (como requisito para poder publicarlo) y asociado a un tesauro, ello nos llevaría a una recuperación de la información más precisa y a darle un mejor uso al RSS. La inversión quizás sea costosa en tiempo y dinero, tanto para los creadores y coordinadores como para los autores, pero sin duda redundaría en un beneficio a ellos mismos, siendo altamente rentable.

martes, 10 de abril de 2012

Análisis de experiencia personal en el trabajo

Dentro del análisis del aprendizaje hay que reflexionar si hemos cumplido con los objetivos que propone el temario de la asignatura, lo primero será reflejar aquí cuales son esos objetivos, la asignatura propone:

"Estudio científico de los sistemas de indización y resumen como plataforma para el procesamiento y representación de información. Desde un enfoque multiparadigmático, se aborda su diseño, producción y evaluación mediante el empleo de técnicas y modelos validados. Considerando especialmente la últimas transformaciones que se han producido en la producción y difusión de información con el desarrollo de la llamada Web 2.0 y las Redes Sociales, al aparecer nuevos métodos para acceder a la información y difundirla Se dotará al estudiante de las habilidades y competencias necesarias para generar metainformación de calidad en el marco de la actual sociedad del conocimiento."

En mi opinión el trabajo realizado sobre tesauros en redes sociales, en nuestro caso LinkedIn, cumple ampliamente con los objetivos de la asignatura como iremos explicando, aunque es cierto que se dejan ciertas lagunas, que no se descarta se vayan completando a lo largo de lo que queda de curso.

En primer lugar en cuanto al estudio científico de los sistemas de indización y resumen como plataforma para el procesamiento y representación de la información, tanto el trabajo final como las clases y pequeñas aportaciones que hemos hecho individualmente en el blog, creo que cumplen con el objetivo, en un primer momento hemos tenido que mirar bibliografía específica para saber que es la indización, en cuanto al resumen se empezará a mirar a partir de ahora. Sin embargo, ¿qué mejor manera de explicar el proceso de la indización dentro de los tesauros, que imaginarte una herramienta y tener que explicarsela al resto de alumnos?. Sin duda en el proceso de comprensión de lo que tenemos entre manos, antes de lanzarte a explicarselo a los demás, es lo que hace que te hagas innumerables preguntas de como funciona un sistema de información, como indiza y como recupera, es esencial entender esta cuestión para explicarsela a los demás.
En cuanto al diseño, producción y evaluación mediante el empleo de técnicas y modelos validados, se ha cumplido el objetivo en mi opinión aunque con ciertos matices. En primer lugar no se han utilizado técnicas y modelos validados, puesto que esta herramienta no existe en el mercado y hemos tenido que inventarnosla nosotros. En segundo lugar en el trabajo se ha diseñado experimentalmente y se ha evaluado pero no se ha producido. El no cumplir con el objetivo al pie de la letra no quiere decir que el método empleado en la asignatura no sea el adecuado, más bien al contrario, exponer al alumno a realizar algo nuevo que todavía no existe es lo que hace que se requiera un esfuerzo extra del alumno, el esfuerzo mental de crear una herramienta nueva y de ponernos en situación es lo que hace que los conocimientos adquiridos no se olviden, de nuevo el alumno se hace numerosas preguntas que hay que ir respondiendo, para mi ese es el mayor logro de este trabajo. El diseño de sistemas de indización e información en esta fase beta sin duda ha sido muy productivo, aunque claro habría que dedicar más tiempo para pulir detalles. En cuanto a la evaluación, no estamos hablando sólo de la autoevaluación que ha hecho cada uno de los individuos del grupo por su lado, sino también de la autoevaluación que realiza del proyecto, el grupo en si mismo, pero es que además todos los alumnos hemos evaluado por separado al resto de grupos. Una buena evaluación requiere varios pasos: 1. Saber de que estamos hablando (imposible si no te pones en el pellejo del otro, habiendo realizado un trabajo si quiera parecido) 2. Prestar atención durante la exposición del resto de grupos. 3. Hacer un análisis de todo lo expresado por ellos y compararlos para puntuarlos de una forma justa.
En mi opinión toda esa serie de pasos se han dado con satisfacción en los alumnos de la clase demostrando una gran madurez a la hora de puntuar a los grupos que se presentaban.

En cuanto a el nivel de comprensión alcanzado en lo relativo al Universo 2.0 y lo que se ha avanzado en las posibilidades de actuar en ese campo, sin duda es en lo que más se ha hecho enfasis en esta asignatura. En mi caso personal creo que se ha comprendido perfectamente el concepto del universo 2.0, como una web participativa que crean los usuarios con sus aportaciones, donde la sociedad es la que construye enciclopedias, redes sociales, salas de preguntas/respuestas y multitud de opciones más. Esto lo entiende todo el mundo, lo más complicado es ver que nos ofrece a los documentalistas como nuevas oportunidades. La sesión de presentación de los trabajos ha sido muy util, sobre todo porque te das cuenta de que casi todos los grupos han ideado una herramienta donde es necesario la participación de un documentalista, pero cada uno le ha otorgado unas atribuciones distintas, parecidas pero no iguales. La conclusión que yo saco es que las nuevas tecnologías han abierto enormemente el abánico de nuevas profesiones y oportunidades para nuestro campo, es cuestión de estudiarlas y especializarte en alguna de ellas.

En cuanto al último de los objetivos que es dotar al estudiante de las habilidades y competencias necesarias para generar metainformación de calidad en el marco de la actual sociedad del conocimiento, creo que es uno de los aspectos en los que la asignatura todavía no ha profundizado, en mi opinión hemos rozado ese apartado pero poco más, en el trabajo lo hemos tenido en cuenta en el sentido de que hemos pensado que tendría que haber unos documentalistas que moderasen la creación libre del tesauro por parte de los usuarios, es decir profesionales que velasen porque la metainformación creada sea de calidad.

Por último y a modo de conclusión la respuesta a: ¿Ha servido lo que hemos hecho para avanzar en el conocimiento de los tesauros y su construcción? Tras todo lo dicho la respuesta sólo puede ser si, desde luego hemos adquirido las bases para saber construir un tesauro, lo único que nos falta sería la práctica y llevarlo a cabo en un ámbito profesional

miércoles, 7 de marzo de 2012

Introducción al proyecto

Análisis del Universo 2.0

Según la prestigiosa revista tecnológica Information Week, “Web 2.0 son aquellas páginas web que obtienen su valor de las acciones y participación de sus usuarios”.

Este término implica una nueva forma de hacer las cosas. El Universo 2.0 implica que el usuario adquiera una mayor relevancia en la nueva Sociedad de la Información, pasando a ser un miembro clave de la misma por medio de su participación. Esto se traduce en que las webs dejan de ser exclusivamente de la persona que las creó para pasar a ser también nuestras. En este momento se ofrecen multitud de servicios gratuitos gracias a diversas tecnologías que hacen de la red una plataforma con un sinfín de aplicaciones. Gracias a este tipo de herramientas y el uso adecuado de éstas, el usuario pasa de ser un mero consumidor de la información existente a un potencial creador de la misma, convirtiéndose de este modo en un elemento fundamental de esta nueva forma de transmitir conocimiento.

Un ejemplo muy claro de esto sería la Wikipedia, la cual está formada por los contenidos que han redactado una serie de usuarios anónimos y que cualquiera de nosotros podemos editar y añadir conceptos. El usuario forma parte de la red y participa de forma activa en la misma.

A parte de la ya mencionada Wikipedia, existen hoy en día una gran gama de redes sociales y que permiten a personas de todo el mundo relacionarse a tiempo real y compartir todo tipo de información. Existen al mismo tiempo algunas páginas cuyo fin primordial no es la relación entre las personas, sino el conocimiento que se puede adquirir a partir de las mismas. Estaríamos hablando de páginas como Facebook, Twitter, LinkedIn Tuenti, MySpace, YouTube, Flickr, del.icio.us, digg, Technorati, blogger, Google Maps y tantas otras que permiten el libre acceso a diferente tipo de información, creada y gestionada por los propios usuarios.

Teniendo en cuenta lo dicho y viendo el papel que juega la participación de los diferentes usuarios en este nuevo concepto Web, valoramos la posibilidad de la existencia de un Tesauro que permita una mejor recuperación de la información contenida en las diferentes redes sociales. Para ello, es necesaria una adecuada indización de los contenidos. El problema es el desconocimiento de este tipo de herramienta por la mayoría de las personas que forman parte de este tipo de comunidades. Esto implica la necesidad de la creación de un manual que explique el uso adecuado de esta aplicación.

En nuestro caso concreto nos vamos a centrar en la plataforma de LinkedIn, la cual es una comunidad que permite a un usuario determinado localizar y obtener información referente al mundo laboral. Está justificada dentro del Universo 2.0 porque las personas registradas en LinkedIn son los auténticos creadores y gestores de la información existente.

Redefinición de papel de documentalistas y gestores de información

Tanto la documentación como los gestores de la información han visto transformado su mundo a través de las nuevas tecnologías, en nuestra pequeña aplicación para una red social tendríamos aquí un nicho nuevo de trabajo para el nuevo documentalista, que actuaría de moderador y gestor de la información de la red social para el mejor acceso y difusión de la misma entre los usuarios de la red. De esta manera el gestor de la información va ordenando, clasificando, indizando y difundiendo información que se está creando en ese mismo momento.

Esto sólo es un breve ejemplo de las nuevas posibilidades que nos ofrece el mundo digital y que transforman el papel de los documentalistas y gestores de la información. Las posibilidades en realidad serían ilimitadas, pero creemos que todo está relacionado con la difusión selectiva de la información. Tanto en bibliotecas, archivos, centros de documentación, como en el mundo digital a través de las redes sociales o servicios RSS, sería el usuario el que cumplimentando un sencillo perfil nos indicaría, además de sus datos personales, sus intereses y aficiones. Así, el documentalista adquiere la nueva misión de difundir la documentación a los usuarios según ese perfil y por tanto adelantarse a sus demandas, obteniendo así una mayor satisfacción de sus potenciales clientes. Una de las nuevas oportunidades que se nos ofrecen es el conocido como Gestor de Comunidades o Community Manager, entre otras muchas acepciones.

METODOLOGÍA

Nuestra metodología se ha basado en diversos puntos. Primeramente, hemos llevado a cabo lo comúnmente conocido como “lluvia de ideas”. A partir de esta técnica hemos llegado a la conclusión de que lo más adecuado sería realizar un tesauro para la red social LinkedIn. Nuestra herramienta permitiría a los diferentes usuarios de esta comunidad el poder llevar a cabo una recuperación de información más adecuada a sus intereses. Una vez que la estructura básica del tesauro nos la proporcionaría directamente LinkedIn, la tarea fundamental a realizar sería la elaboración de dos manuales: uno para el usuario de la red social, sobre cómo se ha de usar el tesauro; y un segundo manual sobre el modus operandi de los futuros moderadores-documentalistas. En el manual de los futuros usuarios se haría una explicación detallada de cómo se ha de usar la herramienta los usuarios de la red social con ejemplos visuales. En el manual de los moderadores, se haría una explicación de la función de los mismos y cómo tienen que actuar ante posibles contingencias (usuario que quiere añadir una nueva rama de conocimiento, errónea indización por parte de los usuarios y posibles correcciones).

miércoles, 21 de diciembre de 2011

CONSTRUCCIÓN DE TESAUROS

Con el objetivo de poner en práctica los conocimientos adquiridos acerca de la necesidad actual de la indización, hemos constituido un grupo de trabajo para llevar a cabo la construcción de una herramienta que será aplicada en una determinada red social para ayudar a los usuarios de la misma a organizar el flujo de información. La herramienta en cuestión es una guía para la elaboración de un tesauro que permita a los futuros clientes establecer un vocabulario controlado para mejorar la relación y comunicación entre los mismos.

Nuestro grupo está formado por:

-Carrascosa Carrascosa, Pablo
-Cascón Katchadourian, Jesús (Portavoz)
-Marín Gómez, Pablo
-Ocaña Rosa, Kevin Noel
-Prats, Andreu
-Rodríguez Fernández, Javier.

El trabajo consistiría a grandes rasgos en responder a una serie de interrogantes que se podrían hacer los futuros usuarios de esa herramienta de la red social, en concreto:

1. ¿Qué es un tesauro?
2. ¿Para qué sirve un tesauro?
3. ¿Cómo se construye?
4. ¿Porque le conviene a una determinada comunidad hacer ese esfuerzo?

Para responder a esas preguntas la metodología adoptada sería la del brainstorming o lluvia de ideas, la cual quedaría reflejada en una wiki proporcionada por el profesor, donde cada uno de los 6 integrantes del grupo daríamos nuestra opinión y análisis sobre lo que habría que responderle a un usuario inexperto en cada uno de los anteriores puntos. Ello se completaría con enlaces a otros documentos web donde se tratase en más profundidad el punto en cuestión por si el usuario necesita más información

Una vez realizado esto, sería el momento de pasar a una segunda fase, la cual consistiría en hacer una síntesis de todas las respuestas, es decir, se escogería lo mejor de cada respuesta para los fines que nos proponemos.

La tercera fase, es mostrar el resultado al profesor la semana antes de la entrega definitiva, para subsanar posibles errores o incorrecciones detectadas por el mismo.

La última fase sería la entrega definitiva del trabajo.

Cronograma

La primera fase sería hasta el 31 de Diciembre de 2011.

La segunda fase iría desde el 1 de Enero hasta el día 10 de Enero.

La tercera fase iría desde el 11 de Enero hasta el 17 de Enero.

La cuarta fase es el día de la entrega del trabajo, el 18 de Enero.

martes, 29 de noviembre de 2011

¿Qué papel tiene la indización en el infoescenario actual?

Como ya dijimos en el anterior post, la indización es el proceso de describir o representar el contenido temático de un recurso de información. Recursos de información hay muchísimos y de muchos tipos: textual, gráfico, audiovisual, fotografías, etc. En mi opinión los documentos de texto (que parece que son los únicos documentos en los que pensamos cuando hablamos de indización) se deberían indizar a texto completo, es decir, que en la base de datos todas y cada una de las palabras del texto pudieran ser encontradas por el buscador de la base de datos, puesto que hoy en día la tecnología lo permite. Esto evidentemente sería más fácil hacerlo con los documentos electrónicos, más complicado pero plausible con un esfuerzo generoso, sería la posibilidad de que las bibliotecas ocupasen gran parte de su tiempo, con becas, prácticas, etc., a digitalizar los documentos que poseen pero claro pasados por un OCR. En parte lo hace google books pero por los derechos de autor sólo muestran una serie de páginas (cómo si un lector ojease un libro en una libreria antes de comprarlo).

A pesar de lo dicho, la indización propiamente dicha tendría un campo enorme en la descripción de videos, fotografías, música, etc que también están en bases de datos y necesitan una descripción, estos documentos en la actualidad se están logicamente multiplicando, por lo que habría que multiplicar el esfuerzo. Aqui con la existencia de Google, de herramientas como por ejemplo Panoramio que ya comentamos, toma mayor relevancia la indización de estos recursos ya que a través de los buscadores de internet nos llevarían a una serie de imágenes, videos, etc. a los que antes ni soñabamos llegar.

Por otro lado tendríamos que hablar aquí de los marcadores sociales y de la Folcsonomía o folksonomía, según la wikipedia "es una indexación social, es decir, la clasificación colaborativa por medio de etiquetas simples en un espacio de nombres llano, sin jerarquías ni relaciones de parentesco predeterminadas. Se trata de una práctica que se produce en entornos de software social cuyos mejores exponentes son los sitios compartidos como delicious (enlaces favoritos), Flickr (fotos), Tagzania (lugares), flof (lugares) o 43 Things (deseos)."

Sobre la indexación social que se da en la web, y trasladada esa idea a las bibliotecas y archivos, la reflexión que hay que hacer en mi opinión, no es la del concepto de autoridad, entendiendolo como que si no indiza el documento un profesional, no nos podemos fiar de la indización. En mi opinión la reflexión tiene más que ver con que, donde no hay nada hecho, es mejor que tengamos la descripción del usuario. El ejemplo es el de un archivero de Ubeda, que harto de que le negasen el personal para gestionar el archivo (entre otras cosas, describirlo), colgó en internet fotografías de los documentos, hechas tanto por él como por el guardía de seguridad que es aficionado a la fotografía (y que seguramente se aburriría allí como una ostra), y ni corto ni perezoso dejo un apartado para que los usuario de este servicio describiesen si querían el contenido del documento. Para mí es un ejemplo de indización social, primero discute el concepto de autoridad en ese ambito, pero a la vez es consciente de que aquello se va a quedar sin describir al no ser que se pruebe algo diferente. El día que haya equipo para hacer una descripción "seria" del contenido del archivo habría que ver donde es necesario hacerla y donde no.
Me parece muy interesante el artículo de Maria Pinto, en concreto el apartado tesauro y el subapartado el proceso de indización del documento.y dentro de el mismo indización automática. Habla de las nuevas cuestiones que se están dando en este ámbito.

Técnicas de indización y resumen

Vistas de página en total

miércoles, 19 de noviembre de 2014

Ejemplo

lunes, 20 de octubre de 2014

hola

martes, 19 de junio de 2012

EL RESUMEN EN LOS TIEMPOS DEL RSS

EL RESUMEN EN LOS TIEMPOS DEL RSS

-INTRODUCCIÓN.

1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.

2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.

3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN COMÚN.

4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0: RSS.

5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.

martes, 10 de abril de 2012

Análisis de experiencia personal en el trabajo

miércoles, 7 de marzo de 2012

Introducción al proyecto

miércoles, 21 de diciembre de 2011

CONSTRUCCIÓN DE TESAUROS

martes, 29 de noviembre de 2011

¿Qué papel tiene la indización en el infoescenario actual?

Datos personales

Archivo del blog