Técnicas de indización y resumen
Vistas de página en total
miércoles, 19 de noviembre de 2014
lunes, 20 de octubre de 2014
martes, 19 de junio de 2012
EL RESUMEN EN LOS TIEMPOS DEL RSS
EL RESUMEN EN LOS TIEMPOS DEL RSS
-INTRODUCCIÓN.
1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.
2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.
3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN COMÚN.
4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0: RSS.
5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.
-INTRODUCCIÓN.
En este post
mi intención es analizar el RSS
como herramienta para el resumen documental,
o lo que es lo mismo averiguar si en el universo 2.0 hay un hueco para
el resumen documental igual que vimos que si existía para la indización. La
respuesta antes de efectuar en sí el análisis, es si y no. Sí, porque no siendo
una herramienta específica de resumen documental, su potencialidad y usos es
enorme. No, porque en esencia no es lo mismo que el resumen documental. Veremos
si después del análisis del RSS nuestra impresión es la misma que la que parece
a simple vista.
Una vez
establecido la intención de este post, creo que es conveniente definir los
conceptos resumen documental y rss.
1. DEFINICIÓN DE RESUMEN DOCUMENTAL. ¿POR QUÉ SURGE Y CON QUÉ FIN?.
Resumen documental según la wikipedia
es: “Una representación abreviada, objetiva y precisa del contenido de un
documento o recurso, sin interpretación crítica y sin mención expresa del autor
del resumen”
El resumen es
un documento secundario muy provechoso para los profesionales y estudiosos por
su potencial informativo, sin embargo, que sea un documento secundario no
quiere decir que no sea un verdadero texto autónomo del anterior, es decir es
independiente con respecto al texto al que hace referencia. Otra característica
es que se pueden hacer distintos resúmenes de un mismo texto, por lo que pueden
ser muy diversos.
Una vez definido
el qué, es ineludible explicar por qué
surge y con qué fin, a la vez que
expresamos brevemente la evolución
del resumen documental en el tiempo.
Cuando no
habían aparecido las nuevas tecnologías en el mundo de la documentación, se
estimaba que un investigador de media tardaba un 70% de su tiempo de
investigación en encontrar información, de tal forma que tardaba más tiempo en
buscar información que en la investigación propiamente dicha. A partir de ese
momento, se decidió incluir resúmenes en los trabajos científicos, de tal forma
que el investigador pudiera dedicar más tiempo a su investigación. Pero el
problema sólo se solucionó en parte, muchas veces encontrar los documentos que
uno necesitaba era tedioso, engorroso y sumamente lento, cuando no imposible,
perdiéndose tiempo en realizar investigaciones que ya habían sido realizadas.
Igualmente no se encontraban investigaciones que mostraban descubrimientos
críticos para nuestras propias investigaciones. Es por esto que se decidió
crear unas revistas exclusivas de resúmenes para que los investigadores
tuvieran constancia de aquellos avances y pudieran saber que ese documento existía
e incluso encargarlo a un centro de documentación. Aunque esto supuso un gran
avance y un gran ahorro de tiempo para el investigador, esas revistas eran
caras y difíciles de realizar, por lo que había pocos ejemplares. Con la
llegada de las nuevas tecnologías y gracias a los resúmenes, el investigador ha
podido usar la mitad de su tiempo en encontrar información y la otra mitad en
analizarla y realizar investigaciones.
Como
conclusión el resumen tiene por objeto exponer de forma breve los contenidos principales
de un documento con el fin de facilitar su indización, búsqueda y recuperación,
así como dar a conocer de antemano el contenido del documento o recurso para
que el usuario decida sobre la conveniencia de consultar o no el texto
completo.
Hay que decir
por último que la importancia del resumen es tal que se han realizado normas
ISO y UNE para definir y clasificar a este tipo de documento. En concreto son
la norma ISO 214-1976: Documentation
Abstracts for publications and documentation y la norma UNE 50-103-1990 de Documentación
y preparación de resumenes.
2. DEFINICIÓN DE RSS. UTILIDADES Y VENTAJAS.
Por otro lado
el RSS según la wikipedia son “las
siglas de Really Simple Syndication,
un formato XML para sindicar o compartir contenido en la web. Se utiliza para
difundir información actualizada frecuentemente a usuarios que se han suscrito
a la fuente de contenidos”.
Siguiendo con la wikipedia “Cuando hablamos de RSS
nos referimos usualmente a la tecnología completa para distribución de
contenidos de los sitios web. Pero un RSS es realmente un formato de archivo,
basado en XML, que sirve para recoger contenidos publicados en páginas web. Los
RSS tienen extensión .rss o bien .xml, pero en realidad son un simple archivo
de texto donde aparecen referencias a contenidos publicados, en un formato
específico, creado a partir de XML.
En el archivo RSS simplemente están los datos de las
novedades del sitio, como el título, fecha de publicación o la descripción. El
programa que lea el RSS será encargado de darle estilo o apariencia a los datos
que se incluyan en el archivo y presentarlos de una manera atractiva al usuario
y de fácil lectura.
Que RSS sea un formato basado en XML significa que
el archivo RSS se compone por una serie de etiquetas definidas que tendrán un
formato dado, que respetará las reglas generales de XML.”
Mostremos ahora algunas de las utilidades del RSS:
- Feed de blog- cada entrada de blog es resumida como un item de feed. Esto hace que los posts de los blogs sean más fáciles de buscar, habilitando a los visitantes para que encuentren lo que les interesa.
- Feed de artículos- esto alerta a los lectores cuando hay nuevos artículos y contenidos web disponibles.
- Feed de foros-esto permite a los usuarios recibir post de foros y los temas de las últimas discusiones.
- Feed de actividades -esto permite a los usuarios (escuelas, clubs, y otras organizaciones) publicar nuevos eventos o anunciar cambios en sus calendarizaciones.
- Feeds especiales o de descuentos – esto habilita a los usuarios (como tiendas de retail y online) entregar ofertas y descuentos de último minuto.
- Ego o Monitoreo de noticias – esto habilita a los usuarios para recibir titulares filtrados o noticias basadas en cierta frase o palabra clave.
Aparte de las ventajas obvias del RSS como son estar
al día de las últimas noticias y que es el usuario el que decide que le llega,
habría que citar también las siguientes:
- En el RSS no existe el SPAM, no recibes otra información que la que el usuario ha ido eligiendo
- Facilidad de uso, tanto para darse de alta en contenidos como para darse de baja.
- Gratuidad del servicio, lógicamente si se trata de documentos de una revista de pago por ejemplo, debes estar suscrito a la revista.
3. RESUMEN Y RSS. DIFERENCIAS Y PUNTOS EN
COMÚN.
Una vez
definidos ambos conceptos, subsiste la tesis de que efectivamente no son la
misma cosa, sin embargo ello no quiere decir que no tengan puntos en común.
Diferencias.
1º Como hemos visto realmente el RSS no resume el
recurso, más bien coge una serie de datos para que nuestro lector RSS sea capaz
de interpretarlos y mostrarlos.
2º No sólo no resume el recurso sino que nos lo
muestra completo o en forma de lista, lo cual da apariencia de resumen (puesto
que nos muestra el título y las primeras letras), pero en todo caso ello es una
forma de presentación de nuestro lector RSS.
3º A día de hoy cualquier proceso automatizado (y
este lo es) trabaja con datos y no con información, por lo que al no haber
detrás del proceso una persona que se lea el artículo completo y que haga un
resumen científico, o bien que el propio autor se tome la molestia de
realizarlo, difícilmente una máquina podrá realizar esa labor. En la carrera
hemos tenido una asignatura en la cual se leían artículos rápidamente y se
evaluaba críticamente si tanto el título, palabras clave y el resumen, eran
adecuados, o por el contrario no se ajustaban realmente al contenido del
artículo. El problema está en que ni siquiera los autores (con mala intención o
no) son capaces muchas veces de hacer buenos resúmenes, al igual que algunos
documentalistas. Es por ello que veo difícil por no decir imposible que un
proceso automatizado realice las labores de resumen documental.
4º Igualmente el RSS funciona bien con páginas webs
que se actualizan con cierta regularidad, no así con otras páginas que
contienen documentos ya almacenados y de los que tu quieres información. Si
bien es cierto que desde que te suscribes a un determinado contenido el RSS no
sólo te informará de publicaciones futuras, sino también de las pasadas, no le
veo su utilidad tradicional en bases de datos por ejemplo que no se vayan
renovando.
Puntos en común:
1º Al igual que el resumen documental,
el RSS se ha inventado como una herramienta que nos hace ganar tiempo. Si
existen varias páginas web que te interesan que van actualizando sus contenidos
y te gustaría mantenerte informado, un lector RSS te ahorrará mucho tiempo en
esta tarea. Gracias al RSS, no tendrás que visitar cada una de las páginas web
que te interesan para ver si han añadido o no algún artículo que te pueda
interesar. Estas páginas te informarán a ti (a través de tu lector de RSS).
Cuando ingreses a tu Lector RSS (o Rss Reader), estarás automáticamente
informado sobre todas las novedades que se han producido en todas las páginas
web que has dado de alta.
2º Si un usuario ha elegido bien
los contenidos que quiere recibir por RSS, de alguna manera él mismo ha elegido
que quiere recibir, es decir establece una criba entre lo que le interesa y lo
que no de distintas fuentes de contenidos, de esta manera “resume” lo que le
interesa, desechando aquello que no le es de interés.
4. HUECOS Y OPORTUNIDADES DEL RESUMEN DOCUMENTAL EN EL UNIVERSO 2.0:
RSS.
Una
vez explicado todo lo anterior veamos cuales son los principales huecos u oportunidades que nos brinda
el RSS en lo que concierne al resumen documental y por último que hace falta para que ello se de de
forma satisfactoria.
En
cuanto a los huecos u oportunidades:
1º Citar en primer lugar lo que
ha quedado expresado en la última narrativa del trabajo donde relacionamos los
tesauros y el RSS dentro de la red social LinkedIn, apuntar que para ello ha
sido necesaria una correcta indización que se conseguiría a través del tesauro,
en ello profundizaremos en el último punto del post. De forma breve es lo
siguiente:
A. El
usuario puede o no suscribirse a la etiqueta de su perfil del tesauro o a otras
de su interés, para que cada vez que se incorpore algún perfil nuevo, ya sea de
un usuario, una empresa, una oferta de empleo, unas jornadas, este lo reciba en
su lector de RSS, y así estar al tanto de las novedades del sector. Nótese que
si ha concretado mucho en su perfil profesional esta herramienta puede ser más
útil que si ha puesto como descriptor un descriptor general.
B. También
el usuario puede suscribirse a una etiqueta o descriptor que ha creado o
modificado, para ver la evolución del término y de sus relaciones con otros
términos, de esta manera puede ser notificado por ejemplo de la creación de un
término relacionado o admitido que sea más de su gusto y mantener de esta
manera una indización más satisfactoria para el usuario.
2. Tras meternos en el website de
nature, para poder ver un ejemplo de lo que hoy en día ya se puede hacer con el
RSS en una de las revistas más prestigiosas del mundo, lo primero que
comprobamos dentro de nuestra ignorancia es que dicha revista, no es una sola
revista, sino que son múltiples, es decir, hay una revista general llamada
nature, pero también hay muchas revistas independientes, por ejemplo de
biología molecular, astrofísica, etc. Si le das a nature web feeds, nos muestra
las múltiples revistas a las que te puedes suscribir. También te deja hacer una
búsqueda por temática, dentro de ella te lleva a numerosos campos del
conocimiento y si pichas dentro de cualquier campo te muestra las revistas asociadas.
De esta forma la web que evidentemente está muy bien organizada, te permite
suscribirte a las novedades de cada una de las revistas, incluso por lo menos
dentro de la revista principal te deja suscribirte a la tabla de contenidos, últimas
investigaciones, por campos de investigación, etc. Todo esto está muy bien, sin
embargo sería de mayor utilidad en mi opinión, que te dejase suscribirte a un
término concreto. Expliquémoslo, si dentro de la revista, metiéndote a través
de la VPN y a través de ésta a la revista nature, llegamos a un artículo
cualquiera, en él se nos muestra el resumen del mismo y las palabras clave,
pinchando en las mismas (puesto que son enlaces), por ejemplo en biología
molecular, nos muestra los artículos que dentro del año 2012 en un determinado
mes hablan de ese tema (sólo podemos escoger los últimos tres años), dejándonos
como es lógico pinchar en cualquiera de ellos y realizar la misma operación.
Esta forma de actuar limita enormemente, en nuestra opinión, la forma de
buscar, debido a que debería dejar la opción de mostrarnos los artículos, de al
menos, estos últimos tres años todos juntos, aunque eso sin duda es lo de menos.
Lo de más sería que nos dejase la posibilidad de suscribirnos a ese determinado
término. Eso sin duda se haría de una forma más eficiente a través de un
tesauro (obsérvese en el último punto como en nuestra opinión, el RSS y en
consecuencia el resumen documental en la 2.0 siempre dependen de una buena
indización de los términos.)
3. Otro de los huecos es el que
hemos comprobado en clase, asociando una búsqueda RSS en las noticias de Google,
con el lector RSS y publicándolo todo automáticamente en el twitter, aunque
aquí aportaremos una posibilidad de extrapolarlo a otras bases de datos. Como
luego explicaremos sería conveniente tener toda la publicación mundial tanto
científica como no científica en un determinado espacio web, donde se puedan
hacer búsquedas rápidas sobre toda la información mundial. Pues bien, lo más
parecido a ello es Google y otros buscadores. El RSS, por su propia naturaleza,
funciona bien cuando salen nuevos documentos, nuevas noticias, etc. es por eso
que se asociaría al google noticias por ejemplo y recibiríamos todas las
novedades “resumidas” en nuestro lector, el cual lo publicaría automáticamente
en el twitter, aunque ello evidentemente no es obligatorio, simplemente es una
forma de compartir una información con alguien.
Al final Google es una base de
datos de tamaño ingente, donde en el buscador pones unos determinados términos,
los cuales te enlazan a una serie de resultados que según su algoritmo se
consideran más o menos relevantes. Por tanto eso se podría extrapolar a todo
tipo de bases de datos, la novedad respecto al ejercicio de clase que se
propone, iría orientada a bases de datos de menor tamaño, donde tu propondrías
un término o conjunto de términos de búsqueda, a esa búsqueda en la base de
datos se le haría una suscripción, como ya hicimos en clase con Google. De
alguna manera el RSS guardaría los documentos que existen en la base de datos
antes de la suscripción sin mostrarlos el visor (puesto que el número sería
demasiado grande e inservible), esa búsqueda se iría repitiendo en el tiempo
automáticamente y los documentos que se añadiesen dentro de la búsqueda nos
llegarían por RSS.
5. PASOS PARA LLEVARLO A LA REALIDAD Y CONCLUSIONES.
Un primer aspecto para que esto
se lleve a cabo, es la correcta indización de los documentos de la base de
datos, sin eso todo lo demás pierde importancia, son dos aspectos íntimamente
relacionados, es obvio que el RSS es un proceso automatizado, te va a llegar lo
que tú has solicitado, si los documentos de una posible búsqueda tanto en un
buscador tipo google, como para el buscador de cualquier base de datos no están
correctamente indizados, evidentemente te va a llegar al lector RSS documentos
que no son relevantes. Estamos hablando de la recuperación de la información
como tantas veces hemos hecho hincapié en la asignatura y su relación con la
indización, en este caso el RSS es una clara herramienta de Difusión Selectiva
de la Información (DSI).
En mi opinión, la formación de
archivero que poseo deja bien a las claras que la indización de los documentos
tiene que llegar desde la producción de los mismos, me estoy refiriendo a los
documentos electrónicos y a los metadatos, una buena solución son los metadatos
normalizados Dublin Core. Igualmente los documentos deben ser clasificados
según su tipología desde la producción de los mismos, esa es la labor
fundamental de un archivero, documentalista, bibliotecario y de todos los
profesionales de las ciencias de la información. No cabe duda que estos tienen
que buscar al público que consuma esos documentos, pero lo fundamental es que
estos documentos lleguen al público y a los profesionales de una manera
adecuada y que se dé la posibilidad al usuario a acceder a los mismos de la
forma que ellos elijan. Por supuesto no se trata de bombardearlos y ahí
precisamente es donde entra el RSS como herramienta de DSI, es el usuario el
que decide que quiere, sin duda este concepto entra de lleno dentro de la
filosofía 2.0 y por supuesto dentro de la idiosincrasia de este tipo de
profesiones de servir al ciudadano.
Otro aspecto
que me gustaría analizar, es que aunque con los resúmenes documentales y con el
RSS se ganaría tiempo, no hay que olvidar que el usuario normal o el científico
se tendría que dirigir a múltiples páginas webs y bases de datos en internet
para encontrar todo lo que se pública sobre su parcela de interés, como ya
dijimos antes quizás los buscadores de internet te permiten bucear tímidamente
por todos los contenidos, la propia creación de internet se ha hecho con un
mínimo control y es por así decirlo, un universo aparte, que, no podría ser de
otra manera, tiene su diversidad y múltiples formas de crear. A pesar de la
bondad de como se ha ido creando esta World Wide Web, sería conveniente que al
menos dentro de la órbita del conocimiento científico se procurase crear una
web que aglutinase por ramas del saber todo el conocimiento científico que se
va publicando a base de monografías, artículos, informes, etc. Un intento de
todo esto es la Web Of Knowledge o web del conocimiento, no soy un experto en
la materia pero estoy casi seguro que no posee todos los artículos publicados
mundialmente en cualquier revista científica dada de alta como tal, sino que
tendrá los artículo de las revistas llamadas de impacto.
Sería
conveniente que ese esfuerzo se realizará de abajo a arriba y de arriba abajo,
es decir que desde las cúpulas de poder se intentase reunir toda esa
información y que además todos los autores de artículos científicos del mundo
se preocupasen en colgar sus novedades en esa web, con la firme convicción de
que así sus artículos se leerían más y por tanto tendrían más posibilidades de
ser citados por otros científicos, etc, etc. Todo ello redundaría en su propio
beneficio, si cada documento estuviera perfectamente indizado por cada creador
(como requisito para poder publicarlo) y asociado a un tesauro, ello nos
llevaría a una recuperación de la información más precisa y a darle un mejor
uso al RSS. La inversión quizás sea costosa en tiempo y dinero, tanto para los
creadores y coordinadores como para los autores, pero sin duda redundaría en un
beneficio a ellos mismos, siendo altamente rentable.
martes, 10 de abril de 2012
Análisis de experiencia personal en el trabajo
Dentro del análisis del aprendizaje hay que reflexionar si hemos cumplido con los objetivos que propone el temario de la asignatura, lo primero será reflejar aquí cuales son esos objetivos, la asignatura propone:
"Estudio científico de los sistemas de indización y resumen como plataforma para el procesamiento y representación de información. Desde un enfoque multiparadigmático, se aborda su diseño, producción y evaluación mediante el empleo de técnicas y modelos validados. Considerando especialmente la últimas transformaciones que se han producido en la producción y difusión de información con el desarrollo de la llamada Web 2.0 y las Redes Sociales, al aparecer nuevos métodos para acceder a la información y difundirla Se dotará al estudiante de las habilidades y competencias necesarias para generar metainformación de calidad en el marco de la actual sociedad del conocimiento."
En mi opinión el trabajo realizado sobre tesauros en redes sociales, en nuestro caso LinkedIn, cumple ampliamente con los objetivos de la asignatura como iremos explicando, aunque es cierto que se dejan ciertas lagunas, que no se descarta se vayan completando a lo largo de lo que queda de curso.
En primer lugar en cuanto al estudio científico de los sistemas de indización y resumen como plataforma para el procesamiento y representación de la información, tanto el trabajo final como las clases y pequeñas aportaciones que hemos hecho individualmente en el blog, creo que cumplen con el objetivo, en un primer momento hemos tenido que mirar bibliografía específica para saber que es la indización, en cuanto al resumen se empezará a mirar a partir de ahora. Sin embargo, ¿qué mejor manera de explicar el proceso de la indización dentro de los tesauros, que imaginarte una herramienta y tener que explicarsela al resto de alumnos?. Sin duda en el proceso de comprensión de lo que tenemos entre manos, antes de lanzarte a explicarselo a los demás, es lo que hace que te hagas innumerables preguntas de como funciona un sistema de información, como indiza y como recupera, es esencial entender esta cuestión para explicarsela a los demás.
En cuanto al diseño, producción y evaluación mediante el empleo de técnicas y modelos validados, se ha cumplido el objetivo en mi opinión aunque con ciertos matices. En primer lugar no se han utilizado técnicas y modelos validados, puesto que esta herramienta no existe en el mercado y hemos tenido que inventarnosla nosotros. En segundo lugar en el trabajo se ha diseñado experimentalmente y se ha evaluado pero no se ha producido. El no cumplir con el objetivo al pie de la letra no quiere decir que el método empleado en la asignatura no sea el adecuado, más bien al contrario, exponer al alumno a realizar algo nuevo que todavía no existe es lo que hace que se requiera un esfuerzo extra del alumno, el esfuerzo mental de crear una herramienta nueva y de ponernos en situación es lo que hace que los conocimientos adquiridos no se olviden, de nuevo el alumno se hace numerosas preguntas que hay que ir respondiendo, para mi ese es el mayor logro de este trabajo. El diseño de sistemas de indización e información en esta fase beta sin duda ha sido muy productivo, aunque claro habría que dedicar más tiempo para pulir detalles. En cuanto a la evaluación, no estamos hablando sólo de la autoevaluación que ha hecho cada uno de los individuos del grupo por su lado, sino también de la autoevaluación que realiza del proyecto, el grupo en si mismo, pero es que además todos los alumnos hemos evaluado por separado al resto de grupos. Una buena evaluación requiere varios pasos: 1. Saber de que estamos hablando (imposible si no te pones en el pellejo del otro, habiendo realizado un trabajo si quiera parecido) 2. Prestar atención durante la exposición del resto de grupos. 3. Hacer un análisis de todo lo expresado por ellos y compararlos para puntuarlos de una forma justa.
En mi opinión toda esa serie de pasos se han dado con satisfacción en los alumnos de la clase demostrando una gran madurez a la hora de puntuar a los grupos que se presentaban.
En cuanto a el nivel de comprensión alcanzado en lo relativo al Universo 2.0 y lo que se ha avanzado en las posibilidades de actuar en ese campo, sin duda es en lo que más se ha hecho enfasis en esta asignatura. En mi caso personal creo que se ha comprendido perfectamente el concepto del universo 2.0, como una web participativa que crean los usuarios con sus aportaciones, donde la sociedad es la que construye enciclopedias, redes sociales, salas de preguntas/respuestas y multitud de opciones más. Esto lo entiende todo el mundo, lo más complicado es ver que nos ofrece a los documentalistas como nuevas oportunidades. La sesión de presentación de los trabajos ha sido muy util, sobre todo porque te das cuenta de que casi todos los grupos han ideado una herramienta donde es necesario la participación de un documentalista, pero cada uno le ha otorgado unas atribuciones distintas, parecidas pero no iguales. La conclusión que yo saco es que las nuevas tecnologías han abierto enormemente el abánico de nuevas profesiones y oportunidades para nuestro campo, es cuestión de estudiarlas y especializarte en alguna de ellas.
En cuanto al último de los objetivos que es dotar al estudiante de las habilidades y competencias necesarias para generar metainformación de calidad en el marco de la actual sociedad del conocimiento, creo que es uno de los aspectos en los que la asignatura todavía no ha profundizado, en mi opinión hemos rozado ese apartado pero poco más, en el trabajo lo hemos tenido en cuenta en el sentido de que hemos pensado que tendría que haber unos documentalistas que moderasen la creación libre del tesauro por parte de los usuarios, es decir profesionales que velasen porque la metainformación creada sea de calidad.
Por último y a modo de conclusión la respuesta a: ¿Ha servido lo que hemos hecho para avanzar en el conocimiento de los tesauros y su construcción? Tras todo lo dicho la respuesta sólo puede ser si, desde luego hemos adquirido las bases para saber construir un tesauro, lo único que nos falta sería la práctica y llevarlo a cabo en un ámbito profesional
"Estudio científico de los sistemas de indización y resumen como plataforma para el procesamiento y representación de información. Desde un enfoque multiparadigmático, se aborda su diseño, producción y evaluación mediante el empleo de técnicas y modelos validados. Considerando especialmente la últimas transformaciones que se han producido en la producción y difusión de información con el desarrollo de la llamada Web 2.0 y las Redes Sociales, al aparecer nuevos métodos para acceder a la información y difundirla Se dotará al estudiante de las habilidades y competencias necesarias para generar metainformación de calidad en el marco de la actual sociedad del conocimiento."
En mi opinión el trabajo realizado sobre tesauros en redes sociales, en nuestro caso LinkedIn, cumple ampliamente con los objetivos de la asignatura como iremos explicando, aunque es cierto que se dejan ciertas lagunas, que no se descarta se vayan completando a lo largo de lo que queda de curso.
En primer lugar en cuanto al estudio científico de los sistemas de indización y resumen como plataforma para el procesamiento y representación de la información, tanto el trabajo final como las clases y pequeñas aportaciones que hemos hecho individualmente en el blog, creo que cumplen con el objetivo, en un primer momento hemos tenido que mirar bibliografía específica para saber que es la indización, en cuanto al resumen se empezará a mirar a partir de ahora. Sin embargo, ¿qué mejor manera de explicar el proceso de la indización dentro de los tesauros, que imaginarte una herramienta y tener que explicarsela al resto de alumnos?. Sin duda en el proceso de comprensión de lo que tenemos entre manos, antes de lanzarte a explicarselo a los demás, es lo que hace que te hagas innumerables preguntas de como funciona un sistema de información, como indiza y como recupera, es esencial entender esta cuestión para explicarsela a los demás.
En cuanto al diseño, producción y evaluación mediante el empleo de técnicas y modelos validados, se ha cumplido el objetivo en mi opinión aunque con ciertos matices. En primer lugar no se han utilizado técnicas y modelos validados, puesto que esta herramienta no existe en el mercado y hemos tenido que inventarnosla nosotros. En segundo lugar en el trabajo se ha diseñado experimentalmente y se ha evaluado pero no se ha producido. El no cumplir con el objetivo al pie de la letra no quiere decir que el método empleado en la asignatura no sea el adecuado, más bien al contrario, exponer al alumno a realizar algo nuevo que todavía no existe es lo que hace que se requiera un esfuerzo extra del alumno, el esfuerzo mental de crear una herramienta nueva y de ponernos en situación es lo que hace que los conocimientos adquiridos no se olviden, de nuevo el alumno se hace numerosas preguntas que hay que ir respondiendo, para mi ese es el mayor logro de este trabajo. El diseño de sistemas de indización e información en esta fase beta sin duda ha sido muy productivo, aunque claro habría que dedicar más tiempo para pulir detalles. En cuanto a la evaluación, no estamos hablando sólo de la autoevaluación que ha hecho cada uno de los individuos del grupo por su lado, sino también de la autoevaluación que realiza del proyecto, el grupo en si mismo, pero es que además todos los alumnos hemos evaluado por separado al resto de grupos. Una buena evaluación requiere varios pasos: 1. Saber de que estamos hablando (imposible si no te pones en el pellejo del otro, habiendo realizado un trabajo si quiera parecido) 2. Prestar atención durante la exposición del resto de grupos. 3. Hacer un análisis de todo lo expresado por ellos y compararlos para puntuarlos de una forma justa.
En mi opinión toda esa serie de pasos se han dado con satisfacción en los alumnos de la clase demostrando una gran madurez a la hora de puntuar a los grupos que se presentaban.
En cuanto a el nivel de comprensión alcanzado en lo relativo al Universo 2.0 y lo que se ha avanzado en las posibilidades de actuar en ese campo, sin duda es en lo que más se ha hecho enfasis en esta asignatura. En mi caso personal creo que se ha comprendido perfectamente el concepto del universo 2.0, como una web participativa que crean los usuarios con sus aportaciones, donde la sociedad es la que construye enciclopedias, redes sociales, salas de preguntas/respuestas y multitud de opciones más. Esto lo entiende todo el mundo, lo más complicado es ver que nos ofrece a los documentalistas como nuevas oportunidades. La sesión de presentación de los trabajos ha sido muy util, sobre todo porque te das cuenta de que casi todos los grupos han ideado una herramienta donde es necesario la participación de un documentalista, pero cada uno le ha otorgado unas atribuciones distintas, parecidas pero no iguales. La conclusión que yo saco es que las nuevas tecnologías han abierto enormemente el abánico de nuevas profesiones y oportunidades para nuestro campo, es cuestión de estudiarlas y especializarte en alguna de ellas.
En cuanto al último de los objetivos que es dotar al estudiante de las habilidades y competencias necesarias para generar metainformación de calidad en el marco de la actual sociedad del conocimiento, creo que es uno de los aspectos en los que la asignatura todavía no ha profundizado, en mi opinión hemos rozado ese apartado pero poco más, en el trabajo lo hemos tenido en cuenta en el sentido de que hemos pensado que tendría que haber unos documentalistas que moderasen la creación libre del tesauro por parte de los usuarios, es decir profesionales que velasen porque la metainformación creada sea de calidad.
Por último y a modo de conclusión la respuesta a: ¿Ha servido lo que hemos hecho para avanzar en el conocimiento de los tesauros y su construcción? Tras todo lo dicho la respuesta sólo puede ser si, desde luego hemos adquirido las bases para saber construir un tesauro, lo único que nos falta sería la práctica y llevarlo a cabo en un ámbito profesional
miércoles, 7 de marzo de 2012
Introducción al proyecto
Análisis del Universo 2.0
Según la prestigiosa revista tecnológica Information Week, “Web 2.0 son aquellas páginas web que obtienen su valor de las acciones y participación de sus usuarios”.
Este término implica una nueva forma de hacer las cosas. El Universo 2.0 implica que el usuario adquiera una mayor relevancia en la nueva Sociedad de la Información, pasando a ser un miembro clave de la misma por medio de su participación. Esto se traduce en que las webs dejan de ser exclusivamente de la persona que las creó para pasar a ser también nuestras. En este momento se ofrecen multitud de servicios gratuitos gracias a diversas tecnologías que hacen de la red una plataforma con un sinfín de aplicaciones. Gracias a este tipo de herramientas y el uso adecuado de éstas, el usuario pasa de ser un mero consumidor de la información existente a un potencial creador de la misma, convirtiéndose de este modo en un elemento fundamental de esta nueva forma de transmitir conocimiento.
Un ejemplo muy claro de esto sería la Wikipedia, la cual está formada por los contenidos que han redactado una serie de usuarios anónimos y que cualquiera de nosotros podemos editar y añadir conceptos. El usuario forma parte de la red y participa de forma activa en la misma.
A parte de la ya mencionada Wikipedia, existen hoy en día una gran gama de redes sociales y que permiten a personas de todo el mundo relacionarse a tiempo real y compartir todo tipo de información. Existen al mismo tiempo algunas páginas cuyo fin primordial no es la relación entre las personas, sino el conocimiento que se puede adquirir a partir de las mismas. Estaríamos hablando de páginas como Facebook, Twitter, LinkedIn Tuenti, MySpace, YouTube, Flickr, del.icio.us, digg, Technorati, blogger, Google Maps y tantas otras que permiten el libre acceso a diferente tipo de información, creada y gestionada por los propios usuarios.
Teniendo en cuenta lo dicho y viendo el papel que juega la participación de los diferentes usuarios en este nuevo concepto Web, valoramos la posibilidad de la existencia de un Tesauro que permita una mejor recuperación de la información contenida en las diferentes redes sociales. Para ello, es necesaria una adecuada indización de los contenidos. El problema es el desconocimiento de este tipo de herramienta por la mayoría de las personas que forman parte de este tipo de comunidades. Esto implica la necesidad de la creación de un manual que explique el uso adecuado de esta aplicación.
En nuestro caso concreto nos vamos a centrar en la plataforma de LinkedIn, la cual es una comunidad que permite a un usuario determinado localizar y obtener información referente al mundo laboral. Está justificada dentro del Universo 2.0 porque las personas registradas en LinkedIn son los auténticos creadores y gestores de la información existente.
Redefinición de papel de documentalistas y gestores de información
Tanto la documentación como los gestores de la información han visto transformado su mundo a través de las nuevas tecnologías, en nuestra pequeña aplicación para una red social tendríamos aquí un nicho nuevo de trabajo para el nuevo documentalista, que actuaría de moderador y gestor de la información de la red social para el mejor acceso y difusión de la misma entre los usuarios de la red. De esta manera el gestor de la información va ordenando, clasificando, indizando y difundiendo información que se está creando en ese mismo momento.
Esto sólo es un breve ejemplo de las nuevas posibilidades que nos ofrece el mundo digital y que transforman el papel de los documentalistas y gestores de la información. Las posibilidades en realidad serían ilimitadas, pero creemos que todo está relacionado con la difusión selectiva de la información. Tanto en bibliotecas, archivos, centros de documentación, como en el mundo digital a través de las redes sociales o servicios RSS, sería el usuario el que cumplimentando un sencillo perfil nos indicaría, además de sus datos personales, sus intereses y aficiones. Así, el documentalista adquiere la nueva misión de difundir la documentación a los usuarios según ese perfil y por tanto adelantarse a sus demandas, obteniendo así una mayor satisfacción de sus potenciales clientes. Una de las nuevas oportunidades que se nos ofrecen es el conocido como Gestor de Comunidades o Community Manager, entre otras muchas acepciones.
METODOLOGÍA
Nuestra metodología se ha basado en diversos puntos. Primeramente, hemos llevado a cabo lo comúnmente conocido como “lluvia de ideas”. A partir de esta técnica hemos llegado a la conclusión de que lo más adecuado sería realizar un tesauro para la red social LinkedIn. Nuestra herramienta permitiría a los diferentes usuarios de esta comunidad el poder llevar a cabo una recuperación de información más adecuada a sus intereses. Una vez que la estructura básica del tesauro nos la proporcionaría directamente LinkedIn, la tarea fundamental a realizar sería la elaboración de dos manuales: uno para el usuario de la red social, sobre cómo se ha de usar el tesauro; y un segundo manual sobre el modus operandi de los futuros moderadores-documentalistas. En el manual de los futuros usuarios se haría una explicación detallada de cómo se ha de usar la herramienta los usuarios de la red social con ejemplos visuales. En el manual de los moderadores, se haría una explicación de la función de los mismos y cómo tienen que actuar ante posibles contingencias (usuario que quiere añadir una nueva rama de conocimiento, errónea indización por parte de los usuarios y posibles correcciones).
miércoles, 21 de diciembre de 2011
CONSTRUCCIÓN DE TESAUROS
Con el objetivo de poner en práctica los conocimientos adquiridos acerca de la necesidad actual de la indización, hemos constituido un grupo de trabajo para llevar a cabo la construcción de una herramienta que será aplicada en una determinada red social para ayudar a los usuarios de la misma a organizar el flujo de información. La herramienta en cuestión es una guía para la elaboración de un tesauro que permita a los futuros clientes establecer un vocabulario controlado para mejorar la relación y comunicación entre los mismos.
Nuestro grupo está formado por:
-Carrascosa Carrascosa, Pablo
-Cascón Katchadourian, Jesús (Portavoz)
-Marín Gómez, Pablo
-Ocaña Rosa, Kevin Noel
-Prats, Andreu
-Rodríguez Fernández, Javier.
Nuestro grupo está formado por:
-Carrascosa Carrascosa, Pablo
-Cascón Katchadourian, Jesús (Portavoz)
-Marín Gómez, Pablo
-Ocaña Rosa, Kevin Noel
-Prats, Andreu
-Rodríguez Fernández, Javier.
El trabajo consistiría a grandes rasgos en responder a una serie de interrogantes que se podrían hacer los futuros usuarios de esa herramienta de la red social, en concreto:
1. ¿Qué es un tesauro?
2. ¿Para qué sirve un tesauro?
3. ¿Cómo se construye?
4. ¿Porque le conviene a una determinada comunidad hacer ese esfuerzo?
2. ¿Para qué sirve un tesauro?
3. ¿Cómo se construye?
4. ¿Porque le conviene a una determinada comunidad hacer ese esfuerzo?
Para responder a esas preguntas la metodología adoptada sería la del brainstorming o lluvia de ideas, la cual quedaría reflejada en una wiki proporcionada por el profesor, donde cada uno de los 6 integrantes del grupo daríamos nuestra opinión y análisis sobre lo que habría que responderle a un usuario inexperto en cada uno de los anteriores puntos. Ello se completaría con enlaces a otros documentos web donde se tratase en más profundidad el punto en cuestión por si el usuario necesita más información
Una vez realizado esto, sería el momento de pasar a una segunda fase, la cual consistiría en hacer una síntesis de todas las respuestas, es decir, se escogería lo mejor de cada respuesta para los fines que nos proponemos.
La tercera fase, es mostrar el resultado al profesor la semana antes de la entrega definitiva, para subsanar posibles errores o incorrecciones detectadas por el mismo.
La última fase sería la entrega definitiva del trabajo.
Cronograma
La primera fase sería hasta el 31 de Diciembre de 2011.
La segunda fase iría desde el 1 de Enero hasta el día 10 de Enero.
La tercera fase iría desde el 11 de Enero hasta el 17 de Enero.
La cuarta fase es el día de la entrega del trabajo, el 18 de Enero.
martes, 29 de noviembre de 2011
¿Qué papel tiene la indización en el infoescenario actual?
Como ya dijimos en el anterior post, la indización es el proceso de describir o representar el contenido temático de un recurso de información. Recursos de información hay muchísimos y de muchos tipos: textual, gráfico, audiovisual, fotografías, etc. En mi opinión los documentos de texto (que parece que son los únicos documentos en los que pensamos cuando hablamos de indización) se deberían indizar a texto completo, es decir, que en la base de datos todas y cada una de las palabras del texto pudieran ser encontradas por el buscador de la base de datos, puesto que hoy en día la tecnología lo permite. Esto evidentemente sería más fácil hacerlo con los documentos electrónicos, más complicado pero plausible con un esfuerzo generoso, sería la posibilidad de que las bibliotecas ocupasen gran parte de su tiempo, con becas, prácticas, etc., a digitalizar los documentos que poseen pero claro pasados por un OCR. En parte lo hace google books pero por los derechos de autor sólo muestran una serie de páginas (cómo si un lector ojease un libro en una libreria antes de comprarlo).
A pesar de lo dicho, la indización propiamente dicha tendría un campo enorme en la descripción de videos, fotografías, música, etc que también están en bases de datos y necesitan una descripción, estos documentos en la actualidad se están logicamente multiplicando, por lo que habría que multiplicar el esfuerzo. Aqui con la existencia de Google, de herramientas como por ejemplo Panoramio que ya comentamos, toma mayor relevancia la indización de estos recursos ya que a través de los buscadores de internet nos llevarían a una serie de imágenes, videos, etc. a los que antes ni soñabamos llegar.
Por otro lado tendríamos que hablar aquí de los marcadores sociales y de la Folcsonomía o folksonomía, según la wikipedia "es una indexación social, es decir, la clasificación colaborativa por medio de etiquetas simples en un espacio de nombres llano, sin jerarquías ni relaciones de parentesco predeterminadas. Se trata de una práctica que se produce en entornos de software social cuyos mejores exponentes son los sitios compartidos como delicious (enlaces favoritos), Flickr (fotos), Tagzania (lugares), flof (lugares) o 43 Things (deseos)."
Sobre la indexación social que se da en la web, y trasladada esa idea a las bibliotecas y archivos, la reflexión que hay que hacer en mi opinión, no es la del concepto de autoridad, entendiendolo como que si no indiza el documento un profesional, no nos podemos fiar de la indización. En mi opinión la reflexión tiene más que ver con que, donde no hay nada hecho, es mejor que tengamos la descripción del usuario. El ejemplo es el de un archivero de Ubeda, que harto de que le negasen el personal para gestionar el archivo (entre otras cosas, describirlo), colgó en internet fotografías de los documentos, hechas tanto por él como por el guardía de seguridad que es aficionado a la fotografía (y que seguramente se aburriría allí como una ostra), y ni corto ni perezoso dejo un apartado para que los usuario de este servicio describiesen si querían el contenido del documento. Para mí es un ejemplo de indización social, primero discute el concepto de autoridad en ese ambito, pero a la vez es consciente de que aquello se va a quedar sin describir al no ser que se pruebe algo diferente. El día que haya equipo para hacer una descripción "seria" del contenido del archivo habría que ver donde es necesario hacerla y donde no.
Me parece muy interesante el artículo de Maria Pinto, en concreto el apartado tesauro y el subapartado el proceso de indización del documento.y dentro de el mismo indización automática. Habla de las nuevas cuestiones que se están dando en este ámbito.
A pesar de lo dicho, la indización propiamente dicha tendría un campo enorme en la descripción de videos, fotografías, música, etc que también están en bases de datos y necesitan una descripción, estos documentos en la actualidad se están logicamente multiplicando, por lo que habría que multiplicar el esfuerzo. Aqui con la existencia de Google, de herramientas como por ejemplo Panoramio que ya comentamos, toma mayor relevancia la indización de estos recursos ya que a través de los buscadores de internet nos llevarían a una serie de imágenes, videos, etc. a los que antes ni soñabamos llegar.
Por otro lado tendríamos que hablar aquí de los marcadores sociales y de la Folcsonomía o folksonomía, según la wikipedia "es una indexación social, es decir, la clasificación colaborativa por medio de etiquetas simples en un espacio de nombres llano, sin jerarquías ni relaciones de parentesco predeterminadas. Se trata de una práctica que se produce en entornos de software social cuyos mejores exponentes son los sitios compartidos como delicious (enlaces favoritos), Flickr (fotos), Tagzania (lugares), flof (lugares) o 43 Things (deseos)."
Sobre la indexación social que se da en la web, y trasladada esa idea a las bibliotecas y archivos, la reflexión que hay que hacer en mi opinión, no es la del concepto de autoridad, entendiendolo como que si no indiza el documento un profesional, no nos podemos fiar de la indización. En mi opinión la reflexión tiene más que ver con que, donde no hay nada hecho, es mejor que tengamos la descripción del usuario. El ejemplo es el de un archivero de Ubeda, que harto de que le negasen el personal para gestionar el archivo (entre otras cosas, describirlo), colgó en internet fotografías de los documentos, hechas tanto por él como por el guardía de seguridad que es aficionado a la fotografía (y que seguramente se aburriría allí como una ostra), y ni corto ni perezoso dejo un apartado para que los usuario de este servicio describiesen si querían el contenido del documento. Para mí es un ejemplo de indización social, primero discute el concepto de autoridad en ese ambito, pero a la vez es consciente de que aquello se va a quedar sin describir al no ser que se pruebe algo diferente. El día que haya equipo para hacer una descripción "seria" del contenido del archivo habría que ver donde es necesario hacerla y donde no.
Me parece muy interesante el artículo de Maria Pinto, en concreto el apartado tesauro y el subapartado el proceso de indización del documento.y dentro de el mismo indización automática. Habla de las nuevas cuestiones que se están dando en este ámbito.
Suscribirse a:
Entradas (Atom)