Taller Libre I (11421) - Curso 2011
Introducción a la Recuperación de Información
En este taller se presentan los fundamentos teóricos y las aplicaciones relacionadas con la construcción de sistemas de información basados en documentos de texto y técnicas del área de Recuperación de Información. A partir del análisis de las características estadísticas del texto escrito se plantean estrategias y técnicas de representación y almacenamiento de tales objetos, los modelos de recuperación más importantes en la actualidad y métodos de procesamiento. De forma complementaria se plantea la evolución de la disciplina en ambientes distribuidos y la web.
Horarios
Jueves de 16 a 22hs
Consultas por Chat (GTalk) o mail: Todo el tiempo
Cronograma de Clases
| Semana 1 (18/08) | Introducción y problemática de la RI | Taller de Programación para RI | Trabajo Práctico #1 |
| Semana 2 (25/08) | Análisis de Textos |
Taller de Programación para RI | |
| Semana 3 (01/09) | Modelos Clásicos de RI |
Taller de Programación para RI | Trabajo Práctico #2 |
| Semana 4 (08/09) | Modelos de Lenguaje |
Lemur Toolkit | Trabajo Práctico #3
Colección |
| Semana 5 (15/09) | Estructuras de Datos para RI | Programación |
|
| Semana 6 (22/09) | Indexación y Recuperación |
Programación |
|
| Semana 7 (29/09) | Exámenes Adicionales (no hay clases) | ||
| Semana 8 (06/10) | Evaluación de la Recuperación | Trec-Eval |
Trabajo Práctico #4
Presentación de Artículos (papers) Artículos |
| Semana 9 (13/10) | Retroalimentación de la Consulta | Práctica laboratorio | Trabajo Práctico #5 Queries ejercicio #2 |
| Semana 10 (20/10) | Introducción a clasificación y clustering | Demos: BOW y Cluto | |
| Semana 11 (27/10) | Presentación de papers | Práctica laboratorio | |
| Semana 12 (03/11) | Recuperación de Información en la Web | Crawling | Trabajo Práctico #6 Enunciado Trabajo Final |
| Semana 13 (10/11) | Máquinas de Búsqueda para la Web |
Análisis de Enlaces | |
| Semana 14 (17/11) | Exámen parcial |
||
| Semana 15 (24/11) | Recuperación de Información Distribuida |
Proyecto | |
| Semana 16 (01/12) | Presentación de proyecto final y Recuperatorio |
||
Bibliografía
Sugerida (principal)
- Modern Information Retrieval. R. Baeza-Yates, B. Ribeiro-Neto.
Addison-Wesley, 1999.
(Sitio)
- Introduction to Information Retrieval. C. Manning, P. Raghavan, H.
Schutze. Cambridge University Press. 2009.
(Versión
previa digital)
- Search Engines: Information Retrieval in Practice. B. Croft, D. Metzler, T. Strohman. Addison Wesley; 1 edition. 2009.
- Information Retrieval. Algorithms and Heuristics. D. A. Grossman, O. Frieder. Kluwer, 1998.
- Material provisto por el equipo docente. Libro:
“Introducción a la Recuperación de Información.
Conceptos, modelos y algoritmos básicos”. Gabriel H. Tolosa y
Fernando R.A. Bordignon. Laboratorio de Redes de Datos. Universidad
Nacional de Luján. (Descargar)
Complementaria
- Information Retrieval. C.J. Van Rijsbergen. Butterworth. 1979. Recurso disponible en linea: http://www.dcs.gla.ac.uk/Keith/Preface.html
- Managing Gigabytes: Compressing and Indexing Documents and Images. 2ª Edition. I.H. Witten, A. Moffat, T.C. Bell. Edit. Morgan Kaufmann, 1999.
- Information Retrieval Interaction. Peter Ingwersen. London: Taylor Graham, 1992. Recurso disponible en linea: http://www.db.dk/pi/iri/
- Information Retrieval. Data Structures & Algorithms. W. B. Frakes, R. Baeza-Yates. Edit. Prentice-Hall, 1992.
- Advances in Information Retrieval. 27th European Conference on IR Research, ECIR 2005, Santiago de Compostela, Spain, March 21-23, 2005, Proceedings.
- Mining the Web. Discovering Knowledge from Hypertext Data. Soumen Chakrabarti. Morgan-Kaufmann Publishers. 2003.
Evaluación
Existirá una evaluación parcial y un proyecto final de curso. Se deben resolver y entregar en tiempo y forma todas las actividades propuestas por el equipo docente, ya sean teóricas o de laboratorio. Además, se debe participar en una actividad de preparación y exposición de un tema grupal (paper) durante la cursada.