Taller Libre I (11421) - Curso 2010
Introducción a la Recuperación de Información
En este taller se presentan los fundamentos teóricos y las aplicaciones relacionadas con la construcción de sistemas de información basados en documentos de texto y técnicas del área de Recuperación de Información. A partir del análisis de las características estadísticas del texto escrito se plantean estrategias y técnicas de representación y almacenamiento de tales objetos, los modelos de recuperación más importantes en la actualidad y métodos de procesamiento. De forma complementaria se plantea la evolución de la disciplina en ambientes distribuidos y la web.
Horarios
Jueves de 14 a 20hs
Consultas por Chat (GTalk) o mail: Todo el tiempo
Cronograma de Clases
| Semana 1 (16/08) | Introducción y Problemática | Taller Programación RI | Trabajo Práctico 1 |
| Semana 2 (23/08) | Modelos clásicos de RI |
Taller Programación RI | |
| Semana 3 (30/08) | Modelos de Lenguaje |
Taller Programación RI | Trabajo Práctico 2 |
| Semana 4 (06/09) | Análisis de Textos |
Práctica Lemur Toolkit |
Trabajo Práctico 3 |
| Semana 5 (13/09) | Sin clases (Exámenes adicionales) |
||
| Semana 6 (20/09) | Estructuras de Datos para RI |
Programación |
|
| Semana 7 (27/09) | Indexación y Recuperación |
Programación | Trabajo Práctico 4 |
| Semana 8 (04/10) | Evaluación de la Recuperación |
Trec-Eval |
|
| Semana 9 (11/10) | Presentación de papers |
Práctica laboratorio | Trabajo Práctico 5 |
| Semana 10 (18/10) | Retroalimentación de la Consulta |
Práctica laboratorio | |
| Semana 11 (25/10) | Introducción a clasificación y clustering | Demos: BOW y Cluto | Presentación Proyecto Final Trabajo Práctico 6 |
| Semana 12 (01/11) | Recuperación de Información en la Web | Crawling | |
| Semana 13 (08/11) | Motores de Búsqueda |
Análisis de Enlaces | Trabajo Práctico 7 |
| Semana 14 (15/11) | Exámen parcial |
Proyecto |
|
| Semana 15 (22/11) | Recuperación de Información Distribuida |
Proyecto | |
| Semana 16 (29/11) | Presentación de proyecto final y Recuperatorio | ||
Bibliografía
Básica
Modern Information Retrieval. R. Baeza-Yates, B. Ribeiro-Neto.
Addison-Wesley, 1999.
(Sitio)
Introduction to Information Retrieval. C. Manning, P. Raghavan, H.
Schutze. Cambridge University Press. 2008.
(Versión
previa digital)
Information Retrieval. Algorithms and Heuristics. D. A. Grossman, O. Frieder. Kluwer, 1998.
Material provisto por el equipo docente. Libro:
“Introducción a la Recuperación de Información.
Conceptos, modelos y algoritmos básicos”. Gabriel H. Tolosa y
Fernando R.A. Bordignon. Laboratorio de Redes de Datos. Universidad
Nacional de Luján. (Descargar)
Search Engines: Information Retrieval in Practice. W. B. Croft. D. Meltzer. T. Strohman. Addison-Wesley, 2009. NUEVO
Complementaria
Van Rijsbergen, C. J. Information Retrieval. Butterworth. 1979.
Recurso disponible en linea: http://www.dcs.gla.ac.uk/Keith/Preface.html
Managing Gigabytes: Compressing and Indexing Documents and Images. 2ª Edition. I.H. Witten, A. Moffat, T.C. Bell. Edit. Morgan Kaufmann, 1999.
Information Retrieval Interaction. Peter Ingwersen. London: Taylor Graham, 1992.
Recurso disponible en linea: http://www.db.dk/pi/iri/
Information Retrieval. Data Structures & Algorithms. W. B. Frakes, R. Baeza-Yates. Edit. Prentice-Hall, 1992.
Advances in Information Retrieval. 27th European Conference on IR Research, ECIR 2005, Santiago de Compostela, Spain, March 21-23, 2005, Proceedings.
Mining the Web. Discovering Knowledge from Hypertext Data. Soumen Chakrabarti. Morgan-Kaufmann Publishers. 2003.
Evaluación
Existirá una evaluación parcial y un proyecto final de curso. Se deben resolver y entregar en tiempo y forma todas las actividades propuestas por el equipo docente, ya sean teóricas o de laboratorio. Además, se debe participar en una actividad de preparación y exposición de un tema grupal durante la cursada.