Taller Libre I (11421) - Curso 2011

Introducción a la Recuperación de Información

En este taller se presentan los fundamentos teóricos y las aplicaciones relacionadas con la construcción de sistemas de información basados en documentos de texto y técnicas del área de Recuperación de Información. A partir del análisis de las características estadísticas del texto escrito se plantean estrategias y técnicas de representación y almacenamiento de tales objetos, los modelos de recuperación más importantes en la actualidad y métodos de procesamiento. De forma complementaria se plantea la evolución de la disciplina en ambientes distribuidos y la web.

Horarios

Jueves de 16 a 22hs
Consultas por Chat (GTalk) o mail: Todo el tiempo

Cronograma de Clases

Semana 1 (18/08) Introducción y problemática de la RI Taller de Programación para RI Trabajo Práctico #1
Semana 2 (25/08) Análisis de Textos
Taller de Programación para RI
Semana 3 (01/09) Modelos Clásicos de RI
Taller de Programación para RI Trabajo Práctico #2
Semana 4 (08/09) Modelos de Lenguaje
Lemur Toolkit Trabajo Práctico #3
Colección
Semana 5 (15/09) Estructuras de Datos para RI Programación

Semana 6 (22/09) Indexación y Recuperación
Programación

Semana 7 (29/09) Exámenes Adicionales (no hay clases)
Semana 8 (06/10) Evaluación de la Recuperación Trec-Eval
Trabajo Práctico #4
Presentación de Artículos (papers)
Artículos
Semana 9 (13/10) Retroalimentación de la Consulta Práctica laboratorio Trabajo Práctico #5 Queries ejercicio #2
Semana 10 (20/10) Introducción a clasificación y clustering Demos: BOW y Cluto
Semana 11 (27/10) Presentación de papers Práctica laboratorio
Semana 12 (03/11) Recuperación de Información en la Web Crawling Trabajo Práctico #6 Enunciado Trabajo Final
Semana 13 (10/11) Máquinas de Búsqueda para la Web
Análisis de Enlaces
Semana 14 (17/11) Exámen parcial
Semana 15 (24/11) Recuperación de Información Distribuida
Proyecto
Semana 16 (01/12) Presentación de proyecto final y Recuperatorio


Bibliografía

Sugerida (principal)

- Modern Information Retrieval. R. Baeza-Yates, B. Ribeiro-Neto. Addison-Wesley, 1999.
(Sitio)

- Introduction to Information Retrieval. C. Manning, P. Raghavan, H. Schutze. Cambridge University Press. 2009.
(Versión previa digital)

- Search Engines: Information Retrieval in Practice. B. Croft, D. Metzler, T. Strohman. Addison Wesley; 1 edition. 2009.

- Information Retrieval. Algorithms and Heuristics. D. A. Grossman, O. Frieder. Kluwer, 1998.

- Material provisto por el equipo docente. Libro: “Introducción a la Recuperación de Información. Conceptos, modelos y algoritmos básicos”. Gabriel H. Tolosa y Fernando R.A. Bordignon. Laboratorio de Redes de Datos. Universidad Nacional de Luján. (Descargar)
Creative Commons License

Complementaria

- Information Retrieval. C.J. Van Rijsbergen. Butterworth. 1979. Recurso disponible en linea: http://www.dcs.gla.ac.uk/Keith/Preface.html

- Managing Gigabytes: Compressing and Indexing Documents and Images. 2ª Edition. I.H. Witten, A. Moffat, T.C. Bell. Edit. Morgan Kaufmann, 1999.

- Information Retrieval Interaction. Peter Ingwersen. London: Taylor Graham, 1992. Recurso disponible en linea: http://www.db.dk/pi/iri/

- Information Retrieval. Data Structures & Algorithms. W. B. Frakes, R. Baeza-Yates. Edit. Prentice-Hall, 1992.

- Advances in Information Retrieval. 27th European Conference on IR Research, ECIR 2005, Santiago de Compostela, Spain, March 21-23, 2005, Proceedings.

- Mining the Web. Discovering Knowledge from Hypertext Data. Soumen Chakrabarti. Morgan-Kaufmann Publishers. 2003.

Evaluación

Existirá una evaluación parcial y un proyecto final de curso. Se deben resolver y entregar en tiempo y forma todas las actividades propuestas por el equipo docente, ya sean teóricas o de laboratorio. Además, se debe participar en una actividad de preparación y exposición de un tema grupal (paper) durante la cursada.