Taller Libre I (11421) - Curso 2010

Introducción a la Recuperación de Información

En este taller se presentan los fundamentos teóricos y las aplicaciones relacionadas con la construcción de sistemas de información basados en documentos de texto y técnicas del área de Recuperación de Información. A partir del análisis de las características estadísticas del texto escrito se plantean estrategias y técnicas de representación y almacenamiento de tales objetos, los modelos de recuperación más importantes en la actualidad y métodos de procesamiento. De forma complementaria se plantea la evolución de la disciplina en ambientes distribuidos y la web.

Horarios

Jueves de 14 a 20hs
Consultas por Chat (GTalk) o mail: Todo el tiempo

Cronograma de Clases

Semana 1 (16/08) Introducción y Problemática Taller Programación RI Trabajo Práctico 1
Semana 2 (23/08) Modelos clásicos de RI
Taller Programación RI
Semana 3 (30/08) Modelos de Lenguaje
Taller Programación RI Trabajo Práctico 2
Semana 4 (06/09) Análisis de Textos
Práctica Lemur Toolkit
Trabajo Práctico 3
Semana 5 (13/09) Sin clases (Exámenes adicionales)
Semana 6 (20/09) Estructuras de Datos para RI
Programación

Semana 7 (27/09) Indexación y Recuperación
Programación Trabajo Práctico 4
Semana 8 (04/10) Evaluación de la Recuperación
Trec-Eval

Semana 9 (11/10) Presentación de papers
Práctica laboratorio Trabajo Práctico 5
Semana 10 (18/10) Retroalimentación de la Consulta
Práctica laboratorio
Semana 11 (25/10) Introducción a clasificación y clustering Demos: BOW y Cluto Presentación Proyecto Final
Trabajo Práctico 6
Semana 12 (01/11) Recuperación de Información en la Web Crawling
Semana 13 (08/11) Motores de Búsqueda
Análisis de Enlaces Trabajo Práctico 7
Semana 14 (15/11) Exámen parcial
Proyecto

Semana 15 (22/11) Recuperación de Información Distribuida
Proyecto
Semana 16 (29/11) Presentación de proyecto final y Recuperatorio



Bibliografía

Básica

Modern Information Retrieval. R. Baeza-Yates, B. Ribeiro-Neto. Addison-Wesley, 1999.
(Sitio)

Introduction to Information Retrieval. C. Manning, P. Raghavan, H. Schutze. Cambridge University Press. 2008.
(Versión previa digital)

Information Retrieval. Algorithms and Heuristics. D. A. Grossman, O. Frieder. Kluwer, 1998.

Material provisto por el equipo docente. Libro: “Introducción a la Recuperación de Información. Conceptos, modelos y algoritmos básicos”. Gabriel H. Tolosa y Fernando R.A. Bordignon. Laboratorio de Redes de Datos. Universidad Nacional de Luján. (Descargar)
Creative Commons License

Search Engines: Information Retrieval in Practice. W. B. Croft. D. Meltzer. T. Strohman. Addison-Wesley, 2009. NUEVO

Complementaria

Van Rijsbergen, C. J. Information Retrieval. Butterworth. 1979.

Recurso disponible en linea: http://www.dcs.gla.ac.uk/Keith/Preface.html

Managing Gigabytes: Compressing and Indexing Documents and Images. 2ª Edition. I.H. Witten, A. Moffat, T.C. Bell. Edit. Morgan Kaufmann, 1999.

Information Retrieval Interaction. Peter Ingwersen. London: Taylor Graham, 1992.

Recurso disponible en linea: http://www.db.dk/pi/iri/

Information Retrieval. Data Structures & Algorithms. W. B. Frakes, R. Baeza-Yates. Edit. Prentice-Hall, 1992.

Advances in Information Retrieval. 27th European Conference on IR Research, ECIR 2005, Santiago de Compostela, Spain, March 21-23, 2005, Proceedings.

Mining the Web. Discovering Knowledge from Hypertext Data. Soumen Chakrabarti. Morgan-Kaufmann Publishers. 2003.

Evaluación

Existirá una evaluación parcial y un proyecto final de curso. Se deben resolver y entregar en tiempo y forma todas las actividades propuestas por el equipo docente, ya sean teóricas o de laboratorio. Además, se debe participar en una actividad de preparación y exposición de un tema grupal durante la cursada.