|
Modulbezeichnung (engl.):
Information Retrieval |
|
Code: KIB-IRET |
2V+2PA (4 Semesterwochenstunden) |
5 |
Studiensemester: 5 |
Pflichtfach: nein |
Arbeitssprache:
Englisch |
Prüfungsart:
Klausur, Dauer 90 min. /Projektarbeit
[letzte Änderung 29.07.2024]
|
DFIW-IRET (P610-0540) Informatik und Web-Engineering, Bachelor, ASPO 01.10.2019
, 3. Semester, Pflichtfach, informatikspezifisch
KI584 (P610-0253) Kommunikationsinformatik, Bachelor, ASPO 01.10.2014
, 5. Semester, Wahlpflichtfach, informatikspezifisch
KIB-IRET Kommunikationsinformatik, Bachelor, ASPO 01.10.2021
, 5. Semester, Wahlpflichtfach, technisch
KIB-IRET Kommunikationsinformatik, Bachelor, ASPO 01.10.2022
, 5. Semester, Wahlpflichtfach, technisch
PIBWI29 Praktische Informatik, Bachelor, ASPO 01.10.2011
, 5. Semester, Wahlpflichtfach, informatikspezifisch
PIB-IRET (P221-0080) Praktische Informatik, Bachelor, ASPO 01.10.2022
, 5. Semester, Wahlpflichtfach, informatikspezifisch
geeignet für Austauschstudenten mit learning agreement
|
Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 5 Creditpoints 150 Stunden (30 Std/ECTS). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 105 Stunden zur Verfügung.
|
Empfohlene Voraussetzungen (Module):
Keine.
|
Als Vorkenntnis empfohlen für Module:
|
Modulverantwortung:
Prof. Dr. Klaus Berberich |
Dozent/innen: Prof. Dr. Klaus Berberich
[letzte Änderung 10.11.2016]
|
Lernziele:
Students know about basic methods from Information Retrieval. This includes retrieval models (e.g., Vector Space Model and Binary Independence Model), link analysis (e.g., PageRank), and effectiveness measures (e.g., Precision/Recall and MAP). They can apply/implement those methods in practice. In addition, students are aware of readily available information retrieval systems (e.g., Apache Lucene/Solr). [OE+0+0+0+0+0+0=0]
[letzte Änderung 04.07.2024]
|
Inhalt:
Information Retrieval is pervasive and its applications range from finding contacts or e-mails on your smartphone to web-search engines that index billions of web pages. This course covers the most important methods from Information Retrieval. We will look into how these methods are defined formally, including the mathematics behind them, but also see how they can be implemented efficiently in practice. As part of the project work, we will implement a small search engine from scratch. 1. Introduction - History - Applications - Overview of the Course 2. Natural Language - Documents and Terms - Stopwords and Stemming/Lemmatization - Synonyms, Polysems, Compounds 3. Retrieval Models - Boolean Retrieval - Vector Space Model with TF.IDF Term Weighting - Language Models 4. Indexing Methods - Inverted Index - Compression (d-Gaps, Variable-Byte Encoding) - Index Pruning 5. Query Processing - Holistic Methods (DAAT, TAAT) - Top-k Methods (NRA, WAND) 6. Evaluation - Cranfield Paradigm - Benchmark Initiatives (TREC, CLEF, NTCIR) - Traditional Effectiveness Measures (Precision, Recall, MAP) - Non-Traditional Effectiveness Measures (nDCG, ERR) 7. Web Retrieval - Crawling - Near-Duplicate Detection - Link Analysis (PageRank, HITS) - Web Spam 8. Information Retrieval Systems - Indri - Terrier - Anserini - Apache Lucene/Solr - ElasticSearch
[letzte Änderung 04.07.2024]
|
Literatur:
Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack: Information Retrieval: Implementing and Evaluating Search Engines, MIT Press, 2010. Reginald Ferber: Information Retrieval: Suchmodelle und Data-Mining Verfahren für Textsammlungen und das Web, dpunkt, 2003. (online verfügbar unter: http://information-retrieval.de/irb/ir.html) W. Bruce Croft, T. Strohman, D. Metzler: Search Engines Information Retrieval in Practice: Information Retrieval in Practice, Pearson, 2009 (online verfügbar unter: https://ciir.cs.umass.edu/irbook/) Christopher D. Manning, Prabhakar Ragahavan, and Hinrich Schütze: Introduction to Information Retrieval, Cambridge University Press, 2008. (online verfügbar unter: http://nlp.stanford.edu/IR-book/)
[letzte Änderung 04.07.2024]
|
Modul angeboten in Semester:
WS 2022/23,
WS 2021/22,
WS 2020/21,
WS 2019/20
|