Projektgruppe
Learning Agents in Dynamic Environments
Wintersemester 2010 / 2011 und Sommersemester 2011
Allgemeines
Ansprechpartner: Markus Eberling
Betreuung: Michael Baumann, Markus Eberling und Thomas Kemmerich
Begleitende Vorlesung: Verteiltes Problemlösen
Zielgruppe: Studierende des Masterstudiengangs Informatik
Vorraussetzungen: Es gelten die normalen Voraussetzungen wie sie in der Prüfungsordnung
stehen.
Scheinerwerb: - Regelmäßige Teilnahme an der Lehrveranstaltung
- Aktive Beteiligung mit eigenen Beiträgen an den Übungen
- Aktive Beteiligung mit eigenen Beiträgen im Seminar
- Schriftliche Seminarausarbeitung
- Aktive Mitentwicklung von Konzepten und Prototypen im Rahmen der
Projektgruppenthematik
Prüfungsordnung: Bitte beachtet auch die Informationen in den Studienordnungen.
Aktuelles
- Abgabe der finalen Seminarausarbeitung am 21.12.2010 um 23:59h
Inhalt
Motivation

[Bilder: NASA / JPL]
Rohstoffe werden auf der Erde immer knapper. In ferner Zukunft kann unser Energiebedarf vielleicht nur noch durch extraterrestrische Rohstoffe abgedeckt werden, die möglicherweise lediglich auf lebensfeindlichen Planeten vorkommen. Da Menschen in solchen Umgebungen nicht leben und arbeiten können, sollen die Ressourcen durch Roboter abgebaut und zur Erde transportiert werden. Der Erfolg einer solchen Mission hängt von unterschiedlichen Parametern ab. Auf Grund der hohen Robustheit von Multi-Roboter Systemen bietet es sich an, statt weniger, komplexer Roboter eine große Anzahl einfacher und spezialisierter Roboter zu verwenden. Diese können außerdem dank Massenproduktion kostengünstig hergestellt werden. Geht man davon aus, dass eine direkte Steuerung der Roboter von der Erde aus nicht möglich wäre, so müssen die einzelnen Roboter autonom Entscheidungen treffen und dementsprechend handeln. Durch die Spezialisierung der Roboter auf einzelne Teilaufgaben müssen die Roboter des Weiteren kooperieren, um die Gesamtaufgabe effizient lösen zu können.
Die Aufgabe

Um die in der Motivation betrachtete Anwendung zu untersuchen, sollen
die Roboter durch ein Multiagentensystem simuliert werdem. Hierzu
betrachten wir folgendes Szenario:
- In einer 2D-Gitterwelt gibt es zwei Typen von Agenten: Explorer
und Arbeiter.
- In dieser Gitterwelt gibt es Ressourcen-Felder, die unterschiedliche Größen und Positionen haben können.
- Arbeiten können die Felder abernten, wenn alle Zellen der
Felder durch einen Arbeiter besetzt sind.
- Geerntere Ressourcen müssen zu einer Fabrik (feste Position)
gebracht werden.
- Explorer erkunden die Gitterwelt und können externe
Speichermedien in den Zellen der Gitterwelt ablegen.
- Die Speichermedien sind passive, einfache Datencontainer, die nur
durch die Explorer beschrieben werden können.
- Arbeiter können die Speichermedien wahrnehmen, Informationen
auslesen, aber selbst keine Informationen auf ihnen hinterlassen.
- Agenten haben nur eine lokale Wahrnehmung und können nur innerhalb
eines bestimmten Radius mit anderen Agenten kommunizieren.
- Agenten haben nur begrenzten internen Speicher.
- Ressourcen Felder haben nur eine begrenzte Lebensdauer: wenn sie nicht innerhalb eines bestimmten Zeitfensters abgeerntet werden, verschwinden sie wieder.
Im Rahmen der Projektgruppe sollen die Agenten
lernen, das
betrachtete Problem möchstlichst effizient zu lösen.
Dazu muss zunächst eine Simulationsumgebung entworfen und
implementiert werden. Anschließend sollen Algorithmen und Lernverfahren
entwickelt
werden, welche Aspekte wie Koordination oder die strategische
Positionierung der Speichermedien abdecken. Dabei müssen verschiedene
Fragestellung beantwortet werden, wie zum Beispiel der Umgang mit
widersprüchlichen Informationen aus unterschiedlichen
Speichermedien oder wie kooperatives Verhalten erlernt werden kann.
Seminar
Themenübersicht:
In folgendem Dokument ist eine Übersicht der Seminarthemen zu finden. Dort könnt ihr Einstiegsliteratur sehen und eine kurze Beschreibung der Aufgabenstellung. Die genauen Inhalte der Seminararbeit sind mit dem jeweiligen Betreuer abzustimmen. Beim Treffen am 14.10.2010 werden die Seminarthemen dann nochmal kurz vorgestellt und anschließend verteilt.
Zur Erstellung der Seminararbeiten haben wir euch ein Latex-Template vorbereitet. Dieses findet ihr hier.
Wichtige Termine:
- Themenvergabe am 14.10.2010
- Abgabe der Gliederung und Literaturliste am 04.11.2010, 23:59h
- Abgabe der Seminararbeit (10-12 Seiten) am 30.11.2010, 23:59h
- Abgabe Peer-Reviews am 05.12.2010, 23:59h
- Abgabe der überarbeiteten Seminararbeit (camera-ready) am 09.12.2010, 23:59h
- Vortrag (30 Min.) und Diskussion (15 Min.) im Rahmen des Blockseminars am 13.-14.12.2010
- Finale Seminararbeit abzugeben am 21.12.2010, 23:59h
Seminarband der Projektgruppe
Hier erhalten Sie den kompletten Seminarband der Projektgruppe:
[PDF]Einzelne Seminarausarbeitungen
| Autor |
Titel |
|
| Dennis Bokermann |
Exploration unbekannter Umgebungen |
[PDF] |
| Waldemar Wittmann |
Pattern Formation |
[PDF] |
| Daniel Schencke |
Verhandlungsstrategien von optimalen Ressourcenverteilungen in Multiagentensystemen |
[PDF] |
| Thim Frederik Strothmann |
Kooperative Spieltheorie |
[PDF] |
| Felix Specht |
Kooperativer Transport |
[PDF] |
| Andreas Keil |
Raumabdeckung durch Multiagenten Systeme |
[PDF] |
| Ran Zhou |
Eine Modulare Lösung zur Kombinatorischen Explosion in MARL |
[PDF] |
| Sebastian Rittner |
Multi Agent Reinforcement Learning |
[PDF] |
| Tobias Wybranietz |
Evolutionäre Algorithmen und kooperative Koevolution |
[PDF] |
| Thomas Hauck |
Lernen durch Imitation |
[PDF] |
| Timo Klerx |
Wissen in Multiagentensystemen |
[PDF] |
| Benjamin Bulk |
Simulation und Analyse |
[PDF] |
Vortragsfolien
- Vortragsfolien von der Projektgruppenvorstellung: [PDF]
- Vortragsfolien vom ersten Meeting (14.10.2010): [PDF]
- Folien zur Vorlesung "Neuronale Netze" (19.10.2010): [PDF]
- Folien zur Vorlesung "Evolutionary Computing" (26.10.2010): [PDF]
- Folien zur Vorlesung "Reinforcement Learning" (02.11.2010): [PDF]
- Folien zur Vorlesung "Heuristische Suchverfahren" (09.11.2010): [PDF]
Literatur
-
St. J. Russel, P. Norvig:
Artificial Intelligence: A Modern Approach,
Prentice Hall, 1995
-
N. J. Nilsson:
Principles of Artificial Intelligence,
Springer, 1982
-
M. Wooldridge:
An Introduction to MultiAgent Systems (2nd Edition),
Wiley, 2009
-
Y. Shoham, K. Leyton-Brown:
Multiagent Systems - Algorithmic, Game-Theoretic, and Logical Foundations,
Cambridge University Press, 2009 [Online]