Projektgruppe

Learning Agents in Dynamic Environments

Wintersemester 2010 / 2011 und Sommersemester 2011

Allgemeines

Ansprechpartner: Markus Eberling

Betreuung: Michael Baumann, Markus Eberling und Thomas Kemmerich

Begleitende Vorlesung: Verteiltes Problemlösen

Zielgruppe: Studierende des Masterstudiengangs Informatik

Vorraussetzungen: Es gelten die normalen Voraussetzungen wie sie in der Prüfungsordnung stehen.

Scheinerwerb:

  • Regelmäßige Teilnahme an der Lehrveranstaltung
  • Aktive Beteiligung mit eigenen Beiträgen an den Übungen
  • Aktive Beteiligung mit eigenen Beiträgen im Seminar
  • Schriftliche Seminarausarbeitung
  • Aktive Mitentwicklung von Konzepten und Prototypen im Rahmen der Projektgruppenthematik

Prüfungsordnung: Bitte beachtet auch die Informationen in den Studienordnungen.

Aktuelles

  • Abgabe der finalen Seminarausarbeitung am 21.12.2010 um 23:59h

Inhalt

Motivation


[Bilder: NASA / JPL]

Rohstoffe werden auf der Erde immer knapper. In ferner Zukunft kann unser Energiebedarf vielleicht nur noch durch extraterrestrische Rohstoffe abgedeckt werden, die möglicherweise lediglich auf lebensfeindlichen Planeten vorkommen. Da Menschen in solchen Umgebungen nicht leben und arbeiten können, sollen die Ressourcen durch Roboter abgebaut und zur Erde transportiert werden. Der Erfolg einer solchen Mission hängt von unterschiedlichen Parametern ab. Auf Grund der hohen Robustheit von Multi-Roboter Systemen bietet es sich an, statt weniger, komplexer Roboter eine große Anzahl einfacher und spezialisierter Roboter zu verwenden. Diese können außerdem dank Massenproduktion kostengünstig hergestellt werden. Geht man davon aus, dass eine direkte Steuerung der Roboter von der Erde aus nicht möglich wäre, so müssen die einzelnen Roboter autonom Entscheidungen treffen und dementsprechend handeln. Durch die Spezialisierung der Roboter auf einzelne Teilaufgaben müssen die Roboter des Weiteren kooperieren, um die Gesamtaufgabe effizient lösen zu können.

Die Aufgabe


Um die in der Motivation betrachtete Anwendung zu untersuchen, sollen die Roboter durch ein Multiagentensystem simuliert werdem. Hierzu betrachten wir folgendes Szenario:

  • In einer 2D-Gitterwelt gibt es zwei Typen von Agenten: Explorer und Arbeiter.
  • In dieser Gitterwelt gibt es Ressourcen-Felder, die unterschiedliche Größen und Positionen haben können.
  • Arbeiten können die Felder abernten, wenn alle Zellen der Felder durch einen Arbeiter besetzt sind.
  • Geerntere Ressourcen müssen zu einer Fabrik (feste Position) gebracht werden.
  • Explorer erkunden die Gitterwelt und können externe Speichermedien in den Zellen der Gitterwelt ablegen.
  • Die Speichermedien sind passive, einfache Datencontainer, die nur durch die Explorer beschrieben werden können.
  • Arbeiter können die Speichermedien wahrnehmen, Informationen auslesen, aber selbst keine Informationen auf ihnen hinterlassen.
  • Agenten haben nur eine lokale Wahrnehmung und können nur innerhalb eines bestimmten Radius mit anderen Agenten kommunizieren.
  • Agenten haben nur begrenzten internen Speicher.
  • Ressourcen Felder haben nur eine begrenzte Lebensdauer: wenn sie nicht innerhalb eines bestimmten Zeitfensters abgeerntet werden, verschwinden sie wieder.
Im Rahmen der Projektgruppe sollen die Agenten lernen, das betrachtete Problem möchstlichst effizient zu lösen. Dazu muss zunächst eine Simulationsumgebung entworfen und implementiert werden. Anschließend sollen Algorithmen und Lernverfahren entwickelt werden, welche Aspekte wie Koordination oder die strategische Positionierung der Speichermedien abdecken. Dabei müssen verschiedene Fragestellung beantwortet werden, wie zum Beispiel der Umgang mit widersprüchlichen Informationen aus unterschiedlichen Speichermedien oder wie kooperatives Verhalten erlernt werden kann.

Seminar

Themenübersicht:

In folgendem Dokument ist eine Übersicht der Seminarthemen zu finden. Dort könnt ihr Einstiegsliteratur sehen und eine kurze Beschreibung der Aufgabenstellung. Die genauen Inhalte der Seminararbeit sind mit dem jeweiligen Betreuer abzustimmen. Beim Treffen am 14.10.2010 werden die Seminarthemen dann nochmal kurz vorgestellt und anschließend verteilt.


Zur Erstellung der Seminararbeiten haben wir euch ein Latex-Template vorbereitet. Dieses findet ihr hier.

Wichtige Termine:

  • Themenvergabe am 14.10.2010
  • Abgabe der Gliederung und Literaturliste am 04.11.2010, 23:59h
  • Abgabe der Seminararbeit (10-12 Seiten) am 30.11.2010, 23:59h
  • Abgabe Peer-Reviews am 05.12.2010, 23:59h
  • Abgabe der überarbeiteten Seminararbeit (camera-ready) am 09.12.2010, 23:59h
  • Vortrag (30 Min.) und Diskussion (15 Min.) im Rahmen des Blockseminars am 13.-14.12.2010
  • Finale Seminararbeit abzugeben am 21.12.2010, 23:59h

Seminarband der Projektgruppe

Hier erhalten Sie den kompletten Seminarband der Projektgruppe: [PDF]

Einzelne Seminarausarbeitungen

Autor Titel  
Dennis Bokermann Exploration unbekannter Umgebungen [PDF]
Waldemar Wittmann Pattern Formation [PDF]
Daniel Schencke Verhandlungsstrategien von optimalen Ressourcenverteilungen in Multiagentensystemen [PDF]
Thim Frederik Strothmann Kooperative Spieltheorie [PDF]
Felix Specht Kooperativer Transport [PDF]
Andreas Keil Raumabdeckung durch Multiagenten Systeme [PDF]
Ran Zhou Eine Modulare Lösung zur Kombinatorischen Explosion in MARL [PDF]
Sebastian Rittner Multi Agent Reinforcement Learning [PDF]
Tobias Wybranietz Evolutionäre Algorithmen und kooperative Koevolution [PDF]
Thomas Hauck Lernen durch Imitation [PDF]
Timo Klerx Wissen in Multiagentensystemen [PDF]
Benjamin Bulk Simulation und Analyse [PDF]

Vortragsfolien

  • Vortragsfolien von der Projektgruppenvorstellung: [PDF]
  • Vortragsfolien vom ersten Meeting (14.10.2010): [PDF]
  • Folien zur Vorlesung "Neuronale Netze" (19.10.2010): [PDF]
  • Folien zur Vorlesung "Evolutionary Computing" (26.10.2010): [PDF]
  • Folien zur Vorlesung "Reinforcement Learning" (02.11.2010): [PDF]
  • Folien zur Vorlesung "Heuristische Suchverfahren" (09.11.2010): [PDF]

Literatur

  • St. J. Russel, P. Norvig: Artificial Intelligence: A Modern Approach, Prentice Hall, 1995
  • N. J. Nilsson: Principles of Artificial Intelligence, Springer, 1982
  • M. Wooldridge: An Introduction to MultiAgent Systems (2nd Edition), Wiley, 2009
  • Y. Shoham, K. Leyton-Brown: Multiagent Systems - Algorithmic, Game-Theoretic, and Logical Foundations, Cambridge University Press, 2009 [Online]

Impressum | Webmaster | Letzte Änderungen am : 11.10.2011