WP 2: Aufbau des Datenportals

Aus BiNHum
Wechseln zu: Navigation, Suche

Ziel des BiNHum-Portals ist die Bereitstellung von Funktionen in einem Webportal, um Biodiversitätsdaten in unterschiedlichster Weise abzufragen und zu kombinieren.

Das Portal soll folgende Mindestanforderungen erfüllen:

Suchfunktionen

  • (Einfeld)suche nach gebräuchlichen Namen
  • Suche nach alternativen, insbesondere auch gebräuchlichen Kategorien (z.B. Forstschädlinge, Wasservögel, invasive Arten, wandernde Arten etc.)
  • Erweiterte (Experten)suche:
    • Abfrage nach Dateneigenschaften (Typus, Multimedia Bild, Ton, Video sowie Annotationen)
  • Abfrage nach Relationen (Wirt für, Parasit von, Futterpflanze, bevorzugtes Habitat)

Sämtliche Suchanfragen werden für weitere Analysen gespeichert, es gibt ein Feedbackformular (War Ihre Suche erfolgreich? Wenn nein, erklären Sie kurz wonach Sie eigentlich suchten....)

Zur Umsetzung dieser Funktionen ist neben den notwendigen Programmierarbeiten insbesondere auch eine semantische Anreicherung der Datenbestände notwendig. Alternative Taxonomien umgangssprachlicher Einteilungen (z.B. Forstschädlinge) müssen mit den existierenden wissenschaftlichen Thesauri harmonisiert und sinnvoll abgebildet werden.

Status:

Der aktuelle Stand der Entwicklung kann jeweils unter http://www.binhum.net/ angesehen werden. Im oberen Teil der Seite ist eine Liste mich den wichtigsten Features zu sehen. Durch Anklicken der Links können die entsprechenden Features direkt getestet werden.

Zu beachten:

  • Es handelt sich hierbei um eine funktionelle Demonstration, nicht um eine Layout-Studie.
  • Die Seite ist in Bearbeitung, d.h. es kommen laufend neue Features hinzu. Während der Bearbeitung kann die Erreichbarkeit eingeschränkt sein.

Ausgabefunktionen

Die neuartigen Abfragemöglichkeiten sollten auch auf der Ausgabeseite abgebildet werden. Wichtig ist hierbei vor allem die Umsetzung einer Warenkorbstruktur, die ein „Harvesting“ größerer Datenbestände erlaubt (z.B. Bilder süddeutscher Schmetterlinge). Das BiNHum-Portal soll die Zusammenstellung und das Herunterladen von Multimedia- und 3D-Datensätzen für mehrere Arten/Artengruppen ermöglichen. Der heruntergeladene Datensatz kann dann unter unterschiedlichsten Gesichtspunkten vom Nutzer weiter bearbeitet werden. Dies ist insbesondere für Multimedia- und 3D Daten notwendig, da hier noch keine einheitlichen Standards existieren und somit derzeit noch keine kohärente Annotation und Abfrage möglich ist.

Die Annotation und Weiterverarbeitung ausgewählter, vom Nutzer zusammengestellter Datensätze erlaubt die off-line Bearbeitung nach unterschiedlichsten Gesichtspunkten. Sie dienen aber auch als mögliche Merkmale für die (semi)automatisierte Erkennung von Arten, die derzeit mit vielversprechende Algorithmen sowohl für akustische als auch visuelle Merkmale erprobt wird (Gaston & Neill 2004). In naher Zukunft werden hierzu sicher auch 3D-Daten verwendet.

Schließlich sind DNA -, Bild, Ton und 3D-Daten wesentlicher Bestandteil moderner Artbeschreibungen, die zur Zeit bestenfalls in Form von „supplementary material“ dokumentiert werden. Das BiNHum Portal soll daher die Möglichkeit bieten, ausgewählte Datensätze dauerhaft zu markieren und anderen Nutzern zur Weiteranalyse zur Verfügung zu stellen. Somit wird die Nutzerdefinition bestimmter Corpora (z.B. bayrische Heuschreckengesänge) möglich, auf die in Veröffentlichungen verwiesen werden kann, was die Sichtbarkeit der Daten erheblich steigert. Die hauseigenen Zeitschriften könnten bei Veröffentlichungen mit Multimediadaten, deren Ein- und Freigabe sowie die Definition des entsprechenden Corpus im BiNHumPortal zur Bedingung zu machen, wie dies bei molekularbiologischen Arbeiten bereits üblich ist.

Eine Warenkorb-Funktion ist bereits Bestandteil des DNA-Bank Netzwerkportals www.dnabank-network.org, welches den tatsächlichen Erwerb von DNA-Aliquots für die angebotenen Spezies erlaubt. Insgesamt könnte sich die Gestaltung des BiNHum-Portals insbesondere für Anwender durchaus an bekannte Such- und Einkaufsportale anlehnen. Diese bieten neben der gezielten Suchfunktion auch zahlreiche alternative Sortiervorschläge, die auch in einem Biodiversitätsportal sinnvoll eingesetzt werden könnten.

Voraussetzung für derartige innovative Funktionen ist jedoch eine semantische Anreicherung der Datenbestände, die teilweise automatisiert erfolgen kann (in enger Zusammenarbeit mit AP 3). In der einfachsten Form handelt es sich hierbei um die Integration von Tabellen, etwa von gebräuchlichen Namen, die an unterschiedlichen Institutionen bereits vorhanden sind und in das BiNHum-Datenbankschema integriert werden müssten. Insbesondere die Möglichkeit einer Bearbeitung von Multimedia-Daten erlaubt jedoch viel weitergehende Annotationen wie etwa die Trägerfrequenz oder die Anzahl von Harmonischen in einem Tierlaut. Derartige Annotationen können teilweise auch semiautomatisch erfolgen, wie z.B. die Berechnung von Volumina von 3D-Objekten. Nach Integration dieser Annotationen in den BiNHum-Datenbestand werden wiederum völlig neue Abfragemöglichkeiten eröffnet, die ein Navigieren in komplexen Multimedia-Datenbeständen überhaupt erst ermöglichen (etwa die Suche nach einem Tierlaut mit einer bestimmten Trägerfrequenz).

Insgesamt möchten wir hierdurch Standards setzen, die langfristig möglicherweise von GBIF übernommen werden könnten. Insbesondere wird das ABCD-Schema zur Umsetzung der skizzierten Funktionalitäten erweitert werden.