Corporate Smart Content - Berlin

Die InnoProfile-Initiative "Corporate Semantic Web“ (2007-2013) will ihr regionales Innovationsprofil mit dem folgenden Vorhaben stärken und weiterentwickeln:

Die InnoProfile-Transfer-Initiative

Semantische Technologien werden mit dem Ziel entwickelt, den in stetig wachsendem Maße verfügbaren Daten im World Wide Web und in Unternehmensnetzen Bedeutung zuzuschreiben. So können die Daten von Computern verstanden und verarbeitet werden, aus Daten werden Informationen und aus Informationen wird Wissen. Das “Semantic Web”, oft auch “Web 3.0” genannt, ist die nächste Generation des World Wide Web, nach dem “Web 2.0”.

Das Grundgerüst des Semantischen Webs bilden Metadaten, die in herkömmliche Webseiten eingebettet sind. Diese bleiben im Webbrowser unsichtbar, können aber beispielsweise von Suchmaschinen verstanden werden. Die Metadaten liefern zusätzliche Informationen zu Dingen oder Personen, die auf der Webseite genannt werden; zum Beispiel, dass der Begriff “die Bundeskanzlerin” in der derzeitigen Legislaturperiode eine Person Angela Merkel beschreibt. Neben den Metadaten im Web bilden Ontologien einen wichtigen Baustein des Semantischen Webs. In diesen werden “Bedeutungen” der Welt oder einer bestimmten Anwendungsdomäne formuliert, wie z.B. “ein Unternehmen besteht aus Mitarbeitern”, oder “Mitarbeiterin bedeutet dasselbe wie Beschäftigte”.
 
Mit Hilfe von Metadaten und entsprechenden Ontologien können Webdienste Daten aus verschiedenen Quellen besser miteinander verknüpfen und beim Endverbraucher entsprechenden Mehrwert erzeugen. Suchmaschinen werden von reinen Dokumentensuchmaschinen zu Frage-Antwort-Maschinen und können beispielsweise die Frage beantworten “Welche Digitalkamera für unter 500€ ist besonders gut für Nachtaufnahmen geeignet, und wo kann ich sie zurzeit zum günstigsten Preis erwerben?”.
 
Das Vorgängerprojekt der InnoProfile-Transfer-Initiative “Corporate Smart Content”, das InnoProfile-Projekt “Corporate Semantic Web”, forschte an spezifischen Fragestellungen beim Einsatz von semantischen Technologien speziell im Unternehmenskontext. Es wurde deutlich, dass der wirtschaftliche Erfolg wissensbasierter Systeme als produktives und wirtschaftliches System in Unternehmen stark von der Verfügbarkeit hochqualitativen Hintergrundwissens in Form von Metainformationen notwendig ist.
 
Als "Corporate Smart Content" im Unternehmen sind von Unternehmen produzierte Inhalte in Form von Text, multimedialen Inhalten wie Bildern und Videos oder Daten zu verstehen, die mit Hilfe semantischer Technologien bedarfsgerecht zur Verfügung gestellt werden und sich dem situativen Kontext anpassen, zum Beispiel einer Mitarbeiterin einer Firma in einem bestimmten Arbeitsschritt automatisch die richtigen Formulare oder Word-Dokumente vorlegen. Die Prozesskette umfasst dabei die Entwicklung und Verwendung geeigneter Ontologien, die Anreicherung der Unternehmensinhalte mit ontologischem Unternehmenswissen sowie die Gewinnung von weiterem Hintergrundwissen durch die Analyse der Nutzung von Unternehmensinhalten. Die Prozesskette soll sowohl Redakteure unterstützen, die Inhalte für Endanwender produzieren, als auch Mitarbeiter, die Inhalte im Rahmen ihrer täglichen Arbeit produzieren, die zur internen Verwendung vorgesehen sind.
 

Die Ziele

Ziel ist die konzentrierte und wirtschaftsorientierte Weiterführung der Forschung und Schaffung von Innovationen im Fachgebiet Corporate Semantic Web, welches durch die gleichnamige InnoProfile-Initiative etabliert wurde. Die Arbeit im Verbund wird sich fachlich auf die Unterstützung der Prozesse zur Erzeugung und Verwendung von semantisch veredelten („smarten“) Unternehmensinhalten konzentrieren. Im Rahmen wissenschaftlicher Innovationsforschung werden neuartige Lösungsansätze zu Problemen entwickelt, die entlang der Corporate Smart Content-Prozesskette entstehen.
 

Die thematischen Schwerpunkte

Die thematischen Schwerpunkte gliedern sich entlang der Prozesskette in 5 Teilvorhaben:

1. Smart Content Enrichment (SCE)

● Aspekt-orientierte Ontologieentwicklung:
Der zu entwickelnde Ansatz zur aspektorientierten Beschreibung von ontologischem Wissen hat zum Ziel, Wissen in Form von Fakten bedarfsgerecht, d.h. an den situativen Kontext angepasst, zur Verfügung zu stellen. Gleichzeitig soll durch die Zuordnung bestimmter Fakten zu einem Aspekt die modulare Wiederverwendbarkeit und Integration interessanter Ausschnitte einer Ontologie ermöglicht werden.

● Komplexe Entitätserkennung und Annotation:
Beispiele von komplexen Entitäten im Unternehmenskontext sind solche, auf die implizit verwiesen wird, die aber nicht explizit mit ihrem Eigennamen erwähnt sind. "Die deutsche Tochtergesellschaft von General Motors" enthält z.B. die implizite Entität „Firma Opel“. Es ist erforderlich herauszufinden, welche Unternehmensdaten und Versionen im jeweiligen Kontext des Dokument- bzw. Informationsobjekts anzuwenden sind und ob eventuell weiteres Hintergrundwissen aus anderen Quellen hinzugezogen werden muss, um eine valide Interpretation der impliziten Entität zu ermöglichen.

● Wissensgewinnung aus Aktivitätsspuren:
In den Unternehmen existieren zahlreiche Informationssysteme, in denen die Mitarbeiteraktivitäten in Geschäftsprozessen erfasst werden. Die Aktivitäten hinterlassen elektronische Spuren, die für die Wissensgewinnung von besonderer Bedeutung sind. Sie können zur Erkennung von Mitarbeitergruppen mit ähnlichen Arbeitsmustern eingesetzt werden, um die Arbeitsabläufe durch die gewonnenen Erkenntnisse zu verbessern, und auch für die Zuweisung von individuellen Mitarbeitern zu bestimmten Geschäftsaktivitäten.

2. Smart Content Creation and Annotation (SCCA)

Im Teilvorhaben "Smart Content Creation and Annotation" werden leichtgewichtige Technologien aus dem Web 2.0-Umfeld (Folksonomies, Collaborative Tagging) weiterentwickelt und auf neuartige Weise mit semantischen Technologien verbunden. Ein selbstlernendes System könnte Redakteure dabei unterstützen, Dokumente kollaborativ mit semantischen Metadaten anzureichern, über welche dann gesucht werden kann.

3. Smart Content Management (SCM)

In diesem Teilvorhaben wird ein Baustein der Prozesskette entwickelt, der Redaktionen, Management, Marketing und Projektleiter in Unternehmen mit innovativen Verfahren der semantischen Analyse bei der Erstellung, Verwaltung, Navigation und Recherche von Inhalten unterstützt.

4. Corporate Smart Wiki (CS WIKI)

Wiki-Seiten sollen durch Verfahren semantisch angereichert werden, die auf die existierenden Wiki-Seiten eine verbesserte bzw. optimierte Annotation und Verlinkung von Seiten ermöglichen. Es sollen benutzerfreundliche Werkzeuge erstellt werden, die in der Lage sind, die Inhalte von Wiki-Seiten maschinell und durch Kollaboration der Mitarbeiter zu analysieren. Ziel ist der Vorschlag richtiger Annotationen bzw. Verlinkungen zu anderen Seiten, um die Nutzer so bei der Annotation und Typisierung zu unterstützen.

5. Corporate Smart Process Content (CSPC)

Auf Basis eines Prozessmodells wird festgelegt, an welcher Stelle im Prozess sich ein Mitarbeiter befindet. Das Prozessmodell ist semantisch angereichert und enthält auch bereits direkt dem Schritt zugeordnete Dokumente/Links. Im Idealfall ist für den Benutzer gar kein aktiver Suchprozess mehr notwendig, sondern es wird ihm direkt das für den aktuellen Prozessschritt nötige Ergebnis zur Verfügung gestellt.
 

Die Partner

Die um Prof. Dr. Adrian Paschke entstandene Forschergruppe „Corporate Semantic Web“ der FU Berlin kooperiert eng mit folgenden regionalen KMU:
 

  • Condat AG, ein IT-Beratungs- und Dienstleistungsunternehmen
  • esPresto AG, ein IT-Dienstleister mit webbasierten Produkten für den e-Business-Bereich
  • neofonie GmbH, ein auf Suche spezialisierter IT-Anbieter
  • Semtation GmbH, Hersteller eines Modellierungstools für Prozesse und Ontologien

Kontakt

Prof. Dr. Adrian Paschke
Freie Universität Berlin
Institut für Informatik
Königin-Luise-Straße 24/26
14195 Berlin
Tel.: 030 83875-225
Fax: 030 83875-220
E-Mail: paschke[at]inf.fu-berlin.de

Berichterstattung aus dem "Blickpunkt" finden Sie hier.

Nähere Informationen zum vorangegangenen InnoProfile-Projekt "Corporate Semantic Web" finden Sie hier.