i-KNOW 2012

Wir freuen uns sehr, gemeinsam mit den CID-Kollegen (Hauptsponsor) auf der diesjährigen i-KNOW 2012 in Graz in Österreich teilzunehmen und einen Beitrag zum Programm leisten zu können:

  • Vortrag: Wissen intelligent suchen und schneller nutzen
    Mit Semantik und Textanalyse in der Suche Wissensproduktivität steigern.
    gemeinsam mit Dr. Werner Schachner, Graz

    Schwerpunkt des Vortrages ist wieder, wie Suchsysteme basierend auf intelligenter Sprachanalyse und Semantik einen wesentlichen Beitrag zur Steigerung von Wissensproduktivität in Unternehmen leisten können.

    Dabei werden wir ein konkretes Beispiel vorstellen: ein Wissensarbeiter soll für eine Produktfortentwicklung Informationen bereitstellen und stößt dabei auf so manche Herausforderung bei seiner Recherche. In diesem Rahmen zeigen wir anhand praktischer Beispiele auf, wie die o.g. Technologien einen spürbaren Mehrwert leisten können.

Über Ihr Interesse und Besuch in Graz würden wir uns sehr freuen!

dcif Jahreskonferenz: CID Consulting & Competitive Intelligence@IFA

Wir freuen uns, auf der diesjährigen Jahreskonferenz des dcif vertreten zu sein, gemeinsam mit den CID-Kollegen als Aussteller sowie mit einem Praxisvortrag:

„Fallbeispiel: Internationales Media Monitoring für Marketing & Vertrieb der IFA“

In diesem Praxisbeispiel werden wir zeigen, wie moderne CI-Werkzeuge die IFA in Berlin dabei unterstützen, den Consumer Electronics-Markt sowie die eigene Präsenz und die ihrer Kunden im Web und Social Media genau zu beobachten und diese Informationen strategisch einzusetzen.

Das Programm findet sich hier: http://www.dcif.de/konferenz-2012

1. Wissensmanagement-Tage in Krems

Wir freuen uns sehr, auf den ersten Wissensmanagement-Tagen in Krems an der Donau, Österreich, teilzunehmen und einen Beitrag zum Programm leisten zu können:

  • Workshop: Competitive Intelligence als strategischer Wissensmanagementprozess
    Aufbau einer Echtzeitanalyse von (Web-)Informationen als Antwort auf einen unternehmensübergreifenden „Information Overload“ zur Identifikation wichtiger Themen und Trends
  • Vortrag: Wissen intelligent suchen und schneller nutzen
    Mit Semantik und Textanalyse in der Suche Wissensproduktivität steigern.
    gemeinsam mit Dr. Werner Schachner, Graz

    Die Schwerpunkte dieses Vortrags:

    • Wissen als Summe handlungs- und entscheidungsrelevanter Informationen
    • Die Rolle von Suchqualität bei „explizitem Wissen“ im operativen Wissensmanagement
    • Effizienter Umgang mit großen Informationsmengen durch Semantik und Textanalyse
    • Schnelle Reaktion auf Fragestellungen, Vernetzung inhaltlicher Aspekte und Erkennung neuer Themen
    • Im Ergebnis: Wissensproduktivität steigern durch bessere Wissensnutzung

    Insbesondere bei „explizitem Wissen“ ist die Qualität von Suche ausschlaggebend für den Erfolg im operativen Wissensmanagement. Dieser Vortrag stellt anhand von Praxisbeispielen die Wirkungskraft eines „Semantic Enterprise Search“-Ansatzes vor, um möglichst viele Informationen von innerhalb und außerhalb eines Unternehmens zu nutzen und anhand von Semantik und Textanalyse interaktive Suchwerkzeuge anzubieten. Ziel dabei ist der effizientere Rückgriff auf Wissen sowie die Vernetzung thematischer Aspekte, um die Wissensproduktivität zu steigern und neue Informationswerte zu schaffen.

Tagging: Fingerabdrücke von Informationen

Tagging spielt bereits seit einiger Zeit eine wesentliche Rolle, um effizient auf abgelegte (Text-)Inhalte zuzugreifen. Dabei stellt sich oft die Frage, was die wesentlichen Unterschiede zwischen manuellem und automatischem Tagging sind bzw. welcher Ansatz welche Vorteile bietet. In diesem Beitrag möchten wir daher etwas auf eine empfehlenswerte Kombination beider Vorgehensweisen eingehen.

Einschlägige Studien belegen, dass ca. 80% der Informationen eines Unternehmens als unstrukturierte Daten vorliegen – im Wesentlichen Texte im Unterschied zu Zahlen: Berichte, Dokumente, Ideen… vs. Verkaufszahlen, KPIs… Diese Text-basierten Informationen bringen das Problem mit sich, dass sie sich nicht einfach strukturiert auswerten lassen da hierfür Textverständnis erforderlich ist, sie daher oft verborgen bleiben und häufig sogar redundant geschaffen werden, da man sich einer bereits vorhandenen Information schlicht nicht bewusst war.

So stellt sich die Frage, wie auch dieser Großteil an textbasierten Informationen möglichst effizient für Nutzer zur Verfügung gestellt werden kann – eine Herausforderung vergleichbar mit der von Nachrichtenportalen von Zeitungen oder Fernsehsendern, die ebenso umfassende Informationsmengen möglichst reichweitenstark publizieren möchten.

Das in den Texten verborgene Wissen kann durch Anwender oft nur über Suchfunktionen erlangt werden – dann muss aber bereits eine Idee darüber bestehen, was man eigentlich finden möchte. Für Suchen verwendet man Keywords, bestimmte Themenbereiche besitzen aber meist einschlägige Schlagworte als Fachvokabular – es liegt also nahe, über ein gezieltes „Taggen“ von Inhalten Texte so mit einer strukturierten Inhaltsangabe zu versehen, um diese dann mithilfe des Fachvokabulars schnell wiederfinden zu können.

Dies kann nun dafür verwendet werden, Informationsangebote gezielt zu automatisieren: so können auf einem Portal Bereiche geschaffen werden, in denen Inhalte zu bestimmten Tags erscheinen. Suchen können effizienter gestaltet werden, da Anwender zu bestimmten definierten Tags die dazu passenden Inhalte einfacher finden können. Je besser das Tagging, desto besser die Wiederverwendbarkeit von Inhalten – daher bieten zahlreiche Dienste auch die Möglichkeit für Anwender, Inhalte selbst nach ihren eigenen Gesichtspunkten zu vertaggen (z.B. delicious).

Genau dies ist aber gleichzeitig auch das Problem eines manuellen „Vertaggens“: es ist subjektiv und nur schwer in seiner Qualität zu sichern, dazu aufwändig und beschreibt selten einen Inhalt vollständig. Es empfiehlt sich der Einsatz von Technologie, um das Taggen zu automatisieren: Text Mining (automatisierte Sprachverarbeitung in Texten).

Auch Suchmaschinen vertaggen sozusagen Inhalte auf Basis ihrer Inhalte, die indiziert werden. Suchmaschinen verfolgen aber ein bestimmtes Ziel: zu möglichst vielen freien Schlagworten möglichst passende Ergebnisse zu liefern. Genau genommen widerspricht dies dem Tagging-Ansatz, der gerade über eine begrenzte Zahl definierter Tags eine besondere Qualität erreichen soll. An dieser Stelle bereichern Text Mining-Algorithmen die „normale“ Suchindizierung von Inhalten durch die gezielte Anlage eines „Fingerabdrucks“ eines Textes, welcher genau die Schlagworte enthält, die den Inhalt je nach Zweck und Kontext bestmöglich beschreiben, bis hin zur gezielten Vergabe vordefinierter Tags je nach Charakteristik des Textes.

Diese Kombination bietet herausragende Vorteile: Inhalte werden vollständig indiziert, um sie in einer Volltextsuche finden zu können, gleichermaßen werden aber die herausragenden Begriffe und definierten Tags gesondert festgestellt, um diese für eine qualitativ bessere Weiterverwendung einzusetzen – ohne manuellen Aufwand.

Erlaubt man nun zusätzlich manuellen Aufwand beim Vertaggen – wenn auf Wunsch manuell weitere Tags hinzugefügt oder automatisiert erstellte Tags gezielt wieder entfernt werden – kann dies zusätzlich genutzt werden.

Der Fingerabdruck eines Textes kann so qualitativ noch verbessert werden – die Automation sichert aber eine qualitativ stabile Basis an Tags, welche auch ohne manuellen Eingriff funktionsfähig sind.

So können Textmengen effizient „gehoben“ und einfach mit hohem Automationsgrad verfügbar gemacht werden.

Vortrag zum Treffen des AK Knowledge Management der BITKOM: Semantic Enterprise Search

Ich freue mich auf die Gelegenheit, einen Vortrag zum Thema „Semantic Enterprise Search“ auf dem zweiten Treffen des AK Knowledge Management der BITKOM in diesem Jahr zu halten.

Zu Gast bei der Telekom in Darmstadt steht das Fokusthema „Neues im persönlichen Wissensmanagement (WM) – offene Netzwerke, offene Büros, Heimarbeitsplatze, Nutzung mobiler Endgeräte, selbstorganisiertes Lernen usw.“ im Vordergrund.

Vortrag: „Semantic Enterprise Search“

„Information Overload“ stellt mehr denn je eine Herausforderung für Wissensarbeit dar – auf Ebene ganzer Organisationseinheiten oder auch für jeden persönlich. Im Rahmen von Recherchen stellt sich meist weniger das Problem, umfassende Information zu finden, sondern viel mehr diese im Ganzen zu überblicken, zu analysieren und die richtigen Schlüsse daraus zu ziehen – je agiler und umfassender die Datenmengen, desto größer die Herausforderung.

„Semantic Enterprise Search“ ist ein Ansatz, möglichst viele Informationen innerhalb sowie auch von außerhalb eines Unternehmens für einzelne Mitarbeiter nicht nur zur Verfügung zu stellen, sondern zudem interaktive Such- und Analysewerkzeuge anzubieten, welche eine möglichst einfache und schnelle Arbeit mit den gesammelten Informationen erlauben: durch semantische Textanalyse, inhaltliche Zusammenfassung und dynamische  Filterangebote können riesige Informationsmengen schnell in Überblick gebracht und auf einzelne relevante Aspekte gefiltert werden, welche nicht nur Antworten auf bestehende Fragestellungen bieten sondern auch neue Themen aufdecken können.

Der einzelne „Wissensarbeiter“ kann so deutlich effizienter auf bestehendes Wissen zurückgreifen, thematische Aspekte vernetzen und neue Informationswerte schaffen.

  • Interaktives Arbeiten mit großen Informationsmengen innerhalb und außerhalb eines Unternehmens
  • Semantische Textanalyse, Themenerkennung und dynamische  Filterangebote als wirksame Mittel gegen den persönlichen „Information Overload“
  • Überblick gewinnen, auf einzelne thematische Aspekte fokussieren, Fragestellungen beantworten und neue aufdecken.

Der Vortrag zeigt aktuelle technologische Möglichkeiten und Vorgehensweisen anhand praktischer Beispiele auf.

Weitere Informationen finden sich auch auf der Webseite der BITKOM:
http://www.bitkom.org/de/veranstaltungen/102_71133.aspx

Semantische Suche in Unternehmen

„Suche“ ist ein umfassendes Thema. Anwender kennen eine sehr einfache Suche von Google & Co und erwarten ebenso einfache Suchfunktionen in möglichst allen Anwendungen.

Dies führt dazu, dass zahlreiche Systeme explizit mit Suchtechnologie aufgewertet werden (Windows & Office mit der Windows Search, SharePoint mit FAST…). Unternehmen führen zudem oft im Rahmen ihres Wissensmanagements „Enterprise Search“-Lösungen ein, um eine zentrale Anlaufstelle für die Suche in internen Netzwerken, Dokumenten-Management-Systemen etc. anzubieten.

Seitens CID Consulting beschäftigen wir uns mit Konzepten, wie solche Systeme bestmöglich Informationsprozesse innerhalb eines Unternehmens unterstützen und effizienter gestalten können.

Suche ist als Technologie eine eigene Disziplin. Primäre Ziele sind eine gute Indizierung aller Inhalte, um diese auf Basis nur weniger Schlagworte effizient und schnell zu finden, und dann möglichst passend zu sortieren („Ranking“). Gerade dieses Ranking entscheidet darüber, ob eine Suche die Akzeptanz ihrer Anwender findet, denn nur wenn gute bzw. interessante Einträge unter den ersten 10-30 Ergebnissen zu finden sind, werden sie in der Regel auch genutzt.

Suche ist auch eine Basistechnologie innerhalb der Produkte unseres Schwesterunternehmens Pattern Science: CORPUS® und Topic Analyst®. Bei einer Suche werden schnell tausende Ergebnisse zu einem Schlagwort dem Anwender präsentiert, das Ranking entscheidet, welcher Eintrag ganz oben steht. Bei CORPUS und Topic Analyst steht zudem aber vor allem die Aggregation von tausenden Ergebnissen im Vordergrund: was beinhaltet eigentlich diesige riesige Informationsmenge, wie kann man sie in logische Themenblöcke untergliedern, was ist auffällig, was ist neu und wie kann ich nun möglichst umfassend mit den Ergebnissen arbeiten?

So ergänzen sich Suche und Analyse gut: Anstatt nach einer Suche die Ergebnisse langwierig zu prüfen und irgendwann weitere Ergebnisse schlichtweg nicht mehr anzusehen, fassen CORPUS und Topic Analyst ein ganzes Suchergebnis zusammen und stellen es in einer Übersicht dar.

Die aggregierte Darstellung der Ergebnisse erfolgt dabei über Tag Clouds, der Auflistung relevanter Begriffe und vor allem der Darstellung enthaltener Themen. So wird auf einen Blick sichtbar, was in einem Suchergebnis enthalten ist – zudem wird eine schnelle und interaktive Navigation durch die Inhalte möglich, in dem auf Basis relevanter Begriffe und Themen zusätzliche Filterungen vorgenommen werden können.

Im Ergebnis wird so das gesamte Suchergebnis – und damit alle potentiell relevanten Inhalte – nutzbar gemacht. Was früher aus Zeit- oder Ausdauermangel abgeschnitten wurde, wird nun mit berücksichtigt. Dies steigert deutlich die Nutzung vorhandenen Wissenspotentials.

Ein zweites, eigentlich vorgelagertes Problem einer Suche ist die Formulierung der Suchanfrage. Oft ist eine möglichst intelligente Auswahl der Suchbegriffe wichtig, um die gewünschte Ergebnismenge zu erreichen. Gerade bei Synonymen kann dabei ein einzelnes Wort wesentlichen Einfluss auf die Suchergebnisse üben. Hier kann die Semantik des CORPUS einen zusätzlichen Beitrag liefern: durch die automatisierte Ergänzung von Synonymen zu einer Suchanfrage, um möglichst alle relevanten Treffer zu einem eigentlich gleichen Thema zu finden.

Dazu bilden wir seitens CID Consulting gemeinsam mit den Experten auf Kundenseite Begriffshierarchien und Zusammenhänge der jeweiligen Fachdomäne innerhalb des CORPUS ab. Sucht man nach Wasser, will man vielleicht auch Flüssigkeiten finden. So kann zusätzlich auf Basis semantischer Beziehungen die Suche ergänzt werden. Diese Ergänzung selbst erfolgt dann über Empfehlungen, die schnell und dynamisch durch den Nutzer einbezogen werden können. Eine automatisierte „Query Expansion“ wird in der Regel nicht durchgeführt (technisch aber möglich), da dies schnell zu einem ungewollten Aufweichen der Ergebnisse führen kann. Gerade aber die geführte, interaktive Navigation durch semantische Beziehungen der Begriffe kann einen wesentlichen Vorteil bei der Zusammenstellung der Suchbegriffe bieten – plus eine deutlich dynamischere Interaktion mit dem vorhandenen Wissensschatz durch den „Information Worker“.

Kurz gefasst: Deutlich effizientere Nutzung vorhandenen Wissens durch semantische Unterstützung der Suche und aggregierte Ergebnisdarstellungen mit Themen- und Trenderkennung.

Big Data & Competitive Intelligence – from Big Data to Real-Time and Trends Analysis

Wir freuen uns, auch dieses Jahr wieder auf der International Competitive Intelligence Conference 2012 in Bad Nauheim vertreten zu sein (Link).

In unserem Vortrag „Big Data & Competitive Intelligence – from Big Data to Real-Time and Trends Analysis“ werden wir einen besonderen Fokus auf die Herausforderung legen, aus den heute zur Verfügung stehenden riesigen Datenmengen zu Wettbewerbern, Kunden, Lieferanten, politischen und rechtlichen Entwicklungen, Forschung & Entwicklung… in Echtzeit schneller und effizienter die richtigen Schlüsse zu ziehen.

Über Ihr Interesse an der Veranstaltung, unserem Vortrag und dem CID-Stand würden wir uns sehr freuen!