IDRS bedeutet intelligentes Datenrelationssystem und bezeichnet eine intelligente Verarbeitungsmethodik auf Computern (maschinelle Kognition) mit deren Entwicklung wir im Frühjahr 2000 begannen
Im IDRS ergibt sich die Gewichtung von Regeln an den Daten, die einander entsprechen. Eine zugeteilte Gewichtung ist nicht vorgesehen, das System stützt seine Erkenntnisse an dem, was ihm vorliegt. Daraus folgt, dass diese Informationen günstiger Weise im Detail stimmig und zutreffend sind. Aus unscharfen und widersprüchlichen Daten gehen ebensolche Erkenntnisse hervor. So arbeitet das IDRS genau nicht, Neuronale Netze tun das. Im Gegensatz zu diesen soll das IDRS seine Schlüsse lesbar mitteilen und nicht nur blind anwenden können.
Liegt eine stimmige, korrekte und umfassende Datenbasis für die Problemstellung vor, gelingt es dem IDRS hingegen solche Eingänge begründet abzuweisen, die den aus den Daten gewonnenen Erkenntnissen (Regeln) nicht entsprechen. Die Methode vereint Anforderungen an die Datenverarbeitung mit den Methoden maschineller Kognition.
Um trotz der Einschränkung flexibel genug mit z.B. Messdaten umzugehen, betrachtet das IDRS alle Informationen sehr feinkörnig, also in hoher Detailauflösung. Wo Fließkommawerte nicht übereinstimmen, trifft es in einem Rahmen auf ihre Ziffernfolgen zu. Das wird erkannt. Hier wie in den bisherigen Technologien verursacht die Komplexität der Werte und ihre Anzahl allerdings einen progressiv ansteigenden Verarbeitungs- und Speicheraufwand. Im Unterschied trainiert das IDRS an untergeordneten Problemstellungen, deren Regelkomplexe in Module überführt und zur Lösung komplexerer Aufgaben einzeln herangezogen werden können. Erkenntnisse Neuronaler Netze können nicht modularisiert werden ohne die komplette (unbekannte) Erkenntnisstruktur und deren Seiteneffekte mitzuschleppen.
Prozesse bringen (im Gegensatz zu Operationen der Mustererkennung und -Entsprechung) grundsätzlich einen so gesteigerten Datenumfang ein, dass ein einzelnes Neuronales Netz für die komplexe Steuerung überfordert ist. Darum setzt man für jeden Steuerungspunkt ein eigenes ein. Um das Verhalten von Personen oder Gesellschaften treffsicher vorherzusagen sind sie nicht geeignet, weil sie dazu Denkprozesse nachvollziehen müssten, die den Entscheidungen zugrunde liegen. Außerdem verfügen sie nicht über die Informationen und deren Interpretation, worauf diese Bewegungen basieren.
Gewissermaßen als Abfallprodukt bei der Erforschung maschineller Kognition wie sie das IDRS anwenden soll, entstand ein Schema womit sich ein System entwickeln ließe, das menschliches Verhalten auf Basis des Willenssystems analysieren und prognostizieren kann. Hintergrund: Zur Anwendung kommen dabei die Ergebnisse aus der Grundlagenuntersuchung, wie “Bedeutung” (Relevanz) durch Computer zu ermitteln und zu erfassen ist um Relevanz beim Bau eines problemspezifischen Folgerungsnetzwerks einzusetzen. In Menschen entstand dieses Bewusstsein im Lauf der biologischen und kulturellen Entwicklung die in der Ambivalenz zwischen “Bestand und Dynamik” beginnt und sich dann immer weiter differenzierte und abstrahierte, biologisch z.B. bis hin zum vorliegenden Triebsystem. Das lässt sich für die Erforschung von Trends nutzen, die im gesellschaftlichen Rahmen eher emotional/intuitiv als rational/logisch zustande kommen und auf die Erfüllung vernachlässigter Wohlbefindensfaktoren gerichtet sind, die das Triebsystem zu wenig speziell wiedergibt.
Das IDRS ist ein Grundsystem, das im Rahmen von Analyse und Synthese Mustererkennung und -vervollständigung bietet und darum als Datenbankserver ausgelegt, der auch (gewichtet) Ergebnisse zurückgibt, die er nicht in Eingangsdaten erhielt. Die Datenform ist so stark vereinfacht, dass damit jede bereits entwickelte höhere (Folgen, Listen, RDBS, XML, …) abbildbar ist. Eine Datenübernahme führt bereits auf dieser Ebene zu einer Verdichtung, da kein Wert und keine Zuordnung mehrfach vorkommt. Das ist essentiell für die Analyse und ihre Geschwindigkeit.
Neben den Aufgabengebieten klassischer KI-Systeme und noch weiteren (wie unten) , bietet sich das IDRS für eine neuartige Form der Softwareentwicklung an, die ihre Funktionalität an den Testdaten selbständig generiert.
Testszenarien geben heute Eingangs- und Ergebniswerte vor, an der die Funktionalität einer entwickelten Software geprüft wird. Diese Daten sind (sollten sein) signifikant und korrekt, daher wie geschaffen als Trainingshintergrund für ein Analysesystem, das daraus Regeln ableitet. Diese Regeln bilden dann die Funktionalität der Software ab. Das IDRS teilt sie konkret mit, auch in Form von Programmcode. Damit wird der Entwicklungsweg umgekehrt, die Programmlogik geht aus den Testdaten hervor. Vorteilhafterweise bleibt das Ergebnis im ganzen Entwicklungsprozess daran orientiert, so dass es nicht zu Seiteneffekten kommt, die bereits gelöste Problemstellungen stören, wie es heute an der Tagesordnung ist. Stellt sich ein Testfall selbst als fehlerhaft heraus, können alle mit seinen Daten spezifisch verbundenen Regeln identifiziert und eliminiert, gegebenenfalls manuell umformuliert werden um Trainingsaufwand einzusparen.
Das IDRS findet bei der Analyse auch Zusammenhänge, wie es nicht zu programmieren beabsichtigt war. Das stellt zum Einen höhere Anforderungen an die Testdaten, die dort und so variant sein sollten, wie es für den Wirkbetrieb zu erwarten ist. Zum Anderen automatisiert das System Zusammenhänge, die erkanntermaßen gelten aber von üblicher Programmierung nicht erfasst worden wären. Beispielhaft ist die Mehrfacheingabe von identischen oder voneinander ableitbaren Daten in unterschiedlichen Masken zu nennen.
Im Testbetrieb der Wirkumgebung klassifiziert das System neu einlangende Daten an der Stimmigkeit mit seinen Regeln. Eine administrative (personelle) Instanz bestimmt dann ob die Begründung für eine Abweisung ggf. weiterhin gültige Regel sein soll.
Komplexe Berechnungen pflegt man händisch ein, wenn zu erwarten ist, dass sich das IDRS zu lange mit der Erkennung aufhält. Das ist auch abhängig von den Rechen- und Speicherkapazitäten des Trainingssystems. Die Regelsyntax ist vor dem grundlegend simplen Aufbau der Datenstruktur sehr leicht verständlich und visuell ebenso klar darstellbar.
Weitere spezifische Anwendungen des IDRS
Eingabeunterstützung: Entspricht der Umfang eingegebener Daten erkannten Mustern, kann das IDRS die Inhalte noch offener Positionen vorbelegen und/oder fehlerverdächtige markieren.
Datenkompression: Daten, die in Regeln gefasst werden können, sind im Bestand verzichtbar. Die Daten des IDRS sind selbst optimiert angelegt. Jeder Aspekt kommt im System auch nur einmal vor.
Konsistenzanalyse: Gehorchen die meisten Daten erkannten Regeln, verbleiben für die weitere Analyse solche, die ihnen nicht genügen. Diese Bestandteile sind entweder fehlerhaft oder die Regelermittlung ist noch nicht so weit fortgeschritten, wie zur Abbildung erforderlich.
Entwicklung optimierter Algorithmen: Da das IDRS potentiell jede Datenübereinstimmung erkennt und in Regeln fasst, ist es geeignet bislang unberücksichtigte Zusammenhänge in Regeln zu formulieren. Daraus kann systemnaher Programmcode generiert werden.
Forschung: Ein IDRS mit entsprechendem Funktionshintergrund kann in der Datenanalyse zur Ermittlung noch unbekannter mathematischer Zusammenhänge eingesetzt werden. Messdaten empfehlen sich dem IDRS hingegen weniger, da sie unscharf und fehlerbehaftet sind, womit sie Zusammenhänge wiedergeben, die daraus nicht schlüssig erkennbar sind.
Bisherige KI-Anforderungen, die das IDRS potentiell erfüllt (spezifische Eignung):
- Datamining (++)
- Suchmaschine – Leit- und Suchsysteme für die Datenauswahl (+++)
- Rechtschreibprüfungen und Thesauren (++)
- Bilderkennung, Spracherkennung, Industrielle Qualitätssicherung (+-)
- Erkennung von Angriffsschemata in Netzwerken (+)
- Spam-/Virenschutz – Filtern von Datenübermittlungen auf Relevanz und Datensicherheit (+-)
In der Bearbeitung von signifikanten, regelhaften, scharfen, stimmigen und umfassenden Daten spielt das IDRS seine Stärke aus. Es ist darauf ausgelegt, kognitive (intelligente) Funktionalität in Datenverarbeitungsaufgaben der klassischen Form einzubringen. Dabei kann es sich nur auf die Erkenntnisse beziehen, die aus den Daten klar hervorgehen, so scharf sind diese dann aber auch. Damit ist es möglich, einzelne Spektren aus dem Gesamtdatenstand zu lösen, getrennt zu trainieren und die erlernte Funktionalität modular auch für weitere Analyse einzubinden. Das entspricht einem Konzept der Entwicklung, in der isoliert heranziehbaren Sachständen ihre innewohnende Logik schneller und genauer zu entlesen ist als aus der Gesamtbetrachtung. Bisherige KI-Systeme vermögen das nicht, sind aber auch geeigneter, unscharfe Daten zu behandeln. Das Training erfolgt dann an sehr vielen Stellungen mit dem einhergehenden Bearbeitungsaufwand. Dem IDRS genügen wenige Signifikante, die es aber abhängig von ihrer Relevanz und den Vorgaben weitgreifender und umfassender verfolgt. Das Grundproblem des progressiv ansteigenden Aufwands in der KI ist mit dem IDRS nicht gelöst sondern nur eingedämmt und kanalisiert.
Ein problembezogenes IDRS kann mit einem Funktionshintergrund ausgestattet werden, der der Aufgabenstellung entspricht und den es bei der Regelermittlung anwendet. Beispielhaft würde man Grundrechenfunktionen für
- klassische Datenverarbeitungsaufgaben nicht trainieren sondern aus der Rechnerlogik beziehen
- die Entwicklung von Algorithmen dem Befehlswortschatz (günstig: RISC/Assembler) gegenüberstellen
- mathematische Lösungsfindung aufbauend (Addition->Subtraktion->Multiplikation -> …)
- und in mehreren Zahlensystemen (Grundmengen/binär, dezimal, …) trainieren
Die Feinauflösung der Daten wird ebenfalls problembezogen angelegt um das System nicht mit Analysen zu belasten, die keine sachdienlichen Erkenntnisse versprechen oder deren Nutzen in ungünstigem Verhältnis zum Ermittlungsaufwand steht.
Durch Rückadaption des IDRS auf den Menschen beschäftigte ich mich zunehmend mit Werten, Emotionen und humaner Kognition, so wie einem darauf basierenden Denkmodell. Das hatte mich derart fasziniert, dass der technische Teil ein wenig ins Hintertreffen geriet. Während der Nutzen maschineller Kognition grundsätzlich nicht in Frage steht, muss sich im Markt dennoch jemand finden, der sie braucht.
Wir wollten, dass der Computer die Daten versteht.
Datamining wendet alle geeigneten Methoden an, aus den Daten eine Regelhaftigkeit zu ermitteln, die Grundlage zutreffender Prognosen und zielführender Steuerungseinflüsse ist. Dabei ist zwischen harten und weichen zu unterscheiden.
Weiche Methoden beziehen die Tatsache ein, dass die Daten ungenau, fehlerhaft und widersprüchlich sind wogegen harte nur an den Stellen Ergebnisse zeitigen, die exakte Übereinstimmungen oder signifikante Unterschiede aufzeigen.
Heuristische/statistische, neuronale und genetische Analyse sowie Bayessche Netze und weiche Clustering-Algorithmen kommen dabei zu Schlüssen, die schlecht bis nicht nachvollziehbar aber relativ flexibel und treffend anwendbar sind. Fuzzy Logik und sog. hartes Clustering ermittelt eng definierte Zusammenhänge bzw. einfache Wahrheiten wie sie entweder die Programmierung vorsah, zu speziell sind oder die auf der Hand liegen.
Das IDRS zählt zu den harten Methoden. An Relevanzmerkmalen orientiert verhält es sich in etwa wie eine Mischung aus Fuzzy Logik und hartem Clustering. Die Zusammenhänge sind nicht vordefiniert und werden aber auch nicht wahllos an den Übereinstimmungen festgestellt. Das ist ein Leistungsvorteil, der tiefere und flexiblere Analyse erlaubt. Das führt zu brauchbareren (stärker abstrahierten) Ergebnissen. Datamining ist davon abgesehen nicht die erste Domäne des IDRS, da falsche und unscharfe Daten die Analyse behindern. Hohes Datenvolumen ist ebenfalls kein Vorteil im Gegensatz zu dem, wessen weiche Verfahren bedürfen, deren Ergebnisse auf Wahrscheinlichkeit beruhen. Das IDRS wäre eine zusätzliche Methode für das Datamining mit eigener Qualität und schlagkräftiger, wenn es bereits beim Dateneingang zum Einsatz kam um die Schlüssigkeit zu bewahren.
… in der Biometrie, Für jedwede Bildanalyse braucht das IDRS einen Erfahrungsstand, der in einem vergleichsweise aufwändigen Entwicklungsprozess zu trainieren ist. Wie ein Kind an ansteigenden Fähigkeiten Helligkeitseindrücke, Umrisse, Farben, Formen, Objekte, Arrangements und Raumstellungen zu differenzieren lernt, ist es auch für das IDRS erforderlich, soll es Bildeindrücke an erkennbaren und ihm bekannten Merkmalen analysieren. Es kann auch um Erkenntnisse bereichert werden, die bereits formulierbar vorliegen. Neben diesem Unterschied ist es den weichen Methoden die dafür bisher zum Einsatz kommen unterlegen, würde beispielsweise ein Gesicht mit Bart nur unter höherem Aufwand wiedererkennen.
… der Qualitätssicherung (Produktion), Hierfür gilt in etwa dasselbe. Vorteil des IDRS ist allerdings, dass ihm die Vergleichsdaten (Optimalform) in Daten statt in Trainingsansichten zu übermitteln sind. Damit ist es leichter umzustellen. Das kann aber auch eine der KI vorgeschaltete Instanz, wie da der technische Stand ist, weiß ich nicht.
…der Datensicherheit (Spam- und Schädlingsabwehr) Menschlicher Einfallsreichtum ist vom IDRS am Stand der Hardwaretechnik nicht nachvollziehbar. Die Mischung der formulierbaren Merkmale wird allerdings erkannt. Auch hier liegen neuronale und genetische Analyse im Vorteil, weil sie flexibler und umfassender bewertet, wenn auch weniger genau.
…Datenleit- und Suchsysteme Welche Technologien die Suchmaschinenanbieter verwenden, ist unklar. IDRS berücksichtigt jedenfalls den thematischen Kontext von Suchbegriffen und klassifiziert die Inhalte auch daran.
Für nahezu jede über das Spielerische hinaus gehende marktwirksame Lösung ist das Entwicklungssystem mit
Datenbankhintergrund essentiell. Daran arbeiten wir. Was ohnedem machbar ist, findet im Markt entweder schon mehr oder weniger gereifte Realisierung vor oder zeigt im Wesentlichen Potentiale auf. Über ein hinzulernendes mathematisches Grundsystem als Proof of Concept musste ich mir einmal anhören: “Ich habe aber schon einen Taschenrechner”. Intelligenz ist ein problematisches Produkt, wer sie braucht erkennt es nicht so leicht.
Als Vertriebsweg hätten wir ein Onlineangebot gewählt um nicht veröffentlichen zu müssen, wie es funktioniert. Dienlich hierfür ist die Tatsache, dass Verknüpfungsdaten und Werte voneinander getrennt sein können. Das Datenbanksystem muss die Werte nicht kennen sondern nur den darüber liegenden Zuordnungskomplex. Das Online-Angebot ist an dieser Stelle also einigermaßen datensicher für den Kunden. Weder Serviceanbieter noch Lauscher kennen die Bezeichnungen und die Inhalte der Daten, die bleiben beim Client, wenn er es so will. Nur Zuordnungsdaten werden dann ausgetauscht.
Das Entwicklungssystem passt man an spezielle Erfordernisse an, indem man es mit einem Funktionshintergrund versieht oder dazu trainiert, der auf die speziellen Anforderungen ausgelegt ist. Das Frontend kann man fließend so gestalten, dass es den Anwender von der darunterliegenden Logik abschirmt. Die Ergebnisdaten werden auch so aufbereitet. Das System ist bereits so geplant, dass es in der Ein- und Ausgabe mit feinkörnig definierbaren Sichten arbeitet. Der Anpassungsaufwand hängt somit von der Problemstellung ab. Für eine allgemeine Datamining-Lösung nach heutigem Vorbild wäre er gering. Ein-
und Ausgabe gehen bereits über XML. Der Funktionsumfang ist in regulärer Programmierung vorzugeben.
Die Entwicklung von Standard- und Speziallösungen respektive die Unterstützung dabei wäre das (auch finanziell) interessantere Betriebsfeld, das sich aus der Präsenz eines IDRS-Systems ergibt.
Lizenzierung wäre auf dieser Ebene ein Dienstleistungsangebot für Ermittlungskapazitäten, Datenabfragen, Speicher- und Übertragungsvolumina von Null bis oben offen. Der Kunde kann darauf theoretisch ein Onlineangebot hosten denn Datensichten können auch (X)HTML-Seiten sein (ist es öffentlich, muss der Server die Datenwerte allerdings kennen).
Um *das* zu erreichen wären zwischen fünf und zehn Entwickler-Mannjahre anzusetzen, zuzüglich entsprechendem Testaufwand und Maschinenausstattung.
Tags: Datamining, IDRS, künstliche Intelligenz, maschinelle Kognition, Mustererkennung —








Kein Kommentar
Kommentieren