Mrz
07

Es geht nicht darum menschenähnliche Funktionalität zu entwickeln sondern um intelligente Datenverarbeitung. Daraus werden wir die intelligenten Maschinen entwickeln, die sich dann menschenähnlich verhalten, in erster Linie aber, weil sie durch uns dann besser bedienbar sind. Das wird (zunächst) eher ein künstlicher Aufsatz sein und nicht Ergebnis maschineller Entwicklung.

Die intelligenten Datenverarbeitungseinheiten, die denen vorausgehen gleichen (theoretisch) Menschen, die in definierter Umgebung unter sehr spezifischen und einfachen Anforderungsmustern aufwachsen und sich daran entwickeln statt an ihrem naturellen/kultivierten/sozialen Umfeld. Diese wie auch die Computerprogramme der anbrechenden Zukunft sind nur in der Lage, sich in ihrem begrenzten Feld zu bewegen. Man kann ihnen keinen Roman in die Hand drücken und fragen, was sie davon halten.

Ich glaube, dass Alan Turing Schuld an der Misere hat, dass nicht anerkannt wird, wie intelligent unsere Maschinen bereits sind. Der Turing-Test legt vor, dass die Maschine mit ihren Antworten von Menschen nicht treffsicher zu unterscheiden ist, dann erst sei Künstliche Intelligenz gegeben. Das offenbart, wie wenig man zu der Zeit davon verstand. Intelligenz ist bereits in den kleinsten anpassungsfähigen Elementen gegeben. Das über die Zeit entwickelte Zusammenspiel blieb übrig, weil es in der Umgebung erfolgreich war. Das Gehirn wendet die Systematik von Analyse (Musterentsprechung) und Synthese (Mustervervollständigung) nur an und der Verstand abstrahiert und selektiert damit Zusammenhänge die signifikant waren, Kognition.

Die Regeln sind komprimierte Daten, so kann der Verstand beispielsweise beliebige Zahlen addieren ohne eine riesige Tabelle mitzuführen, indem er wenige Regeln auf Ziffernreihen anwendet. Während ein Tier die den Daten zugrundeliegenden Regeln erst prägen muss, können Menschen sie einander kurz und prägnant mitteilen. Sie den Umgebungsdaten zu entlesen ist bei ihnen genauso aufwändig wie im künstlichen Neuronalen Netz oder im Einsatz Genetischer Algolrithmen. Es erfordert Trainingszeit.

Herausgeschält aus dem Wust unklarer Zusammenhänge wie sie auch ohne Verstand gespeichert sind, erfüllen die Regeln die Kriterien von Fakten. Auf denen kann man isoliert aufbauen, sie abstrahieren und kombinieren, sie hinterfragen, prüfen und beweisen. Das ist mit dem Datenmatsch nicht so leicht möglich, der in unserem tierischen Hirn, sowie in unseren künstlichen neuronalen und genetischen Strukturen gegeben ist. Da ist Fuzzy Logik noch näher dran aber eben auf die Zusammenhänge reduziert, die definiert sind.

Erkenntnis kann nur aus Kenntnis hervorgehen, weshalb die intelligente Datenverarbeitung der nächsten Zukunft Ergebnisse aus einfachen Stellungen trainieren wird, die man ihr so klar und eindeutig wie möglich vorgibt. Da wird mit den mathematischen begonnen. Das ist für die Datenverarbeitung genau richtig.

Was menschlich ist, erfahren Menschen besser, denn sie wachsen unter Menschen auf und entwickeln sich an ihnen, sind selber welche. Dass der einzige intelligente Mechanismus auf diesem Planeten (den wir kennen) der Mensch ist, heißt nicht, dass alles Intelligente sein muss wie er. Das war ein falscher Umkehrschluss.

Reblog this post [with Zemanta]
Dez
31

Muster nehmen einen zentralen Stellenwert in dem ein, was Wissen schafft: dem Gehirn. Bereits die Regionen unmittelbar hinter dem Auge erkennen und vervollständigen Bildmuster zum kompletten Sichteindruck. Das Meiste von dem, was wir sehen, sehen wir gar nicht wirklich. Das Gehirn fügt es aus Erfahrungsdaten dazu. Das muss es, weil das Auge nur die Änderung zum vorherigen Bild anliefert (sog. Delta-Informationen). Den Rest muss das Gehirn machen. Die Funktionalität bezieht sich auf alle Prozesse, auch die Kommunikation.

Einem Baby wird etwas erzählt. Mit bildgebenden Verfahren wird aufgezeichnet, welche Gehirnareale aktiviert werden. Das Baby erkennt das Sprachmuster. Wird das Sprachmuster rückwärts vorgespielt, signalisieren die Untersuchungsaufzeichnungen ein “Rauschen”. Ein Neugeborenes wird zu Allem dasselbe Rauschen erzeugen und darin versuchen Muster zu erkennen und zu vervollständigen. Hat es bereits Lauterfahrungen gemacht, sind sie rückwärts abgespielt nicht mehr erkennbar. Aus einem “Grrrr” würde ein “Rrrrg”, was eine ganz andere Bedeutung hat (erstickter Endlaut deutet auf defensive Ablehnung). Aneinandergereiht ergibt es noch weniger Sinn.

Intonation, Rhythmus, Lautstärke und Einzellaute tragen genügend bei, um festzustellen, ob der Urheber kampfbereit ist. Da braucht man keine Begriffe, solche Informationen mussten wir schon aufgreifen, lange bevor wir Sprache entwickelten. Zunächst würde ich Laut- und restliche Sprachmuster voneinander trennen. Sie enthalten unterschiedliche Informationen, die auch von unterschiedlichen Instanzen ausgewertet werden. Alle beteiligten Instanzen werten das Muster aus. Das Ergebnis ist ein Mischeindruck. Während die Laute eines Wortes grimmig klingen können (Ablehnung), kann die Satzmelodie z.B. auf ein Eingeständnis hindeuten (Zuwendung). Die Interpretation der Satzaussage, also der logische Content wird überwiegend bestimmen, wie die Person sich zum Gesagten stellt. Ob sie dabei allerdings ein insgesamt gutes Gefühl hat, wird durchaus von der “tierischen” Auswertung getragen. Wie stark, hängt von der Person ab. Kinder müssen sich den emotionalen Aspekten beispielsweise stärker widmen, weil ein Erfahrungshintergrund für den Aussagegehalt nur unzureichend vorliegt. Frauen tun das im Allgemeinen ebenfalls, weil ihre Sensibilität stärker ausgeprägt ist und ihre Denkweise auf die Verarbeitung emotionaler Aspekte ausgelegt. Sie bilden mehr Synapsen aus, als Männer. Das sind mehr Verbindungen unter den Aspekten, die sich schlechter differenzieren lassen aber eine umfänglichere Betrachtung erlauben.

Der Klang der Laute wird z.B. von der Körperhaltung beeinflusst, aufrecht oder gebückt. Der Resonanzraum verändert sich damit so, dass die Töne anders klingen. Diese Information wird von der Intuition sofort aufgegriffen. Bei der Vorstellung über die sprechende Person fließt sie ein. Ob jemand eine Aussage in gebückter oder aufrechter Haltung trifft, ändert die Stellungnahme des Angesprochenen.

Viele, sehr viele verkettete Einzelstränge münden in vielen, sehr vielen Reaktionspunkten. Während Ladung durch sie hindurch bzw. dorthin führt, wird oft, sehr oft die Entscheidung getroffen, ob und wo sie entlang läuft. Das Ergebnis ist ein Mischeindruck, dessen relevanteste Merkmale an den Optionen die Aktion bestimmen. Ablehnung und Zuwendung sind nicht unbedingt von Sympathie abhängig. Modernes Marketing geht aber deutlicher in diese Richtung, weil die Menschen erkannt haben, dass sie belogen werden und es dann oft nur intuitiv erkennen können. Gegenüber einem Sympathieträger ist das Vertrauen groß. Bereits körperliche Attraktivität trägt dazu bei. Ob man sich der sympathischer erlebten Person zuwendet, ist wieder eine andere Frage. Sie spielt ihre charismatische Wirkung vielleicht aus, um zu instrumentalisieren. Dann sind Vorbehalte angebracht.

Authentizität wird gut angenommen, ob sympathisch oder nicht. Davon ist nämlich immer weniger übrig geblieben, seit wir Kleidung tragen. Echtheit (Richtigkeit) erlaubt eine *klare* Einschätzung über das, was gefällt und was nicht. Form und Maß der Zuwendung sind daran bestimmbar. Die Unsicherheit sinkt (Schutztrieb), die Akzeptanz steigt und die Klarheit (Wahrheit) der Aussagen auch. Wer offen ist, verschleiert nichts. Die Wenigsten können sich das aber leisten.

Apr
22

Indem der menschliche Organismus als technisches System betrachtet werden kann, trifft dies auch für seine Datenverarbeitungsmechanismen zu. Von frühester Entwicklungsstufe an, sind diese als Reiz-/Reaktionssystem ausgelegt, eine Funktionsweise, die wir mit Computern heutiger Technologie abbilden können.

Der Versuch die aus der Neuronenforschung gewonnenen Erkenntnisse in eine neu geartete Arbeitsweise zu überführen und diese in einer Rechnerumgebung nachzustellen, hat seine Zie­le bis heute nur zum Teil erfüllt. Die der Technologie neuronaler Netze zu Grunde liegenden Mechanismen sind zum einen noch nicht vollständig erforscht und zum anderen basiert diese Forschung auf dem Verständnis vom Stromfluss in den Verdrahtungen der Neuronen, statt auf dem der Datenhaltung und ihrer Anwendung. Es ist überaus ineffizient, Stromfluss zu simulieren, wenn es eigentlich um Daten geht.

Es liegt auf der Hand, dass die komplexe Funktionalität menschlichen Denkens auf der Anwendung eines Prinzips beruht, das von Reiz-/Reaktionssystemen in die Entwicklung eingebracht wurde. Die Summe der sensorischen Reize legt das Gehirn der höher entwickelten Säugetiere als Reizmuster ab, das von ihnen im Weiteren zur Veranschlagung der Reaktion auf eine Umgebungssituation herangezogen wurde. Die Evolution konnte nur auf diese zusammengesetzte Praktik zurückgreifen, um den lernfähigen, kreativen und vor allem in nahezu jeder Umgebung funktionsfähigen Denkapperat hervorzubringen.

Da das menschliche Denken auf Mustererkennung beruht, ist die Methodik, mit der die Datenmuster gespeichert werden für alle Ebenen des Denkprozesses essenziell. Weil der verfügbare Speicherplatz gemessen an heutigem Datenaufkommen denkbar klein ist, muss die Struktur so ausgelegt sein, dass kein Aspekt im System mehrfach auftritt. Neue Informationen finden ohne langwierige Einzelabwägungen Eintritt in den Datenbestand. Schließlich können wir am eigenen Denken beobachten, dass alle Aspekte miteinander in Zusammenhang stehen. Die technische Basis, das neuronale Netz, bestätigt die Theorie dieser Architektur.

Mit der IDRS-Technologie wurde ein Datenschema entwickelt, das allen diesen Kriterien entspricht. Während zwar nicht nachweisbar ist, dass es sich im Ergebnis um das Datenmodell des menschlichen Gehirns handelt, ist es zur Abbildung beliebiger Sachstände fähig und enthält jede Logik darüber, in welchem Zusammenhang ein Aspekt zu jedem anderen steht.

Auf niedriger Ebene der biologischen Musterverarbeitung nämlich unmittelbar hinter der Sensorik werden die empfangenen Reizmuster in den Datenbestand des aktuellen Wahrnehmungseindrucks überführt. Da nur ein Teil der Daten zeitnah aufgenommen werden kann, wird das erhaltene Muster auf Basis der bereits vorliegenden Muster vorangegangener Beobachtungen vervollständigt. Diese Funktionalität wurde bereits erfolgreich auf die IDRS-Umgebung angewendet. Sie ist damit grundsätzlich in der Lage, beliebige Eingangsdaten zu den Tatsachen im Datenbestand zu vervollständigen, die auf der Hand liegen. Dieses von uns als „Intelligenzstufe 1“ bezeichnete Leistungsmerkmal erfüllen bereits die höher entwickelten Säugetiere.

Es war zeitlich und evolutionsbiologisch gesehen für das menschliche Gehirn ein vergleichsweise kleiner Schritt, aus der Mustererkennung und –vervollständigung das logische Denken zu entwickeln. Das legt nah, dass es sich hierzu eines Mechanismus’ bediente, der bereits in Anwendung war: die Mustererkennung selbst. Mit der Entwicklung der Sprache war der Mensch nicht nur in der Lage, jeden Aspekt zu benennen, er subsumierte die spezifischen Einzelaspekte außerdem in früher erlernten Gattungsbegriffen, wodurch er es erreichte, den so virtualisierten Daten neue Muster zu entlesen, die Daten zu abstrahieren.

Das Darstellungssystem der IDRS-Struktur erforderte natürlich von Anfang an die Benennung der Aspekte, um sie studieren zu können. Im Gegensatz hierzu wird die Datenstruktur eines neuronalen Netzes in der Lernphase durch Verstärkung der an der Lösung beteiligten Aspekte gebildet. Die Bedeutung dieser Aspekte kann dem System nicht entlesen werden, sie bleiben unbenannt. Darum führt die von einem neuronalen Netz entwickelte Lösungssystematik zwar zu gewünschten Ergebnissen aber nicht zu von Menschen verwertbaren Erkenntnissen.

Erkenntnisse werden im IDRS-System aus dem Vergleich der Tatsachenmuster gewonnen, die für jeden Aspekt gelten und der ihn mit allen anderen in jeden Sachzusammenhang stellt. Als Ergebnis entsteht ein in Form von Mustern abgelegter Regelkomplex, an dem vorliegende Eingangsdaten vervollständigt werden können. Diese Regeln sind Schlussfolgerungen, die jede Logik wiedergeben, die in den Daten enthalten ist.

Die Welt des sich entwickelnden und auch des heutigen Menschen ist im Großen und Ganzen ein in sich schlüssiges System, dessen Prinzip von Ursache und Wirkung sich für eine solche Datenverarbeitung deshalb empfiehlt, weil die logische Bedeutung jedes Aspekts mit der aller korrespondierenden Aspekte festgestellt ist. Die physikalischen Realitäten der Lebensumgebung und vor allem die sozialen bauen aufeinander auf.

Für die heute vorzufindende Datenlandschaft trifft dies nicht zu. Zum einen enthalten Datenbanken immer nur einen Ausschnitt an Informationen und zum anderen sind die Daten darin nur so aussagekräftig und einander nur in soweit zugeordnet, wie es die Programmierung der zu erfüllenden Aufgabe verlangte. Diese Strukturen bleiben im Allgemeinen starr und werden nur von außen gezielt modifiziert und ergänzt. Der Mensch ist im Gegensatz dazu fähig, erkannte Logik in sein Datensystem einzubringen, so dass sie bereits im Rahmen der Mustererkennung- und Vervollständigung zum Einsatz kommt. Das Gehirn hat auch nur diese eine Methode, um Informationen zu speichern.

Apr
10

IDRS bedeutet intelligentes Datenrelationssystem und bezeichnet eine intelligente Verarbeitungsmethodik auf Computern (maschinelle Kognition) mit deren Entwicklung wir im Frühjahr 2000 begannen

Im IDRS ergibt sich die Gewichtung von Regeln an den Daten, die einander entsprechen. Eine zugeteilte Gewichtung ist nicht vorgesehen, das System stützt seine Erkenntnisse an dem, was ihm vorliegt. Daraus folgt, dass diese Informationen günstiger Weise im Detail stimmig und zutreffend sind. Aus unscharfen und widersprüchlichen Daten gehen ebensolche Erkenntnisse hervor. So arbeitet das IDRS genau nicht, Neuronale Netze tun das. Im Gegensatz zu diesen soll das IDRS seine Schlüsse lesbar mitteilen und nicht nur blind anwenden können.

Liegt eine stimmige, korrekte und umfassende Datenbasis für die Problemstellung vor, gelingt es dem IDRS hingegen solche Eingänge begründet abzuweisen, die den aus den Daten gewonnenen Erkenntnissen (Regeln) nicht entsprechen. Die Methode vereint Anforderungen an die Datenverarbeitung mit den Methoden maschineller Kognition.

Um trotz der Einschränkung flexibel genug mit z.B. Messdaten umzugehen, betrachtet das IDRS alle Informationen sehr feinkörnig, also in hoher Detailauflösung. Wo Fließkommawerte nicht übereinstimmen, trifft es in einem Rahmen auf ihre Ziffernfolgen zu. Das wird erkannt. Hier wie in den bisherigen Technologien verursacht die Komplexität der Werte und ihre Anzahl allerdings einen progressiv ansteigenden Verarbeitungs- und Speicheraufwand. Im Unterschied trainiert das IDRS an untergeordneten Problemstellungen, deren Regelkomplexe in Module überführt und zur Lösung komplexerer Aufgaben einzeln herangezogen werden können. Erkenntnisse Neuronaler Netze können nicht modularisiert werden ohne die komplette (unbekannte) Erkenntnisstruktur und deren Seiteneffekte mitzuschleppen.

Prozesse bringen (im Gegensatz zu Operationen der Mustererkennung und -Entsprechung) grundsätzlich einen so gesteigerten Datenumfang ein, dass ein einzelnes Neuronales Netz für die komplexe Steuerung überfordert ist. Darum setzt man für jeden Steuerungspunkt ein eigenes ein. Um das Verhalten von Personen oder Gesellschaften treffsicher vorherzusagen sind sie nicht geeignet, weil sie dazu Denkprozesse nachvollziehen müssten, die den Entscheidungen zugrunde liegen. Außerdem verfügen sie nicht über die Informationen und deren Interpretation, worauf diese Bewegungen basieren.

Gewissermaßen als Abfallprodukt bei der Erforschung maschineller Kognition wie sie das IDRS anwenden soll, entstand ein Schema womit sich ein System entwickeln ließe, das menschliches Verhalten auf Basis des Willenssystems analysieren und prognostizieren kann. Hintergrund: Zur Anwendung kommen dabei die Ergebnisse aus der Grundlagenuntersuchung, wie “Bedeutung” (Relevanz) durch Computer zu ermitteln und zu erfassen ist um Relevanz beim Bau eines problemspezifischen Folgerungsnetzwerks einzusetzen. In Menschen entstand dieses Bewusstsein im Lauf der biologischen und kulturellen Entwicklung die in der Ambivalenz zwischen “Bestand und Dynamik” beginnt und sich dann immer weiter differenzierte und abstrahierte, biologisch z.B. bis hin zum vorliegenden Triebsystem. Das lässt sich für die Erforschung von Trends nutzen, die im gesellschaftlichen Rahmen eher emotional/intuitiv als rational/logisch zustande kommen und auf die Erfüllung vernachlässigter Wohlbefindensfaktoren gerichtet sind, die das Triebsystem zu wenig speziell wiedergibt.

Das IDRS ist ein Grundsystem, das im Rahmen von Analyse und Synthese Mustererkennung und -vervollständigung bietet und darum als Datenbankserver ausgelegt, der auch (gewichtet) Ergebnisse zurückgibt, die er nicht in Eingangsdaten erhielt. Die Datenform ist so stark vereinfacht, dass damit jede bereits entwickelte höhere (Folgen, Listen, RDBS, XML, …) abbildbar ist. Eine Datenübernahme führt bereits auf dieser Ebene zu einer Verdichtung, da kein Wert und keine Zuordnung mehrfach vorkommt. Das ist essentiell für die Analyse und ihre Geschwindigkeit.
Neben den Aufgabengebieten klassischer KI-Systeme und noch weiteren (wie unten) , bietet sich das IDRS für eine neuartige Form der Softwareentwicklung an, die ihre Funktionalität an den Testdaten selbständig generiert.

Testszenarien geben heute Eingangs- und Ergebniswerte vor, an der die Funktionalität einer entwickelten Software geprüft wird. Diese Daten sind (sollten sein) signifikant und korrekt, daher wie geschaffen als Trainingshintergrund für ein Analysesystem, das daraus Regeln ableitet. Diese Regeln bilden dann die Funktionalität der Software ab. Das IDRS teilt sie konkret mit, auch in Form von Programmcode. Damit wird der Entwicklungsweg umgekehrt, die Programmlogik geht aus den Testdaten hervor. Vorteilhafterweise bleibt das Ergebnis im ganzen Entwicklungsprozess daran orientiert, so dass es nicht zu Seiteneffekten kommt, die bereits gelöste Problemstellungen stören, wie es heute an der Tagesordnung ist. Stellt sich ein Testfall selbst als fehlerhaft heraus, können alle mit seinen Daten spezifisch verbundenen Regeln identifiziert und eliminiert, gegebenenfalls manuell umformuliert werden um Trainingsaufwand einzusparen.

Das IDRS findet bei der Analyse auch Zusammenhänge, wie es nicht zu programmieren beabsichtigt war. Das stellt zum Einen höhere Anforderungen an die Testdaten, die dort und so variant sein sollten, wie es für den Wirkbetrieb zu erwarten ist. Zum Anderen automatisiert das System Zusammenhänge, die erkanntermaßen gelten aber von üblicher Programmierung nicht erfasst worden wären. Beispielhaft ist die Mehrfacheingabe von identischen oder voneinander ableitbaren Daten in unterschiedlichen Masken zu nennen.

Im Testbetrieb der Wirkumgebung klassifiziert das System neu einlangende Daten an der Stimmigkeit mit seinen Regeln. Eine administrative (personelle) Instanz bestimmt dann ob die Begründung für eine Abweisung ggf. weiterhin gültige Regel sein soll.

Komplexe Berechnungen pflegt man händisch ein, wenn zu erwarten ist, dass sich das IDRS zu lange mit der Erkennung aufhält. Das ist auch abhängig von den Rechen- und Speicherkapazitäten des Trainingssystems. Die Regelsyntax ist vor dem grundlegend simplen Aufbau der Datenstruktur sehr leicht verständlich und visuell ebenso klar darstellbar.

Weitere spezifische Anwendungen des IDRS

Eingabeunterstützung: Entspricht der Umfang eingegebener Daten erkannten Mustern, kann das IDRS die Inhalte noch offener Positionen vorbelegen und/oder fehlerverdächtige markieren.
Datenkompression: Daten, die in Regeln gefasst werden können, sind im Bestand verzichtbar. Die Daten des IDRS sind selbst optimiert angelegt. Jeder Aspekt kommt im System auch nur einmal vor.
Konsistenzanalyse: Gehorchen die meisten Daten erkannten Regeln, verbleiben für die weitere Analyse solche, die ihnen nicht genügen. Diese Bestandteile sind entweder fehlerhaft oder die Regelermittlung ist noch nicht so weit fortgeschritten, wie zur Abbildung erforderlich.
Entwicklung optimierter Algorithmen: Da das IDRS potentiell jede Datenübereinstimmung erkennt und in Regeln fasst, ist es geeignet bislang unberücksichtigte Zusammenhänge in Regeln zu formulieren. Daraus kann systemnaher Programmcode generiert werden.
Forschung: Ein IDRS mit entsprechendem Funktionshintergrund kann in der Datenanalyse zur Ermittlung noch unbekannter mathematischer Zusammenhänge eingesetzt werden. Messdaten empfehlen sich dem IDRS hingegen weniger, da sie unscharf und fehlerbehaftet sind, womit sie Zusammenhänge wiedergeben, die daraus nicht schlüssig erkennbar sind.

Bisherige KI-Anforderungen, die das IDRS potentiell erfüllt (spezifische Eignung):

  • Datamining (++)
  • Suchmaschine – Leit- und Suchsysteme für die Datenauswahl (+++)
  • Rechtschreibprüfungen und Thesauren (++)
  • Bilderkennung, Spracherkennung, Industrielle Qualitätssicherung (+-)
  • Erkennung von Angriffsschemata in Netzwerken (+)
  • Spam-/Virenschutz – Filtern von Datenübermittlungen auf Relevanz und Datensicherheit (+-)

In der Bearbeitung von signifikanten, regelhaften, scharfen, stimmigen und umfassenden Daten spielt das IDRS seine Stärke aus. Es ist darauf ausgelegt, kognitive (intelligente) Funktionalität in Datenverarbeitungsaufgaben der klassischen Form einzubringen. Dabei kann es sich nur auf die Erkenntnisse beziehen, die aus den Daten klar hervorgehen, so scharf sind diese dann aber auch. Damit ist es möglich, einzelne Spektren aus dem Gesamtdatenstand zu lösen, getrennt zu trainieren und die erlernte Funktionalität modular auch für weitere Analyse einzubinden. Das entspricht einem Konzept der Entwicklung, in der isoliert heranziehbaren Sachständen ihre innewohnende Logik schneller und genauer zu entlesen ist als aus der Gesamtbetrachtung. Bisherige KI-Systeme vermögen das nicht, sind aber auch geeigneter, unscharfe Daten zu behandeln. Das Training erfolgt dann an sehr vielen Stellungen mit dem einhergehenden Bearbeitungsaufwand. Dem IDRS genügen wenige Signifikante, die es aber abhängig von ihrer Relevanz und den Vorgaben weitgreifender und umfassender verfolgt. Das Grundproblem des progressiv ansteigenden Aufwands in der KI ist mit dem IDRS nicht gelöst sondern nur eingedämmt und kanalisiert.

Ein problembezogenes IDRS kann mit einem Funktionshintergrund ausgestattet werden, der der Aufgabenstellung entspricht und den es bei der Regelermittlung anwendet. Beispielhaft würde man Grundrechenfunktionen für

  • klassische Datenverarbeitungsaufgaben nicht trainieren sondern aus der Rechnerlogik beziehen
  • die Entwicklung von Algorithmen dem Befehlswortschatz (günstig: RISC/Assembler) gegenüberstellen
  • mathematische Lösungsfindung aufbauend (Addition->Subtraktion->Multiplikation -> …)
  • und in mehreren Zahlensystemen (Grundmengen/binär, dezimal, …) trainieren

Die Feinauflösung der Daten wird ebenfalls problembezogen angelegt um das System nicht mit Analysen zu belasten, die keine sachdienlichen Erkenntnisse versprechen oder deren Nutzen in ungünstigem Verhältnis zum Ermittlungsaufwand steht.

Durch Rückadaption des IDRS auf den Menschen beschäftigte ich mich zunehmend mit Werten, Emotionen und humaner Kognition, so wie einem darauf basierenden Denkmodell. Das hatte mich derart fasziniert, dass der technische Teil ein wenig ins Hintertreffen geriet. Während der Nutzen maschineller Kognition grundsätzlich nicht in Frage steht, muss sich im Markt dennoch jemand finden, der sie braucht.
Wir wollten, dass der Computer die Daten versteht.

Datamining wendet alle geeigneten Methoden an, aus den Daten eine Regelhaftigkeit zu ermitteln, die Grundlage zutreffender Prognosen und zielführender Steuerungseinflüsse ist. Dabei ist zwischen harten und weichen zu unterscheiden.
Weiche Methoden beziehen die Tatsache ein, dass die Daten ungenau, fehlerhaft und widersprüchlich sind wogegen harte nur an den Stellen Ergebnisse zeitigen, die exakte Übereinstimmungen oder signifikante Unterschiede aufzeigen.

Heuristische/statistische, neuronale und genetische Analyse sowie Bayessche Netze und weiche Clustering-Algorithmen kommen dabei zu Schlüssen, die schlecht bis nicht nachvollziehbar aber relativ flexibel und treffend anwendbar sind. Fuzzy Logik und sog. hartes Clustering ermittelt eng definierte Zusammenhänge bzw. einfache Wahrheiten wie sie entweder die Programmierung vorsah, zu speziell sind oder die auf der Hand liegen.

Das IDRS zählt zu den harten Methoden. An Relevanzmerkmalen orientiert verhält es sich in etwa wie eine Mischung aus Fuzzy Logik und hartem Clustering. Die Zusammenhänge sind nicht vordefiniert und werden aber auch nicht wahllos an den Übereinstimmungen festgestellt. Das ist ein Leistungsvorteil, der tiefere und flexiblere Analyse erlaubt. Das führt zu brauchbareren (stärker abstrahierten) Ergebnissen. Datamining ist davon abgesehen nicht die erste Domäne des IDRS, da falsche und unscharfe Daten die Analyse behindern. Hohes Datenvolumen ist ebenfalls kein Vorteil im Gegensatz zu dem, wessen weiche Verfahren bedürfen, deren Ergebnisse auf Wahrscheinlichkeit beruhen. Das IDRS wäre eine zusätzliche Methode für das Datamining mit eigener Qualität und schlagkräftiger, wenn es bereits beim Dateneingang zum Einsatz kam um die Schlüssigkeit zu bewahren.

… in der Biometrie, Für jedwede Bildanalyse braucht das IDRS einen Erfahrungsstand, der in einem vergleichsweise aufwändigen Entwicklungsprozess zu trainieren ist. Wie ein Kind an ansteigenden Fähigkeiten Helligkeitseindrücke, Umrisse, Farben, Formen, Objekte, Arrangements und Raumstellungen zu differenzieren lernt, ist es auch für das IDRS erforderlich, soll es Bildeindrücke an erkennbaren und ihm bekannten Merkmalen analysieren. Es kann auch um Erkenntnisse bereichert werden, die bereits formulierbar vorliegen. Neben diesem Unterschied ist es den weichen Methoden die dafür bisher zum Einsatz kommen unterlegen, würde beispielsweise ein Gesicht mit Bart nur unter höherem Aufwand wiedererkennen.

… der Qualitätssicherung (Produktion), Hierfür gilt in etwa dasselbe. Vorteil des IDRS ist allerdings, dass ihm die Vergleichsdaten (Optimalform) in Daten statt in Trainingsansichten zu übermitteln sind. Damit ist es leichter umzustellen. Das kann aber auch eine der KI vorgeschaltete Instanz, wie da der technische Stand ist, weiß ich nicht.

…der Datensicherheit (Spam- und Schädlingsabwehr) Menschlicher Einfallsreichtum ist vom IDRS am Stand der Hardwaretechnik nicht nachvollziehbar. Die Mischung der formulierbaren Merkmale wird allerdings erkannt. Auch hier liegen neuronale und genetische Analyse im Vorteil, weil sie flexibler und umfassender bewertet, wenn auch weniger genau.

…Datenleit- und Suchsysteme Welche Technologien die Suchmaschinenanbieter verwenden, ist unklar. IDRS berücksichtigt jedenfalls den thematischen Kontext von Suchbegriffen und klassifiziert die Inhalte auch daran.

Für nahezu jede über das Spielerische hinaus gehende marktwirksame Lösung ist das Entwicklungssystem mit
Datenbankhintergrund essentiell. Daran arbeiten wir. Was ohnedem machbar ist, findet im Markt entweder schon mehr oder weniger gereifte Realisierung vor oder zeigt im Wesentlichen Potentiale auf. Über ein hinzulernendes mathematisches Grundsystem als Proof of Concept musste ich mir einmal anhören: “Ich habe aber schon einen Taschenrechner”. Intelligenz ist ein problematisches Produkt, wer sie braucht erkennt es nicht so leicht.

Als Vertriebsweg hätten wir ein Onlineangebot gewählt um nicht veröffentlichen zu müssen, wie es funktioniert. Dienlich hierfür ist die Tatsache, dass Verknüpfungsdaten und Werte voneinander getrennt sein können. Das Datenbanksystem muss die Werte nicht kennen sondern nur den darüber liegenden Zuordnungskomplex. Das Online-Angebot ist an dieser Stelle also einigermaßen datensicher für den Kunden. Weder Serviceanbieter noch Lauscher kennen die Bezeichnungen und die Inhalte der Daten, die bleiben beim Client, wenn er es so will. Nur Zuordnungsdaten werden dann ausgetauscht.

Das Entwicklungssystem passt man an spezielle Erfordernisse an, indem man es mit einem Funktionshintergrund versieht oder dazu trainiert, der auf die speziellen Anforderungen ausgelegt ist. Das Frontend kann man fließend so gestalten, dass es den Anwender von der darunterliegenden Logik abschirmt. Die Ergebnisdaten werden auch so aufbereitet. Das System ist bereits so geplant, dass es in der Ein- und Ausgabe mit feinkörnig definierbaren Sichten arbeitet. Der Anpassungsaufwand hängt somit von der Problemstellung ab. Für eine allgemeine Datamining-Lösung nach heutigem Vorbild wäre er gering. Ein-
und Ausgabe gehen bereits über XML. Der Funktionsumfang ist in regulärer Programmierung vorzugeben.
Die Entwicklung von Standard- und Speziallösungen respektive die Unterstützung dabei wäre das (auch finanziell) interessantere Betriebsfeld, das sich aus der Präsenz eines IDRS-Systems ergibt.

Lizenzierung wäre auf dieser Ebene ein Dienstleistungsangebot für Ermittlungskapazitäten, Datenabfragen, Speicher- und Übertragungsvolumina von Null bis oben offen. Der Kunde kann darauf theoretisch ein Onlineangebot hosten denn Datensichten können auch (X)HTML-Seiten sein (ist es öffentlich, muss der Server die Datenwerte allerdings kennen).

Um *das* zu erreichen wären zwischen fünf und zehn Entwickler-Mannjahre anzusetzen, zuzüglich entsprechendem Testaufwand und Maschinenausstattung.

Feed Icon