Künstliche Intelligenz (KI) und ihre Teilbereiche Maschinelles Lernen (ML) und Deep Learning (DL) spielen in der Datenwissenschaft eine wichtige Rolle. Data Science ist ein umfassender Prozess, der Vorverarbeitung, Analyse, Visualisierung und Vorhersage umfasst. Lassen Sie uns tief in die KI und ihre Teilmengen eintauchen.
Künstliche Intelligenz (KI) ist ein Zweig der Informatik, der sich mit dem Bau intelligenter Maschinen befasst, die in der Lage sind, Aufgaben auszuführen, die normalerweise menschliche Intelligenz erfordern. KI ist hauptsächlich in die folgenden drei Kategorien unterteilt
-
Künstliche Narrow Intelligence (ANI)
-
Künstliche Allgemeine Intelligenz (AGI)
-
Künstliche Superintelligenz (ASI).
Eine schmale KI, die manchmal auch als „schwache KI“ bezeichnet wird, führt eine einzelne Aufgabe auf eine bestimmte Art und Weise optimal aus. Beispielsweise wird ein Kaffeeautomat ausgeraubt, der eine genau definierte Abfolge von Aktionen ausführt, um Kaffee zuzubereiten. AGI hingegen, die auch als „starke KI“ bezeichnet wird, übernimmt eine Vielzahl von Aufgaben, bei denen es darum geht, wie ein Mensch zu denken und zu argumentieren. Einige Beispiele sind Google Assist, Alexa und Chatbots, die Natural Language Processing (NPL) verwenden. Künstliche Superintelligenz (ASI) ist die fortschrittliche Version, die die menschlichen Fähigkeiten übertrifft. Es kann kreative Aktivitäten wie Kunst, Entscheidungsfindung und emotionale Beziehungen ausführen.
Schauen wir uns nun an Maschinelles Lernen (ML). Es handelt sich um eine Teilmenge der KI, die die Modellierung von Algorithmen umfasst, die dabei hilft, Vorhersagen auf der Grundlage der Erkennung komplexer Datenmuster und -mengen zu treffen. Beim maschinellen Lernen geht es darum, Algorithmen in die Lage zu versetzen, aus den bereitgestellten Daten zu lernen, Erkenntnisse zu sammeln und anhand der gesammelten Informationen Vorhersagen zu zuvor nicht analysierten Daten zu treffen. Es gibt verschiedene Methoden des maschinellen Lernens
-
Überwachtes Lernen (schwache KI – aufgabengesteuert)
-
nicht überwachtes Lernen (starke KI – datengesteuert)
-
halbüberwachtes Lernen (starke KI – kostengünstig)
-
verstärktes maschinelles Lernen. (Starke KI – aus Fehlern lernen)
Überwachtes maschinelles Lernen nutzt historische Daten, um Verhalten zu verstehen und Zukunftsprognosen zu formulieren. Hier besteht das System aus einem bestimmten Datensatz. Es ist mit Parametern für die Ein- und Ausgabe beschriftet. Und wenn die neuen Daten eintreffen, analysiert der ML-Algorithmus die neuen Daten und liefert die genaue Ausgabe auf der Grundlage der festgelegten Parameter. Überwachtes Lernen kann Klassifizierungs- oder Regressionsaufgaben durchführen. Beispiele für Klassifizierungsaufgaben sind Bildklassifizierung, Gesichtserkennung, E-Mail-Spam-Klassifizierung, Identifizierung von Betrugserkennung usw. und für Regressionsaufgaben sind Wettervorhersagen, Vorhersage des Bevölkerungswachstums usw.
Beim unüberwachten maschinellen Lernen werden keine klassifizierten oder gekennzeichneten Parameter verwendet. Der Schwerpunkt liegt auf der Entdeckung versteckter Strukturen aus unbeschrifteten Daten, um Systemen dabei zu helfen, eine Funktion richtig abzuleiten. Sie nutzen Techniken wie Clustering oder Dimensionsreduktion. Beim Clustering werden Datenpunkte mit ähnlichen Metriken gruppiert. Es ist datengesteuert und einige Beispiele für Clustering sind Filmempfehlungen für Benutzer in Netflix, Kundensegmentierung, Kaufgewohnheiten usw. Einige Beispiele für Dimensionsreduzierung sind Feature-Ermittlung und Big-Data-Visualisierung.
Beim halbüberwachten maschinellen Lernen werden sowohl gekennzeichnete als auch unbeschriftete Daten verwendet, um die Lerngenauigkeit zu verbessern. Halbüberwachtes Lernen kann eine kostengünstige Lösung sein, wenn sich die Kennzeichnung von Daten als teuer erweist.
Reinforcement Learning unterscheidet sich deutlich vom überwachten und unbeaufsichtigten Lernen. Man kann es als einen Prozess des Versuchs und Irrtums definieren, der schließlich zu Ergebnissen führt. Dies wird durch das Prinzip des iterativen Verbesserungszyklus erreicht (um aus Fehlern der Vergangenheit zu lernen). Reinforcement Learning wurde auch verwendet, um Agenten autonomes Fahren in simulierten Umgebungen beizubringen. Q-Learning ist ein Beispiel für Reinforcement-Learning-Algorithmen.
Weiter geht es mit Deep Learning (DL), Es handelt sich um eine Teilmenge des maschinellen Lernens, bei der Sie Algorithmen erstellen, die einer mehrschichtigen Architektur folgen. DL verwendet mehrere Ebenen, um schrittweise Features höherer Ebenen aus der Roheingabe zu extrahieren. Beispielsweise können bei der Bildverarbeitung niedrigere Schichten Kanten identifizieren, während höhere Schichten die für einen Menschen relevanten Konzepte wie Ziffern, Buchstaben oder Gesichter identifizieren können. DL wird im Allgemeinen als tiefes künstliches neuronales Netzwerk bezeichnet. Hierbei handelt es sich um Algorithmensätze, die für Probleme wie Tonerkennung, Bilderkennung, Verarbeitung natürlicher Sprache usw. äußerst genau sind.
Zusammenfassend deckt Data Science KI ab, zu der auch maschinelles Lernen gehört. Allerdings umfasst maschinelles Lernen selbst eine weitere Teiltechnologie, nämlich Deep Learning. Dank der KI ist sie in der Lage, immer schwierigere Probleme (z. B. Krebs besser als Onkologen zu erkennen) besser zu lösen als Menschen.