Der Begriff „Natural Language Processing (NLP)“ bezeichnet die automatisierte Verarbeitung, Analyse und Generierung natürlicher Sprache durch Computersysteme. Ziel ist es, Texte (und - in Verbindung mit Sprachmodulen - auch gesprochene Sprache) so zu verstehen, zu strukturieren und nutzbar zu machen, dass Informationen extrahiert, Abläufe automatisiert und die Interaktion zwischen Mensch und Software verbessert werden – etwa in Chatbots, semantischer Suche, Dokumentenanalysen oder Übersetzungsprozessen.
Tokenisierung & Segmentierung: Aufteilung von Text in Sätze, Wörter oder Subwörter als Basis für die Analyse.
Lemmatisierung/Stemming & Normalisierung: Reduktion auf Grundformen, Rechtschreibkorrektur, Vereinheitlichung von Schreibweisen.
Part-of-Speech-Tagging & Parsing: Grammatische Kennzeichnung und Syntaxanalyse zur Strukturierung von Sätzen.
Named-Entity-Recognition (NER) & Entity Linking: Erkennung von Namen, Orten, Organisationen und Verknüpfung mit Wissensquellen.
Intent-Erkennung & Slot-Filling: Ermittlung von Absichten und relevanten Parametern für Chatbots und Assistenten.
Textklassifikation & Kategorisierung: Automatisches Zuordnen von Texten zu Themen, Labels oder Workflows.
Sentiment- & Emotionsanalyse: Ermittlung von Stimmungslagen (positiv/negativ/neutral) und Emotionen.
Schlüsselwort- & Themenextraktion (Topic Modeling): Identifikation zentraler Begriffe und Themen in großen Textmengen.
Zusammenfassung (extraktiv/abstraktiv): Verdichtung langer Dokumente auf die wesentlichen Inhalte.
Fragebeantwortung & Informationsextraktion: Beantwortung freier Fragen und Extraktion von Fakten, Relationen und Ereignissen.
Maschinelle Übersetzung & Sprachidentifikation: Automatisierte Übertragung zwischen Sprachen und Erkennung der Ausgangssprache.
Semantische Suche & Embeddings: Bedeutungsbasierte Suche und Vektorrepräsentationen für „ähnliche“ Inhalte.
Textgenerierung (NLG): Automatisches Erzeugen von Texten, z. B. Zusammenfassungen, Antworten oder Berichte.
PII-Erkennung & Anonymisierung: Aufspüren personenbezogener Daten und Unkenntlichmachung für Compliance/DSGVO.
Sprachnahe Module (optional): Spracherkennung (ASR/STT) und Sprachsynthese (TTS) in Kombination mit NLP-Workflows.
Ein Service-Desk priorisiert und routet eingehende E-Mails automatisch nach Thema und Dringlichkeit.
Ein Chatbot versteht Kundenanliegen (Intent) und liefert fundierte, kontextbezogene Antworten.
Ein Rechts- oder Compliance-Team extrahiert aus Verträgen Klauseln, Fristen und Risiken.
Ein Unternehmen führt semantische Suche über Wissensdatenbanken, Handbücher und Ticketsysteme ein.
Marketing wertet Produktbewertungen aus und misst die Stimmung zu Marken und Kampagnen.
Finanz- oder Beschaffungsteams lesen Rechnungen/Belege aus (OCR + NLP) und befüllen ERP-Felder.
HR-parst Lebensläufe, extrahiert Qualifikationen und matcht Kandidaten auf Stellenprofile.
Meeting-Protokolle werden aus Transkripten automatisch zusammengefasst und mit To-dos versehen.