- Startseite
- Skills
- Prompting
- Datenextraktion-Prompt
Datenextraktion-Prompt
Extrahieren Sie strukturierte Daten aus unstrukturiertem Text mit konsistenten Schemas und zuverlaessigem Parsing.
Das Problem
Unstrukturierter Text — E-Mails, Logs, Dokumente, Support-Tickets — enthaelt wertvolle Daten, die in natuerlicher Sprache vergraben sind. Manuelle Extraktion ist langsam und fehleranfaellig. Regex scheitert an der Variabilitaet menschlichen Schreibens. KI excelliert beim Verstehen von Kontext und Extrahieren strukturierter Daten, aber nur wenn Sie das Ausgabeschema praezise definieren und Grenzfaelle vorab behandeln.
Der Prompt
Extrahiere strukturierte Daten aus folgendem Text. Gib NUR gueltiges JSON zurueck, das dem Schema unten entspricht.
SCHEMA:
{
"entitaeten": [{
"feld1": "string — [Beschreibung und Formatregeln]",
"feld2": "string | null — [Beschreibung, null wenn nicht gefunden]",
"feld3": "number — [Beschreibung, Einheit, Bereich]",
"konfidenz": "number — 0.0-1.0, wie sicher du bei dieser Extraktion bist"
}],
"nicht_zugeordnet": "string[] — relevanter Text, der nicht ins Schema passt"
}
EXTRAKTIONSREGELN:
- Extrahiere ALLE passenden Entitaeten, nicht nur die erste
- Verwende null fuer Felder, die im Text nicht vorhanden sind, rate niemals
- Normalisiere Daten ins ISO-8601-Format (JJJJ-MM-TT)
- Normalisiere Waehrungen zu numerischen Werten mit Waehrungscode
- Bei mehrdeutigen Feldern: extrahieren UND Konfidenz unter 0.7 setzen
- Nicht zugeordneten relevanten Text erfassen, damit nichts stillschweigend verloren geht
TEXT ZUR EXTRAKTION:
"""
[fuege deinen unstrukturierten Text hier ein]
"""
Beispielausgabe
{
"entitaeten": [
{
"unternehmen": "Acme Corp",
"kontakt_email": "jane@acme.com",
"deal_wert": 45000,
"waehrung": "USD",
"abschlussdatum": "2026-06-15",
"phase": "verhandlung",
"konfidenz": 0.95
},
{
"unternehmen": "TechStart GmbH",
"kontakt_email": null,
"deal_wert": 12000,
"waehrung": "EUR",
"abschlussdatum": "2026-07-01",
"phase": "angebot",
"konfidenz": 0.82
}
],
"nicht_zugeordnet": ["Moegliche Partnerschaft mit DataFlow erwaehnt, aber keine Deal-Details angegeben"]
}
Wann verwenden
Verwenden Sie Datenextraktions-Prompts fuer die Verarbeitung von E-Mails in CRM-Eintraege, das Parsen von Logdateien in strukturierte Vorfaelle, die Konvertierung von Freitextberichten in Datenbankeintraege oder jeden Workflow, bei dem unstrukturierte Eingaben zu strukturierter Ausgabe werden muessen.
Profi-Tipps
- Konfidenzwert einbeziehen — damit koennen Sie hochkonfidente Extraktionen automatisch akzeptieren und niedrigkonfidente zur menschlichen Pruefung markieren.
- “Nicht zugeordnet”-Feld hinzufuegen — Text, der nicht ins Schema passt, sollte nicht stillschweigend verworfen werden; erfassen Sie ihn zur Pruefung.
- Normalisierungsregeln angeben — “alle Daten ins ISO 8601 konvertieren” verhindert Formatinkonsistenz ueber Extraktionen hinweg.
- Mit unordentlichen Echtdaten testen — das Modell verarbeitet sauberen Text gut; testen Sie mit Abkuerzungen, Tippfehlern und unvollstaendigen Eintraegen.