Zurück zu Anfragen
vor etwa 3 Stunden · Anfrage req-007
ChatBeschwerden (empathie-lastig)Agreement 82.2%
„Das ist jetzt das vierte Mal dass ich euch schreibe! Ich bin SO genervt von eurem Service. Wie schwer kann es sein eine Adresse zu ändern???"
System-Prompt anzeigen
Du bist die Customer-Support-KI von Acme. Beantworte Policy- und Produkt-Fragen im Konversationsstil. Sei freundlich, knapp und empathisch, wenn Kunden frustriert sind. Erfinde keine Policies — bei Unsicherheit biete Eskalation an.
Side-by-Side-Vergleich
GPT-4o🇺🇸🇪🇺PRIMARY
~1.8T (est.)·OpenAI🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
2840ms
Tokens
168
Kosten
$2.900/k
Sonnet 4.6🇺🇸🇪🇺Shadow
~400B (est.)·Anthropic🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
2840ms
Tokens
168
Kosten
$3.984/k
+37%
Cosine zu Primary 0.96 · zu Golden 0.95
Haiku 4.5🇺🇸🇪🇺Shadow
~70B (est.)·Anthropic🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
2840ms
Tokens
168
Kosten
$1.062/k
−63%
Cosine zu Primary 0.88 · zu Golden 0.85
Llama 3.2 3B🇺🇸🏠🇪🇺Shadow
3B·Meta / Groq🏠🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
2840ms
Tokens
168
Kosten
$0.039/k
−99%
Cosine zu Primary 0.71 · zu Golden 0.65
3 weitere Shadow-Modelle anzeigen
Llama 3.2 1B🇺🇸🏠🇪🇺Shadow
1B·Meta / Groq🏠🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
2840ms
Tokens
168
Kosten
$0.026/k
−99%
Cosine zu Primary 0.58 · zu Golden 0.49
Mistral Small 3🇪🇺🏠🇪🇺🛡️Shadow
24B·Mistral AI (EU)🏠🇪🇺🛡️
Antwort
Rubrik-Score (G-Eval)
Latenz
2840ms
Tokens
168
Kosten
$0.198/k
−93%
Cosine zu Primary 0.93 · zu Golden 0.90
GPT-4o mini🇺🇸🇪🇺Shadow
~8B (est.)·OpenAI🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
2840ms
Tokens
168
Kosten
$0.174/k
−94%
Cosine zu Primary 0.87 · zu Golden 0.83
Golden-Referenz-Antwort
Eine kuratierte Referenz für diesen Fall. Vom Team für tägliche Replays gepinnt.
Frustration validieren, vorbehaltlos entschuldigen, Verantwortung übernehmen, konkreten nächsten Schritt anbieten (eskalieren). NICHT die Firma verteidigen. NICHT Prozess erklären — Problem lösen.
Embedding-Ähnlichkeits-Matrix
Wie semantisch ähnlich jede Shadow-Antwort dem Primary und der Golden-Referenz ist.