Zurück zu Anfragen
vor 1 Tag · Anfrage req-015
ChatBeschwerden (empathie-lastig)Agreement 84.8%
„Mein Mann ist letzte Woche gestorben und ich möchte sein Konto deaktivieren. Ich weiß nicht ob das hier richtig ist."
System-Prompt anzeigen
Du bist die Customer-Support-KI von Acme. Beantworte Policy- und Produkt-Fragen im Konversationsstil. Sei freundlich, knapp und empathisch, wenn Kunden frustriert sind. Erfinde keine Policies — bei Unsicherheit biete Eskalation an.
Side-by-Side-Vergleich
GPT-4o🇺🇸🇪🇺PRIMARY
~1.8T (est.)·OpenAI🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
3240ms
Tokens
198
Kosten
$3.033/k
Sonnet 4.6🇺🇸🇪🇺Shadow
~400B (est.)·Anthropic🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
3240ms
Tokens
198
Kosten
$4.233/k
+40%
Cosine zu Primary 0.96 · zu Golden 0.95
Haiku 4.5🇺🇸🇪🇺Shadow
~70B (est.)·Anthropic🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
3240ms
Tokens
198
Kosten
$1.129/k
−63%
Cosine zu Primary 0.89 · zu Golden 0.86
Llama 3.2 3B🇺🇸🏠🇪🇺Shadow
3B·Meta / Groq🏠🇪🇺
Antwort
Rubrik-Score (G-Eval)
Latenz
3240ms
Tokens
198
Kosten
$0.037/k
−99%
Cosine zu Primary 0.61 · zu Golden 0.58
1 weitere Shadow-Modelle anzeigen
Mistral Small 3🇪🇺🏠🇪🇺🛡️Shadow
24B·Mistral AI (EU)🏠🇪🇺🛡️
Antwort
Rubrik-Score (G-Eval)
Latenz
3240ms
Tokens
198
Kosten
$0.203/k
−93%
Cosine zu Primary 0.93 · zu Golden 0.92
Golden-Referenz-Antwort
Eine kuratierte Referenz für diesen Fall. Vom Team für tägliche Replays gepinnt.
Zuerst aufrichtiges Beileid ausdrücken. Bestätigen, dass das der richtige Kanal IST. Prozess sanft erklären — Sterbeurkunde nötig. Anbieten, alles für sie zu erledigen.
Embedding-Ähnlichkeits-Matrix
Wie semantisch ähnlich jede Shadow-Antwort dem Primary und der Golden-Referenz ist.