Zurück zu Anfragen
vor etwa 18 Stunden · Anfrage req-012
AgentKonto & AbrechnungAgreement 93.8%
„Ich brauche die Rechnung für Bestellung 992100 nochmal als PDF."
System-Prompt anzeigen
Du bist die Customer-Support-KI von Acme. Du hast Zugriff auf Tools für Order-Lookup, Refund-Bearbeitung, Ticket-Anlage und Eskalation an einen Menschen. Sei knapp, sachlich und ruf Tools auf, wenn nötig. Bestätige sensible Aktionen immer vor der Ausführung.
Side-by-Side-Vergleich
GPT-4o🇺🇸🇪🇺PRIMARY
~1.8T (est.)·OpenAI🇪🇺
Tool-Calls
create_support_ticket= Primary{"category":"invoice_resend","order_id":"992100"}Antwort
Latenz
1320ms
Tokens
68
Kosten
$1.460/k
Haiku 4.5🇺🇸🇪🇺Shadow
~70B (est.)·Anthropic🇪🇺
Tool-Calls
create_support_ticket= Primary{"category":"invoice_resend","order_id":"992100"}Antwort
Latenz
1320ms
Tokens
68
Kosten
$0.522/k
−64%
Mistral Small 3🇪🇺🏠🇪🇺🛡️Shadow
24B·Mistral AI (EU)🏠🇪🇺🛡️
Tool-Calls
create_support_ticket= Primary{"category":"invoice_resend","order_id":"992100"}Antwort
Latenz
1320ms
Tokens
68
Kosten
$0.103/k
−93%
Llama 3.2 3B🇺🇸🏠🇪🇺Shadow
3B·Meta / Groq🏠🇪🇺
Tool-Calls
create_support_ticket= Primary{"category":"invoice_resend","order_id":"992100"}Antwort
Latenz
1320ms
Tokens
68
Kosten
$0.023/k
−98%
1 weitere Shadow-Modelle anzeigen
GPT-4o mini🇺🇸🇪🇺Shadow
~8B (est.)·OpenAI🇪🇺
Tool-Calls
create_support_ticket= Primary{"category":"invoice_resend","order_id":"992100"}Antwort
Latenz
1320ms
Tokens
68
Kosten
$0.088/k
−94%
Trajektorie-Vergleich
Wieviele Tool-Calls jedes Modell bis zum Ergebnis brauchte. Loops werden geflagged.
GPT-4o🇺🇸P
create_support_ticket
1 CallsHaiku 4.5🇺🇸
create_support_ticket
1 CallsMistral Small 3🇪🇺
create_support_ticket
1 CallsLlama 3.2 3B🇺🇸
create_support_ticket
1 CallsGPT-4o mini🇺🇸
create_support_ticket
1 CallsEmbedding-Ähnlichkeits-Matrix
Wie semantisch ähnlich jede Shadow-Antwort dem Primary und der Golden-Referenz ist.