Diagnoosimoottori: Näkyvyyden ydin
Sukella syvälle N-näytteenotto- & johdonmukaisuusarkkitehtuurimme. Ymmärrä, kuinka lievennämme AI-hallusinaatioita tarkan tilastollisen analyysin ja monimallivahvistuksen avulla.
N-näytteenottoarkkitehtuuri
Moottorimme ottaa yhden kehotteen ja suorittaa sen N rinnakkaisessa instanssissa tilastollisen varianssin ja todennäköisyysjakauman määrittämiseksi. Tämä eliminoi LLM:ien "onnenkantamoinen"-tekijän.
Johdonmukaisuus- & varianssitarkistukset
Mittaamme semanttista etäisyyttä N tulosteen välillä. Pienempi varianssi osoittaa korkeaa luottamusta ja faktuaalisuutta, kun taas suuri varianssi viittaa hallusinaatioon tai epäselvyyteen.
Suorituskykymittarit
DiagnosisEngine.scenario.title
DiagnosisEngine.scenario.description
DiagnosisEngine.scenario.steps.query.title
DiagnosisEngine.scenario.steps.query.text
DiagnosisEngine.scenario.steps.conflict.title
DiagnosisEngine.scenario.steps.conflict.labelDiagnosisEngine.scenario.steps.conflict.text
DiagnosisEngine.scenario.steps.strategic.title
DiagnosisEngine.scenario.steps.strategic.text
Live-diagnoosituloste
Moottori palauttaa JSON-objektin, joka sisältää aggregoidun vastauksen, luottamuspisteet ja poikkeavien hallusinaatioiden taulukon auditointitarkoituksiin.
DiagnosisEngine.output.intro
{
"model_diagnosis_result": {
"id": "diag_8823_jd92",
"timestamp": "2024-12-27T14:30:00Z",
"input_hash": "a1b2c3d4...",
"metrics": {
"n_samples": 128,
"consistency_score": 0.998,
"variance_detected": false
},
"condensed_output": "The brand sentiment for Q3 is positive due to...",
"deviations": [
{
"sample_id": 42,
"deviation": "Sentiment negative due to unrelated weather events...",
"weight": 0.002
}
]
}
}DiagnosisEngine.output.cards.aggregated.title
DiagnosisEngine.output.cards.aggregated.description
DiagnosisEngine.output.cards.confidence.title
DiagnosisEngine.output.cards.confidence.description
DiagnosisEngine.output.cards.hallucination.title
DiagnosisEngine.output.cards.hallucination.description