Gi
Giskard
AI Company Analysis
No AI analysis yet.
Sentiment Trend
Related Articles (2)
面对偏差和幻觉,推理并不会让大语言模型(LLM)更健壮
Silicon.fr
人工智能
网络安全
2026-04-17
neutral
法国企业 Giskard 与 Google DeepMind 发布 Phare 基准(Potential Harm Assessment & Risk Evaluation)称:LLM 越新通常越能抵抗偏见、幻觉与越狱,但在“信息操纵/失实(disinformation)”与部分幻觉场景上代际差距并
偏见、幻觉……法语中最“稳健”的大语言模型
Silicon.fr
人工智能
科研
2026-04-16
positive
法国公司Giskard与Google DeepMind合作开发的基准测试Phare显示,主流大语言模型在英语表现通常优于法语,但存在例外。测试涵盖偏见、幻觉、抗越狱等10个模块,结果显示:在偏见检测中,Llama模型在法语表现反超英语;在事实性方面,Gemini模型领先;而Anthropic的Cla