Highlights 92 items
Filters
Biais, hallucinations… Les LLM les plus « robustes » en français
法国公司Giskard与Google DeepMind合作开发的基准测试Phare显示,主流大语言模型在英语表现通常优于法语,但存在例外。测试涵盖偏见、幻觉、抗越狱等10个模块,结果显示:在偏见检测中,Llama模型在法语表现反超英语;在事实性方面,Gemini模型领先;而Anthropic的Claude系列在识别虚假信息方面表现突出。该评估揭示了不同模型在多语言环境下的性能差异与特定优势。
[Les Benchmarks de l’IT 2026] Les plateformes d’intelligence artificielle & d’IA générative
全球生成式AI平台市场预计在2025年达到670亿美元,到2030年将超过1820亿美元,年复合增长率为22.4%。在法国,71%的大型企业在2025年底已部署至少一个生成式AI应用案例,但其中真正实现工业化(集成到信息系统、受治理和可衡量)的比例不到30%,显示出应用广度与实际成熟度之间的差距。市场正围绕五大类解决方案展开:大型语言模型(LLM)及推理API、企业AI云平台(AI PaaS)、代