|

中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测

来源：同花顺7x24快讯

2025-03-19 16:16:27

为摸清大模型的幻觉现状，推动大模型应用走深走实，中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作，发起大模型幻觉测试。本轮幻觉测试工作将以大语言模型为测试对象，涵盖了事实性幻觉和忠实性幻觉两种幻觉类型。测试数据包含7000余条中文测试样本，测试形式包括对应于忠实性幻觉检测的信息抽取与知识推理两类题型，以及对应事实性幻觉检测的事实判别题型。总体涉及人文科学、社会科学、自然科学、应用科学和形式科学五种测试维度。（中国信通院）

相关阅读

和胜股份：宾建存、李清已减持1.96%

同花顺7x24快讯

2026-03-17

新莱福：中信证券减持0.40%股份计划完成

同花顺7x24快讯

2026-03-17

派克新材：2025年净利润2.52亿元，同比下降4.37%

同花顺7x24快讯

2026-03-17

南向资金今日净卖出114.81亿港元盈富基金遭净卖出居前

同花顺7x24快讯

2026-03-17

九源基因：JY47注射液新药临床试验申请获国家药监局临床试验默示许可

同花顺7x24快讯

2026-03-17

昭衍新药今日跌停，有4家机构专用席位净卖出2.02亿元

同花顺7x24快讯

2026-03-17

特别推荐

消费拐点出现了吗？

证券之星资讯

2026-03-17

午后，突发跳水！两大原因找到

证券之星资讯

2026-03-17

打新必看 | 3月18日一只新股申购

证券之星资讯

2026-03-17

首页股票财经基金导航

举报专区联系我们

证券之星 Copyright © 1996-2026年

数据解析

工具

专题活动