大语言模型会在蒸馏中“夹带”自己的偏好
《自然》15日发表的一项研究显示,大语言模型(LLM)可能会将某些自己的偏好“夹带私货”传授给其他算法,即使在训练数据中清除原始特征后,这些本不需要的特征,仍可能持续存在。在一个案例中,一个模型似乎通过数据中的隐含信号,将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明,在开发LLM时,需要进行更彻底的安全检查。
《自然》15日发表的一项研究显示,大语言模型(LLM)可能会将某些自己的偏好“夹带私货”传授给其他算法,即使在训练数据中清除原始特征后,这些本不需要的特征,仍可能持续存在。在一个案例中,一个模型似乎通过数据中的隐含信号,将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明,在开发LLM时,需要进行更彻底的安全检查。

在健康中国战略深入推进、国民健康素养持续提升的背景下,人体免疫力作为抵御病原入侵、维系机体健康稳态的核心能力,愈发受到全社会广泛关注,尤其中老年群体的免疫养护已成为健康老龄化的重要课题。国家自然科学基金委员会发布的《免疫力数字解码重大研究计...

当前,国内餐饮市场竞争日趋激烈,出海已从可选战略升级为头部品牌寻求增量的必要路径。然而,出海的餐饮品牌面临着市场适配、供应链重构、跨国合规、特许经营管理等多重挑战,商业模式本地化与全周期合规正成为餐饮品牌全球化扩张的关键要素。
人民网北京4月9日电 (记者乔业琼)据国家卫生健康委官网消息,根据《加强医学科研诚信专项治理的工作方案》相关工作部署,国家卫生健康委对各级卫生健康行政部门所属医疗卫生机构按照《科研失信行为调查处理规则》(国科发监〔2022〕221号)查实的...

近年来,中国正以惊人的速度重新定义其在全球市场的角色。当下,这个“中国身影”正在全球宠物食品领域掀起波澜。

记者4月7日从自然资源部获悉,中国第42次南极考察队成功完成我国首次南极冰层热水钻探试验,钻深达3413米,突破了国际极地热水钻探的2540米的最深纪录。
4月2日,中国银联在上海正式发布《智能体支付开放协议框架》,并成功实现5笔生产系统验证交易。用户在航旅纵横的AI出行助手中输入“请为我购买一张8月1日,从上海到北京的机票。”AI出行助手快速对比各渠道机票价格,给出航班建议,测试者选择其一后,由AI助手自动关联用户信息并使用交通银行信用卡完成购买。出票成功后,该航班出现在航旅纵横首页的待出行计划中(相关功能暂时仅面向白名单用户开放)。

2026年5月26日至28日,作为中国乳制品工业协会第32次年会重磅打造的“2026乳业嘉年华”将登陆成都世纪城新国际会展中心。在这场“有趣、有味、有能量”的全民健康派对中,伊利集团将携旗下六大事业部,以一座颠覆想象的“乳品「很行」乐园”惊艳亮相,用1000㎡的超大展区,为观众带来一场“游戏化全链路体验”的乳品探索之旅。
近日,工业和信息化部批准发布《YD/T 6770—2026人工智能关键基础技术具身智能基准测试方法》行业标准,为具身智能领域首份行业标准,将于6月1日正式实施,标志着具身智能评测迈入“有标可依”的新阶段。

通用智能人“通通”3.0版本亮相。北京通用人工智能研究院供图 人民网北京3月31日电 (记者赵竹青)3月29日,2026中关村论坛年会通用人工智能论坛在京举办,首个通用智能人“通通”3.0版本正式亮相。不同于传统大模型易产生“幻觉”与逻辑矛...