大语言模型会在蒸馏中“夹带”自己的偏好
《自然》15日发表的一项研究显示,大语言模型(LLM)可能会将某些自己的偏好“夹带私货”传授给其他算法,即使在训练数据中清除原始特征后,这些本不需要的特征,仍可能持续存在。在一个案例中,一个模型似乎通过数据中的隐含信号,将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明,在开发LLM时,需要进行更彻底的安全检查。
《自然》15日发表的一项研究显示,大语言模型(LLM)可能会将某些自己的偏好“夹带私货”传授给其他算法,即使在训练数据中清除原始特征后,这些本不需要的特征,仍可能持续存在。在一个案例中,一个模型似乎通过数据中的隐含信号,将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明,在开发LLM时,需要进行更彻底的安全检查。
科技日报北京3月23日电(记者张梦然)瑞典查尔姆斯理工大学领导的研究团队取得一项关键突破,首次利用植入式神经电极技术与人工智能(AI)算法,直接从膝上截肢患者残存的神经信号中解码出其控制腿部(包括膝盖、脚踝乃至脚趾)运动的意图。这项研究为开发新一代能够实现直观、自然控制的智能假肢奠定了重要基础,相关成果在最新一期《自然·通讯》杂志上发表。
科技日报讯(记者张梦然)根据发表在新一期《阿尔茨海默病与痴呆症:转化研究与临床干预》上的研究,一项为期5到6周的认知处理速度训练,可以帮助65岁及以上老年人在未来长达20年中,显著降低罹患痴呆症的风险。