昆仑万维发布了两款全新的奖励模型 Skywork-Reward-Gemma-2-27B 和 Skywork-Reward-Llama-3.1-8B。在奖励模型评估基准 RewardBench 上,这两款模型分别位列排行榜上的第一和第三位。
相关链接如下:
RewardBench 排行榜:https://huggingface.co/spaces/allenai/reward-bench
27B 模型地址:https://huggingface.co/Skywork/Skywork-Reward-Gemma-2-27B
8B 模型地址:https://huggingface.co/Skywork/Skywork-Reward-Llama-3.1-8B
偏序数据地址:https://huggingface.co/collections/Skywork/skywork-reward-data-collection-66d7fda6a5098dc77035336d