近日,LMSYS组织的大模型竞技场(Chatbot Arena)发布了最新的榜单更新,LMSYS Chatbot Arena 排行榜上总排名11超过了所有开源模型,包括Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B等,荣获全球开源模型榜首的荣誉。
DeepSeek-V2-0628相较于0507开源 Chat 版本,在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。
Chatbot Arena是一个全球公认的权威大模型盲测平台,采用人工盲测的方式,确保评测的公正性。在这次评比中,DeepSeek-V2-0628在难问题(Hard Prompt)、代码(Code)、长问题(Longer Query)和数学(Math)等分项上均展现出世界级的长难问题解决能力,与GPT-4-Turbo-0409和Claude3Opus等顶尖模型处于同一水平。
DeepSeek-V2-0628不仅在国际舞台上表现突出,在国内模型的评比中也名列前茅,排名国内所有模型第二位,展现了其强大的竞争力。此外,DeepSeek-V2-0628已于2024年6月28日上线,提供API和网页端服务,价格极具竞争力。