零一万物今日宣布开源 Yi-Coder 系列模型,该模型是Yi 系列模型家族中的编程助手。
Yi-Coder 系列模型专为编码任务而生,提供 1.5B 和 9B 两种参数。其中,Yi-Coder-9B 的表现号称“优于其他 10B 参数以下的模型”,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至能够“与 DeepSeek-Coder 33B 相媲美”。
据介绍,Yi-Coder 能够处理最长 128K tokens 的上下文内容,适用于复杂项目级代码的理解和生成。Yi-Coder 还支持 52 种主要编程语言。
'java', 'markdown', 'python', 'php', 'java', 'c++', 'c#', 'c', 'type', 'html', 'go', 'java_server_pages', 'dart', 'objective-c', 'kotlin', 'tex', 'swift', 'ruby', 'sql', 'rust', 'css', 'yaml', 'matlab', 'lua', 'json', 'shell', 'visual_basic', 'scala', 'rmarkdown', 'pascal', 'fortran', 'haskell', 'assembly', 'perl', 'julia', 'cmake', 'groovy', 'ocaml', 'powershell', 'elixir', 'clojure', 'makefile', 'coffee', 'erlang', 'lisp', 'toml', 'batchfile', 'cobol', 'dockerfile', 'r', 'prolog', 'verilog'
根据零一万物官方测试,Yi-Coder-9B-Chat 在 HumanEval 和 MBPP 的通过率分别达到了 85.4% 和 73.8%。此外,Yi-Coder 9B 在 CRUXEval-O 的准确率在开源 Coder 模型中首次达到了 50% 以上。
Yi-Coder在代码编辑和补全能力方面同样强劲,在CodeEditorBench的评测中取得了优异的成绩。在长序列建模和数学推理能力方面,Yi-Coder也展现了强大的性能,无论是在长文本理解还是数学问题求解上,均有着出色的表现。
项目地址:https://github.com/01-ai/Yi-Coder