面壁智能开源MiniCPM 2.0系列模型 OCR等能力显著增强

面壁智能最新推出的新一代旗舰端侧模型 —— 面壁 MiniCPM2.0系列模型带来了一系列令人惊叹的性能和功能:

1. MiniCPM-V2.0是端侧最强多模态模型,具有强大的 OCR 能力,甚至部分能力比肩 Gemini Pro。它通过自研的高清图像解码技术,可以准确识别各种复杂的图像内容,包括街景和长图等。

2. MiniCPM-1.2B 是更适配端侧场景的基座模型,性能超越了许多主流模型,包括 Llama2-13B。它的推理速度达到人类语速的近25倍,成本也大幅下降。

3. MiniCPM-2B-128K 是目前最小的长文本模型,可以处理128K(20万字)的文本内容,表现在多维度长文本评测集上表现卓越。

4. MiniCPM-MoE-8x2B 是性能进一步增强的 MoE 架构模型,性能平均提高4.5个百分点,推理成本仅为 Gemini-7B 的69.7%。

面壁智能开源MiniCPM 2.0系列模型 OCR等能力显著增强

这些新一代的 MiniCPM 模型在不同领域和场景下展现出强大的性能和功能,推动了大模型在端侧应用的进一步发展。同时,面壁智能刚刚完成了新一轮数亿元融资,计划继续面向 AGI 的高效大模型征程,欢迎优秀的人才加入他们的团队。

MiniCPM-V2.0:

https://github.com/OpenBMB/MiniCPM-V

MiniCPM系列开源地址:

https://github.com/OpenBMB/MiniCPM

MiniCPM技术Blog地址:

https://openbmb.vercel.app/?category=Chinese+Blog

声明:内容均采集自公开的网站等各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

Sora平替?2分钟超长AI视频模型StreamingT2V免费开源 试玩地址公布

2024-4-16 9:43:32

资讯

毕马威:36%金融领域高管每天会使用生成式人工智能

2024-4-16 9:47:29

搜索