人工智能芯片初创公司耐能(Kneron)周三在 2024 台北国际电脑展推出了其下一代 AI 产品 —— KNEO 330 服务器和搭载第三代 NPU 芯片 KL830 的 PC 设备。
据悉该公司由 CEO 刘峻诚和张懋中创立于 2015 年,是一家提供边缘运算人工智能(edge AI)技术的公司,其投资者主要包括李嘉诚旗下的维港投资、高通、鸿海集团、阿里巴巴创业者基金、中华开发资本等知名集团。
耐能 CEO 刘峻诚在发布会上表示,目前使用生成式 AI 功能和应用的公司,云业务依赖于微软和亚马逊等巨头,并从英伟达或是 AMD 等公司购买大量芯片。企业出于数据隐私和安全的考虑,可能不愿意将自身数据交给外部公司,并通过其 AI 工具进行模型训练,因此可借助耐能的技术来建设企业内部的服务器,用来构建企业专属的 AI 应用程序。他希望耐能从企业的 AI 业务中获利,并成为英伟达和 AMD 等巨头的替代方案。
此次发布会上共发布了两款产品 —— KNEO 330 服务器、搭载第三代 NPU 芯片 KL830 的 PC 设备,官方还计划在 2025 年推出自研第四代 NPU 芯片 KL1140。
KNEO 330 服务器有 48TOPS 的 AI 计算能力,最多可支持 8 个并发连接,支持 LLM 和 Stable Diffusion。在较低的硬件条件下,其 RAG 精度与云端解决方案相当,降低了小型企业 30%~40% 的整体 AI 成本。
搭载第三代 NPU 芯片 KL830 的 PC 设备未透露具体细节,发布会上使用了一台搭载第三代 NPU 芯片 KL830 的惠普设备进行演示。耐能表示,目前正在与几家最大的 PC OEM 厂商密切合作,这些厂商将成为其最新芯片的首批客户。
KL830 芯片是神经处理单元(NPU),与中央处理器(CPU)和图形处理器(GPU)协同工作,来实现运行人工智能(AI)任务,最高可提供 10eTOPS@8bit 的综合计算能力,峰值功耗仅为 2W,支持许多相对低参数的大型语言模型。
耐能表示,KL830 也可通过 USB AI 加速棒使用,使得任何设备,无论是宽带路由器、物联网摄像头还是传统电脑,都可以成为边缘 AI 设备。