在火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供多模态大模型能力。千 tokens 输入价格仅为 3 厘,一元钱就可处理 284 张 720P 的图片,官方宣称比行业价格便宜 85%。
对此,抖音集团副总裁李亮今日发文称:
- 这不是价格战。豆包大模型通过技术创新来降低成本,在算法、软件工程和硬件方案上做了非常多优化,3 厘 / 千 tokens 的定价也有可观的毛利。而且这是一步到位的透明价格,并不是“刊例价 + 折扣”的玩法。我们希望用更低成本推动 AI 技术普惠和应用发展,就像谭待说的:‘好的模型就是要让每一家企业都用得起。’
1AI注意到,豆包 3D 生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台 veOmniverse 结合使用,可完成智能训练、数据合成和数字资产制作,官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。
豆包大模型旗下多款产品也迎来了更新:
- 豆包通用模型 pro:全面对齐 GPT-4o,使用价格仅为后者的 1/8;
- 音乐模型:可生成 3 分钟的完整作品;
- 文生图模型 2.1 版本:精准生成汉字、一句话 P 图,已接入即梦 AI 和豆包 App。