全部标签

AI模型

Anthropic 新研究：AI模型在训练中存在“阳奉阴违”行为

12 月 19 日消息，人工智能安全公司 Anthropic 发布一项最新研究揭示了人工智能模型可能存在的欺骗行为，即在训练过程中，模型可能会伪装出接受新原则的假象，实则暗地里仍然坚持其原有偏好。研究团队强调，目前无需对此过度恐慌，但这项研究对于理解未来更强大人工智能系统可能构成的潜在威胁至关重要。据1AI了解，该研究由 Anthropic 与人工智能研究机构 Redwood Research …
资讯
- 373
12月19日
Meta 发布 Motivo AI模型，打造更逼真元宇宙体验

Meta 公司周四宣布推出名为 Meta Motivo 的人工智能模型，该模型旨在控制类人数字智能体的动作，从而提升元宇宙体验。 Meta 还发布了大型概念模型 LCM 和视频水印工具 Video Seal 等 AI 工具，并重申其对 AI、AR 和元宇宙技术持续投入的决心。注：Meta Motivo 是一个基于行为的基础模型，在 Mujoco 模拟器中进行训练，使用了 AMASS 动作捕捉数据…
资讯
- 615
12月14日
DeepSeek V2 系列 AI模型收官，联网搜索上线

12 月 11 日消息，DeepSeek 官方公众号昨日（12 月 10 日）发布博文，宣布 DeepSeek V2 系列收官，推出 DeepSeek V2.5 的最终版微调模型 DeepSeek-V2.5-1210，主要支持联网搜索功能，全面提升各项能力。 DeepSeek-V2.5-1210 通过 Post-Training 迭代，在数学、代码、写作、角色扮演等方面均取得显著进步，此外优化了文…
资讯
- 662
12月11日
LG 发布 EXAONE 3.5 开源 AI 模型：长文本处理利器、独特技术有效降低“幻觉”

12 月 11 日消息，LG 人工智能研究院本周一（12 月 9 日）发布 EXAONE 3.5 开源 AI模型，并同步推出面向 LG 员工的企业级 AI 智能体服务 ChatEXAONE。 EXAONE 3.5 此次发布的 EXAONE 3.5 距离 3.0 版本仅四个月，新模型提供三个版本：24 亿参数的超轻量级设备端模型、78 亿参数的轻量级通用模型以及 320 亿参数的高性能专用模型。 L…
资讯
- 707
12月11日
谷歌 CEO 皮查伊嘲讽微软：他们使用的是别人开发的 AI模型

北京时间今晨，据 The Information 援引知情人士消息称，谷歌近期已向美国联邦贸易委员会（简称 FTC）施压，要求解除微软在其云服务器上托管 OpenAI 技术的独家协议。在 FTC 向谷歌询问了微软的商业行为之后，谷歌表达了上述意见。据了解，FTC 询问的目的是进行更广泛的调查。谷歌、亚马逊等一系列微软的竞争对手希望自己托管 OpenAI 的人工智能服务，目的是使其云客户不需要同时…
资讯
- 500
12月11日
Meta 推出 SPDL 工具：突破训练 AI 模型数据效率瓶颈，吞吐量提升 2-3 倍

12 月 10 日消息，训练 AI模型的瓶颈，目前不再仅仅是架构设计，数据管理效率也至关重要。Meta AI 最新推出了开源可扩展且高性能的数据加载（SPDL）工具，通过提升数据加载效率，最终加快 AI 训练速度。 SPDL 工具采用多线程技术，在常规 Python 解释器中（未启用 free-threading 选项）实现了高吞吐量，资源占用更低，并兼容 Free-Threaded Python…
资讯
- 817
12月10日
谷歌称其 PaliGemma 2 人工智能模型可识别情绪，引发专家担忧

12 月 8 日消息，谷歌表示，其新的人工智能模型系列有一个奇特的功能：能够“识别”情绪。谷歌周四发布了其最新 AI模型系列 PaliGemma 2，该模型具备图像分析能力，可以生成图像描述并回答有关照片中人物的问题。谷歌在其博客中介绍，PaliGemma 2 不仅能识别物体，还能生成详细且与上下文相关的图片说明，涵盖动作、情感以及整体场景的叙述。 PaliGemma 2 的情感识别功能并非开箱…
资讯
- 795
12月9日
Meta 今年压轴开源 AI模型 Llama 3.3 登场：700 亿参数，性能比肩 4050 亿

Meta 今年的压轴 AI 大模型来了。Meta 昨日（12 月 6 日）发布 Llama 3.3，共有 700 亿参数，不过性能方面媲美拥有 4050 亿参数的 Llama 3.1。 Meta 强调 Llama 3.3 模型效率更高、成本更低，可以在标准工作站上运行，降低运营成本的同时，提供高质量文本 AI 解决方案。 Llama 3.3 模型重点优化了多语言支持，支持英语、德语、法语、意大利语…
资讯
- 993
12月8日
视觉开源 AI 推理库 YOLOv11 遭供应链投毒：模型训练成挖矿，官方已撤回问题版本

1 2 月 7 日消息，科技媒体 techtarget 昨日（12 月 6 日）发布博文，报道称 Ultralytics 公司的 YOLOv11 AI模型遭遇供应链攻击，v8.3.41 和 v8.3.42 两个版本被植入加密挖矿软件。截至1AI发稿为止，Ultralytics 公司并未发布正式的安全公告，不过该公司已迅速响应，移除了 2 个受影响版本并发布了新版。该问题最早由开发者 metri…
资讯
- 946
12月7日
OpenAI 活动第二弹：“强化微调”打造领域专家 AI 模型，阿尔特曼称其为今年最大惊喜

12 月 7 日消息，OpenAI 启动了为期 12 天的“shipmas”新品发布周期，将推出一系列新功能、新产品以及相关演示。本次活动第二日，OpenAI 推出了强化微调（Reinforcement Fine-Tuning），帮助开发者和机器学习工程师打造针对特定复杂领域任务的专家模型。该项目通过全新的模型定制技术，让开发者可以使用高质量任务集对模型进行微调，并利用参考答案评估模型的响应，从…
资讯
- 781
12月7日
亚马逊发布 Nova 系列 AI 模型，提供文本、图像和视频生成功能

12 月 4 日消息，亚马逊今日宣布推出一系列新的 AI 基础模型，品牌为“Nova”，并将通过 AWS 的 Amazon Bedrock 模型库提供。亚马逊在博客文章中表示，目前有三种“理解”模型可供选择： Amazon Nova Micro：一种针对“速度和成本优化”的文本模型。 Amazon Nova Lite：一种“非常低成本”的多模态模型，可以输入图像、视频和文本以生成文本。 Amaz…
资讯
- 882
12月4日
消息称亚马逊正开发视频 AI 模型，减少对 Anthropic 的依赖

据 The Information 报道，亚马逊开发了一套新的生成式 AI模型，除文本外还能处理图像和视频，从而减少了对 Anthropic 的依赖。据介绍，新模型代号为“奥林巴斯”（Olympus），将能够理解图像和视频中的场景，并通过简单的文字提示来搜索视频中的特定片段或场景，例如篮球比赛中的绝杀时刻。它还可以利用 AI 模型制作“最美味的咖啡”或者“雨滴落到地面”，以及通过简单的文本提示…
资讯
- 924
11月28日
AI 音频领域的“瑞士军刀”：英伟达推出 Fugatto，音乐制作新神器

英伟达11 月 25 日发布博文，宣布推出音乐生成 AI模型 Fugatto，声称是“全球最灵活的声音机器”，可以精细化控制声音生成。英伟达表示该工具就像是声音领域的“瑞士军刀”，不仅能创作音乐、修改声音，还能灵活地混合各种音乐、人声和音效，甚至创造出前所未有的声音。用户只需输入文字描述或者插入一些音频，Fugatto 就能生成相应的音乐片段、音效，甚至根据描述改变人声的口音和情感。例如用户…
资讯
- 1k
11月27日
Mistral 发布 Pixtral Large 多模态 AI模型：登顶复杂数学推理，图表 / 文档推理超过 GPT-4o

11 月 19 日消息，Mistral AI 公司昨日（11 月 18 日）发布公告，宣布了全新的多模态 AI模型 Pixtral Large。该模型拥有 1240 亿参数，基于 Mistral Large 2，主要用于处理文本和图片。 Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供，适用于研究、教育以及商业用途。 Pixtral Large 是 Mistral …
资讯
- 1.1k
11月19日
阿里通义千问发布 Qwen2.5-Turbo AI 模型：支持 100 万 tokens 上下文，处理时间缩短至 68 秒

11 月 19 日消息，阿里通义千问昨日（11 月 18 日）发布博文，宣布在经过数月的优化和打磨后，针对社区中对更长上下文长度（Context Length）的要求，推出了 Qwen2.5-Turbo 开源 AI模型。 Qwen2.5-Turbo 将上下文长度从 12.8 万个扩展至 100 万个 tokens，这一改进相当于约 100 万英语单词或 150 万汉字，可以容纳 10 部完整小说、…
资讯
- 1.8k
11月19日
北大清华等联合发布 LLaVA-o1：首个自发性视觉AI模型，推理计算 Scaling 新思路

11 月 19 日消息，由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学（Lehigh University）组成的研究团队，最新推出了 LLaVA-o1，这是首个具备自发性（Spontaneous，具体解释可参考文末）、类似于 GPT-o1 的系统性推理视觉语言模型。 LLaVA-o1 是一种新型的视觉语言模型（VLM），其设计目标是进行自主的多阶段推理。 LLaVA-o1 拥有 1…
资讯
- 939
11月19日
消息称 OpenAI、谷歌等巨头 AI 模型遇瓶颈：训练数据难寻，成本高昂

据彭博社报道，包括 OpenAI、谷歌和 Anthropic 在内的人工智能巨头公司在开发更先进的 AI模型方面遇到了瓶颈，面临着“收益递减”的困境。据报道，OpenAI 的最新模型 Orion 在处理编码任务方面表现不佳，与 GPT-4 相比，Orion 并没有显著的进步。谷歌即将推出的 Gemini 软件也面临类似的挑战，而 Anthropic 则推迟了其备受期待的 Claude 3.5 O…
资讯
- 1.5k
11月14日
Meta 开源小语言 AI模型 MobileLLM 家族：适用智能手机、提供 125M-1B 版本

Meta 于上周发布新闻稿，宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族，并同时为系列模型新增 600M、1B 和 1.5B 三种不同参数版本，附项目 GitHub 项目页如下（点此访问）。 Meta 研究人员表示，MobileLLM 模型家族专为智能手机打造，该模型号称采用了精简架构，并引入了“SwiGLU 激活函数”、“分组查询注意力（grouped-query att…
资讯
- 1.5k
11月9日
谷歌发布日语版Gemma AI模型，仅20亿参数、移动设备也能轻松运行！

最近在东京举办的 Gemma 开发者日上，谷歌正式推出了新的日语版本 Gemma AI 模型。这款模型的表现可以与 GPT-3.5媲美，但它的参数量只有仅仅20亿，非常小巧，适合在移动设备上运行。这次发布的 Gemma 模型，在日语处理上表现出色，同时也保持了其在英语上的能力。对于小型模型来说，这一点特别重要，因为在进行新语言的微调时，它们可能会面临 “灾难性遗忘” 的问题，即新学到的知识会覆盖…
资讯
- 2.5k
10月30日
生图能力超越Flux1.1 Pro！神秘AI模型"红熊猫"Red_panda横空出世

近日，一款代号"red_panda"的神秘AI图像生成模型在众包分析平台Artificial Analysis的基准测试中取得惊人成绩，以显著优势超越了Midjourney、Black Forest Labs和OpenAI等行业领军企业的产品。根据Artificial Analysis平台数据显示，"red_panda"在文本转图像测试中以1244分的成绩…
资讯
- 5.9k
10月29日
IBM 推出 Granite 3.0：最佳企业 AI 模型，为智能体 AI 夯实基础

科技媒体 NeoWin （10 月 21 日）发布博文，报道称 IBM 在其年度 TechXchange 活动上，发布了全新的 Granite 3.0 系列 AI模型，在学术和行业基准测试中可以持平或超越同等规模的模型。 Granite 3.0 系列包含多种新模型，相关模型如下：通用 / 语言模型： Granite 3.0 8B Instruct Granite 3.0 2B Instruct …
资讯
- 2.1k
10月23日
X 平台修改隐私政策，11 月 15 日起第三方公司可将用户内容用于训练 AI 模型

近日，社交平台X更新隐私政策，11月15日起，将允许X平台使用用户数据训练AI模型，除非用户选择退出，引发用户不满。此前，Adobe、谷歌等公司也在条款中引入类似内容，引起AI训练与隐私、版权等冲突的争议，相关法律问题仍在讨论中。改变：用户数据将被用于AI训练近日，X平台更新隐私政策，新增条款允许其与第三方共享用户数据以训练AI，除非用户选择退出。但平台并未提供明确的退出选项，且提醒用户即使内…
资讯
- 3.7k
10月19日
李飞飞的 World Labs 选择 Google Cloud 作为其 AI 模型主要计算提供商

李飞飞的初创公司 World Labs 宣布与 Google Cloud 达成协议，选择 Google Cloud 作为其训练 AI模型的主要计算提供商。这笔交易可能价值数亿美元。 World Labs 将利用 Google Cloud 平台上的 GPU 服务器授权，为其大型多模态 AI 模型提供计算服务。该公司的 AI 模型被称为“空间智能”，能够处理、生成和与视频和地理空间数据交互。 Goog…
资讯
- 2.1k
10月9日
谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用：腰斩击穿价 0.15 美元买百万 tokens 输出

科技媒体 NeoWin 昨日（10 月 4 日）发布博文，报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型，成为谷歌公司最便宜的 AI模型。今年 8 月报道，谷歌公司推出 3 款 Gemini 实验性模型，其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型，拥有 80 亿参数，专为多模态任务而设计，包括大容量任务和长文本摘要任务…
资讯
- 4.6k
10月5日