-
Mistral 发布 Pixtral Large 多模态 AI模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o
11 月 19 日消息,Mistral AI 公司昨日(11 月 18 日)发布公告,宣布了全新的多模态 AI模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。 Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。 Pixtral Large 是 Mistral …- 483
-
阿里通义千问发布 Qwen2.5-Turbo AI 模型:支持 100 万 tokens 上下文,处理时间缩短至 68 秒
11 月 19 日消息,阿里通义千问昨日(11 月 18 日)发布博文,宣布在经过数月的优化和打磨后,针对社区中对更长上下文长度(Context Length)的要求,推出了 Qwen2.5-Turbo 开源 AI模型。 Qwen2.5-Turbo 将上下文长度从 12.8 万个扩展至 100 万个 tokens,这一改进相当于约 100 万英语单词或 150 万汉字,可以容纳 10 部完整小说、…- 530
-
北大清华等联合发布 LLaVA-o1:首个自发性视觉AI模型,推理计算 Scaling 新思路
11 月 19 日消息,由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学(Lehigh University)组成的研究团队,最新推出了 LLaVA-o1,这是首个具备自发性(Spontaneous,具体解释可参考文末)、类似于 GPT-o1 的系统性推理视觉语言模型。 LLaVA-o1 是一种新型的视觉语言模型(VLM),其设计目标是进行自主的多阶段推理。 LLaVA-o1 拥有 1…- 280
-
消息称 OpenAI、谷歌等巨头 AI 模型遇瓶颈:训练数据难寻,成本高昂
据彭博社报道,包括 OpenAI、谷歌和 Anthropic 在内的人工智能巨头公司在开发更先进的 AI模型方面遇到了瓶颈,面临着“收益递减”的困境。 据报道,OpenAI 的最新模型 Orion 在处理编码任务方面表现不佳,与 GPT-4 相比,Orion 并没有显著的进步。谷歌即将推出的 Gemini 软件也面临类似的挑战,而 Anthropic 则推迟了其备受期待的 Claude 3.5 O…- 581
-
Meta 开源小语言 AI模型 MobileLLM 家族:适用智能手机、提供 125M-1B 版本
Meta 于上周发布新闻稿,宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族,并同时为系列模型新增 600M、1B 和 1.5B 三种不同参数版本,附项目 GitHub 项目页如下(点此访问)。 Meta 研究人员表示,MobileLLM 模型家族专为智能手机打造,该模型号称采用了精简架构,并引入了“SwiGLU 激活函数”、“分组查询注意力(grouped-query att…- 1k
-
谷歌发布日语版Gemma AI模型,仅20亿参数、移动设备也能轻松运行!
最近在东京举办的 Gemma 开发者日上,谷歌正式推出了新的日语版本 Gemma AI 模型。这款模型的表现可以与 GPT-3.5媲美,但它的参数量只有仅仅20亿,非常小巧,适合在移动设备上运行。 这次发布的 Gemma 模型,在日语处理上表现出色,同时也保持了其在英语上的能力。对于小型模型来说,这一点特别重要,因为在进行新语言的微调时,它们可能会面临 “灾难性遗忘” 的问题,即新学到的知识会覆盖…- 1.5k
-
生图能力超越Flux1.1 Pro!神秘AI模型"红熊猫"Red_panda横空出世
近日,一款代号"red_panda"的神秘AI图像生成模型在众包分析平台Artificial Analysis的基准测试中取得惊人成绩,以显著优势超越了Midjourney、Black Forest Labs和OpenAI等行业领军企业的产品。 根据Artificial Analysis平台数据显示,"red_panda"在文本转图像测试中以1244分的成绩…- 3.4k
-
IBM 推出 Granite 3.0:最佳企业 AI 模型,为智能体 AI 夯实基础
科技媒体 NeoWin (10 月 21 日)发布博文,报道称 IBM 在其年度 TechXchange 活动上,发布了全新的 Granite 3.0 系列 AI模型,在学术和行业基准测试中可以持平或超越同等规模的模型。 Granite 3.0 系列包含多种新模型,相关模型如下: 通用 / 语言模型: Granite 3.0 8B Instruct Granite 3.0 2B Instruct …- 1.4k
-
X 平台修改隐私政策,11 月 15 日起第三方公司可将用户内容用于训练 AI 模型
近日,社交平台X更新隐私政策,11月15日起,将允许X平台使用用户数据训练AI模型,除非用户选择退出,引发用户不满。此前,Adobe、谷歌等公司也在条款中引入类似内容,引起AI训练与隐私、版权等冲突的争议,相关法律问题仍在讨论中。 改变:用户数据将被用于AI训练 近日,X平台更新隐私政策,新增条款允许其与第三方共享用户数据以训练AI,除非用户选择退出。但平台并未提供明确的退出选项,且提醒用户即使内…- 2.8k
-
李飞飞的 World Labs 选择 Google Cloud 作为其 AI 模型主要计算提供商
李飞飞的初创公司 World Labs 宣布与 Google Cloud 达成协议,选择 Google Cloud 作为其训练 AI模型的主要计算提供商。这笔交易可能价值数亿美元。 World Labs 将利用 Google Cloud 平台上的 GPU 服务器授权,为其大型多模态 AI 模型提供计算服务。该公司的 AI 模型被称为“空间智能”,能够处理、生成和与视频和地理空间数据交互。 Goog…- 1.5k
-
谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用:腰斩击穿价 0.15 美元买百万 tokens 输出
科技媒体 NeoWin 昨日(10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI模型。 今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务…- 3.4k
-
我国团队打造糖尿病专用 AI模型,助力个性化糖尿病护理
上海交通大学清源研究院 MIFA 实验室携手复旦大学附属中山医院内分泌科,组建专家团队,联手开发一款名为 Diabetica 的糖尿病专用大模型。 Diabetica 模型可以帮助患者、医生、医疗机构共同应对糖尿病管理的复杂挑战,通过结合大模型的强大语言处理能力与糖尿病领域的专业知识,为医生、患者以及医疗教育提供全方位的智能支持。 团队引入了全新的框架,训练和验证糖尿病专用大语言模型。团队首先开发…- 2.6k
-
端侧最强开源 AI模型 Llama 3.2 登场:可在手机运行,从 1B 纯文本到 90B 多模态,挑战 OpenAI 4o mini
Meta 公司9 月 25 日发布博文,正式推出了 Llama 3.2 AI 模型,其特点是开放和可定制,开发者可以根据其需求定制实现边缘人工智能和视觉革命。 Llama 3.2 提供了多模态视觉和轻量级模型,代表了 Meta 在大型语言模型(LLMs)方面的最新进展,在各种使用案例中提供了更强大的功能和更广泛的适用性。 其中包括适合边缘和移动设备的中小型视觉 LLMs (11B 和 90B),以…- 3k
-
OpenAI发布具推理能力的人工智能模型,OpenAI o1模型登场
OpenAI 传闻中的“草莓”(Strawberry)AI模型现已面世,正式名称为“o1”,是该公司首款具备“推理”能力的模型。 o1 和 o1-mini OpenAI 表示对该模型进行特殊训练,能够比人类更快地回答更复杂的问题。与之同时发布的还有 o1-mini,一个更小、成本更低的版本。 OpenAI 表示 o1 模型的发布,是其迈向类人 AI 宏伟目标的关键一步。 o1 模型目前处于“预览”…- 6.8k
-
面壁智能发布小钢炮MiniCPM 3.0端侧模型:2GB内存即可运行 性能超GPT-3.5
面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源 MiniCPM3-4B AI模型,声称“端侧 ChatGPT 时刻到来”。这是一款性能卓越的AI模型,能够在仅2GB内存的设备上运行,预示着端侧AI体验的新时代。 MiniCPM3.0模型拥有4B参数,性能上超越了GPT-3.5,能够在移动设备上实现与GPT-3.5水平相当的AI服务。这使得用户无需依赖云端处理即可享受快速、安全且功能…- 10.5k
-
Meta 公布 Llama AI 模型家族下载量数据:全球超 3.5 亿、3.1-405B 模型最受欢迎
Meta 公司昨日发布新闻稿披露了旗下 Llama 开源 AI模型家族在 Hugging Face 的下载量情况,仅在上个月(8 月 1 日- 8 月 31 日),相关模型的下载次数就超过了 2000 万次,截至 9 月 1 日,Llama 模型家族全球下载量已突破 3.5 亿次。 参考IT之家报道,Meta 公司在今年 4 月发布了 LLM Llama 3,于今年 7 月推出了 Llama 3.…- 4.6k
-
阿里通义千问推出 Qwen2-VL:开源 2B / 7B 模型,能理解超 20 分钟视频
阿里巴巴的云计算部门刚刚发布了一款全新的 AI模型 ——Qwen2-VL。这款模型的强大之处在于它能够理解视觉内容,包括图片和视频,甚至可以实时分析长达20分钟的视频,可以说相当强悍。 与其他领先的先进模型(如 Meta 的 Llama3.1、OpenAI 的 GPT-4o、Anthropic的 Claude3Haiku 和 Google 的 Gemini-1.5Flash)相比,它在第三方基准测…- 4.5k
-
最强端侧开源 AI模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB
Zyphra 于 8 月 27 日发布博文,宣布推出 Zamba2-mini 1.2B 模型,共有 12 亿参数,声称是端侧 SOTA 小语言模型,在 4bit 量化下内存占用低于 700MB。 SOTA 全称为 state-of-the-art,并不是特指某个具体的模型,而是指在该项研究任务中,目前最好 / 最先进的模型。 Zamba2-mini 1.2B 虽然尺寸不大,但媲美包括谷歌 Gemm…- 3.7k
-
谷歌发布 3 款 Gemini 实验 AI模型:1.5 Pro 冲榜第二、1.5 Flash 从第 23 蹿升至第 6
谷歌 AI Studio 产品总监洛根・基尔帕特里克(Logan Kilpatrick)(8 月 28 日)在 X 平台发布推文,宣布推出 3 款 Gemini 实验性模型。 谷歌本次推出的 3 款实验性 Gemini AI 模型如下: Gemini 1.5 Flash-8B Gemini 1.5 Flash-8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模…- 4.3k
-
亚马逊被曝 10 月发布 Alexa AI 订阅版:月费 10 美元,梳理、汇总用户感兴趣的信息流
华盛顿邮报昨日(8 月 27 日)发布博文,报道称亚马逊内部正研发名为“Remarkable Alexa”的全新 AI模型,加入到激烈的 AI 竞争中。 消息称该 AI 模型内部代号为“Project Banyan”,亚马逊有望于 2024 年 10 月发布,主要分析人们如何使用现有的人工智能模型,并挑选出用户最需要的部分。 援引消息源报道,该 AI 模型主要帮助客户策划、总结和探索头条、感兴趣的…- 2.4k
-
英伟达发布 80 亿参数新 AI模型:精度、效率高,可在 RTX 工作站上部署
英伟达于 8 月 21 日发布博文,发布了 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。 英伟达携手 Mistral AI 上月发布开源 Mistral NeMo 12B 模型,在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 亿个参数,可以在…- 2.6k
-
英伟达团队推出 AI模型 StormCast,高精度天气预测,精准预测几公里内雷暴天气
近日,英伟达的研究团队开发出了一款名为 “StormCast” 的 AI 模型,能够在几公里的精度范围内进行雷暴天气的预测。这一技术突破对于气象预测领域具有重要意义,因为以往在这种精细尺度上捕捉大气复杂动态一直都非常具有挑战性。 StormCast 模型结合了两项创新技术。研究人员使用了生成模型,这种模型可以模拟出多种可能的发展情形。StormCast 还了一个包含多个垂直层的密集大气状态,确保了…- 4.8k
-
微软发布 Phi-3.5 系列 AI 模型:上下文窗口 128K,首次引入混合专家模型
微软公司发布了 Phi-3.5 系列 AI模型,其中最值得关注的是推出了该系列首个混合专家模型(MoE)版本 Phi-3.5-MoE。 本次发布的 Phi-3.5 系列包括 Phi-3.5-MoE、Phi-3.5-vision 和 Phi-3.5-mini 三款轻量级 AI 模型,基于合成数据和经过过滤的公开网站构建,上下文窗口为 128K,所有模型现在都可以在 Hugging Face 上以 M…- 1.9k
-
Anthropic 被指控使用盗版书籍训练 AI,作者提起集体诉讼
据路透社报道,一群作家对人工智能公司 Anthropic 提起诉讼,指控该公司使用盗版书籍来训练其 AI模型。 据报道,这起集体诉讼周一在加利福尼亚州法院提起,原告声称 Anthropic “通过窃取数十万本受版权保护的书籍,建立了一个价值数十亿美元的业务”。 作者们在诉讼中表示,Anthropic 使用了一个庞大的开源数据集“The Pile”来训练其 Claude 系列 AI 聊天机器人。这个…- 1.4k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!