-
无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解
12 月 16 日消息,无问芯穹今日宣布,开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。 官方表示,Megrez-3B-Omni 是一个为端而生的全模态理解模型,同时具备图片、音频、文本三种模态数据的处理能力: 在图像理解方面,Megrez-3B-Omni 是目前 OpenCompass、MME、MMMU、O…- 986
-
DeepSeek-VL2 AI 视觉模型开源:支持动态分辨率、处理科研图表、解析各种梗图等
DeepSeek 官方公众号昨日(12 月 13 日)发布博文,宣布开源 DeepSeek-VL2 模型,在各项评测指标上均取得了极具优势的成绩,官方称其视觉模型正式迈入混合专家模型(Mixture of Experts,简称 MoE)时代。 1AI援引官方新闻稿,附上 DeepSeek-VL2 亮点如下: 数据:比一代 DeepSeek-VL 多一倍优质训练数据,引入梗图理解、视觉定位、视觉故事…- 786
-
Hugging Face 发布 SmolVLM 开源 AI模型:20 亿参数,用于端侧推理,体积小、速度快
Hugging Face 平台昨日(11 月 26 日)发布博文,宣布推出 SmolVLM AI 视觉语言模型(VLM),仅有 20 亿参数,用于设备端推理,凭借其极低的内存占用在同类模型中脱颖而出。 官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效,并且完全开源,所有模型检查点、VLM 数据集、训练配方和工具均在 Apache 2.0 许可证下发布。 SmolVLM AI …- 1.4k
-
阿里通义千问发布 Qwen2.5-Turbo AI 模型:支持 100 万 tokens 上下文,处理时间缩短至 68 秒
11 月 19 日消息,阿里通义千问昨日(11 月 18 日)发布博文,宣布在经过数月的优化和打磨后,针对社区中对更长上下文长度(Context Length)的要求,推出了 Qwen2.5-Turbo 开源 AI模型。 Qwen2.5-Turbo 将上下文长度从 12.8 万个扩展至 100 万个 tokens,这一改进相当于约 100 万英语单词或 150 万汉字,可以容纳 10 部完整小说、…- 1.8k
-
带你了解AI虚拟数字人,盘点目前有关数字人的开源项目
最近AI圈,数字人好家伙越来越靓仔了,各家都在推出“开源最强”的数字人 但,选择太多了,咋知道哪个适合自己呢?总不能“我+困难=放弃”,对吧? 不可!作为宠粉狂魔的我,不可能让大家面临如此窘境! 所以我果断出手! 为大家一次性把之前分享过的数字人相关整合包,做个盘点,包含实现的效果,需要的配置,生成的时间等等,让大家一口气看完目前开源数字人到底哪家强,一起选择最好的挖掘机! 数字人火火火! 要说A…- 3.3k
-
阿里通义千问开源 Qwen2.5-Coder 全系列模型,号称代码能力追平 GPT-4o
11 月 12 日消息,阿里通义千问开源 Qwen2.5-Coder 全系列模型,其中 Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,官方号称代码能力追平 GPT-4o。 Qwen2.5-Coder-32B-Instruct 作为本次开源的旗舰模型,在多个流行的代码生成基准(如 EvalPlus、LiveCodeBench、BigCodeBench)上都…- 1.4k
-
告别“默片”:智谱发布新清影,可生成 10 秒 4K60 帧 / 自带音效视频
智谱技术团队今天发布并开源最新版本的视频模型 CogVideoX v1.5,相比于原有模型,CogVideoX v1.5 将包含 5/10 秒、768P、16 帧的视频生成能力,I2V 模型支持任意尺寸比例,大幅提升图生视频质量及复杂语义理解。 官方介绍,CogVideoX v1.5 也将同步上线到“清影”平台,并与新推出的 CogSound 音效模型结合,“新清影”将具备如下特性: 质量提升:在…- 2k
-
Meta 开源小语言 AI模型 MobileLLM 家族:适用智能手机、提供 125M-1B 版本
Meta 于上周发布新闻稿,宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族,并同时为系列模型新增 600M、1B 和 1.5B 三种不同参数版本,附项目 GitHub 项目页如下(点此访问)。 Meta 研究人员表示,MobileLLM 模型家族专为智能手机打造,该模型号称采用了精简架构,并引入了“SwiGLU 激活函数”、“分组查询注意力(grouped-query att…- 1.5k
-
腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型
腾讯宣布推出 Hunyuan-Large 大模型,官方表示这是目前业界已经开源的基于 Transformer 的最大 MoE 模型,拥有 3890 亿总参数(389B)和 520 亿激活参数(52B)。 腾讯在 Hugging Face 开源了 Hunyuan-A52B-Pretrain 、 Hunyuan-A52B-Instruct 和 Hunyuan-A52B-Instruct-FP8。并发布…- 2.1k
-
ElevenLabs推开源小项目X-to-Voice:一键将Twitter账号转化为个性化虚拟形象mp
人工智能公司ElevenLabs最近发布了一个开源项目"X-to-Voice",这款工具能够智能分析Twitter用户资料,自动生成与用户个性相匹配的数字声音和动态头像。 这个项目整合了多个尖端技术:ElevenLabs自主研发的声音设计API负责声音生成,Taedra工具则掌管动态头像的制作。在技术支持方面,项目采用了Apify进行个人资料和图片数据采集,Hedra负责动态头…- 3.2k
-
全球首个开源 AI 标准发布,微软、谷歌、亚马逊、Meta、英特尔、三星等巨头制定
在本月底的 2024 年 ALL THINGS OPEN 大会上,开源组织 Open Source Initiative(OSI)正式发布开源人工智能定义(OSAID)1.0 版本,标志着全球首个开源 AI 标准的诞生。 OSI 成立于 1998 年,是一个全球性的非营利组织,旨在定义和“管理”所有开源事物。 OSAID 标准由超过 25 个组织共同设计,包括微软、谷歌、亚马逊、Meta、英特尔、…- 3.5k
-
OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”
10 月 31 日消息,当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。当前的语言模型有时会产生错误输出或未经证实的答案,这一问题被称为“幻觉”。能够生成更准确、更少幻觉的回答的语言模型更为可靠,可以用…- 2.1k
-
谷歌 DeepMind 开源 SynthID Text 工具,可辨别 AI 生成的文字
谷歌 DeepMind 于 10 月 23 日宣布正式开源旗下 SynthID Text 文本水印工具,供开发者和企业免费使用。 谷歌在 2023 年 8 月推出了 SynthID 工具,该工具具备创建 AI 内容水印(声明该作品由 AI 打造)和识别 AI 生成内容的能力。它可以在不损害原始内容的前提下,将数字水印直接嵌入由 AI 生成的图像、声音、文本和视频中,同时也能扫描这些内容已有的数字水…- 2.8k
-
“稚晖君”创业项目,智元机器人宣布灵犀 X1 面向全球开源
10 月 24 日消息,智元机器人今日宣布“灵犀 X1”面向全球正式开源,软硬件全套图纸和代码水灵灵地上线到 GitHub 啦,开发指南上线至智元机器人官网。 智元机器人官方称,作为业内首家全栈开源人形机器人图纸和代码的公司,此次开源将毫无保留地提供“一站式”软硬件技术资源,总资料大小超过 1.2GB。 在整机结构硬件方面,开源内容包含详尽的整机结构图纸、硬件框图和物料清单(BOM)、装机说明。 …- 2.7k
-
开源文生图 AI 重磅选手上新:Stable Diffusion 3.5 最强全家桶登场、消费级硬件上“开箱即用”
Stability AI 公司昨日(10 月 22 日)发布博文,宣布推出 Stable Diffusion 3.5,这标志着开源 AI 文生图模型的重大进步。 Stable Diffusion 3.5 共有 Medium(10 月 29 日发布)、Large 和 Large Turbo 三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求,附上相关介绍如下: Stable Dif…- 2.3k
-
智谱开源文生图模型 CogView3-Plus,相关功能上线智谱清言 App
10 月 14 日消息,智谱技术团队今天宣布开源文生图模型 CogView3 及 CogView3-Plus-3B ,该系列模型的能力已经上线“智谱清言”App。 据介绍,CogView3 是一个基于级联扩散的 text2img 模型,其包含如下三个阶段: 第一阶段:利用标准扩散过程生成 512x512 低分辨率的图像。 第二阶段:利用中继扩散过程,执行 2 倍的超分辨率生成,从 512x512 …- 3.7k
-
自称开源版Cursor 刚融资350万的PearAI被指抄袭
近日,自称是"开源版Cursor"的AI编程工具PearAI宣布获得YCombinator50万美元(约350万人民币)融资。 PearAI 的创始人 Duke Pan 承认,这个产品实际上是对另一款 AI 编辑器 Continue 的克隆。而 Continue 本身是基于 Apache 开源许可证的项目,PearAI 则试图在此基础上以一种自创的闭源许可证 “Pear Ent…- 6.6k
-
中国电信 AI 研究院完成首个全国产化万卡万参大模型训练,TeleChat2-115B 对外开源
9 月 28 日消息,“中国电信人工智能研究院”官方公众号宣布,中国电信人工智能研究院(下文称 TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。 官方表示,这项科研成果标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新…- 5k
-
如何玩Stable Diffusion、FLUX等开源AI绘画模型?使用云端开源模型绘画平台
AI绘画,可以说已经相当成熟了 闭源模型Midjourney,简单易用,能出摄影级作品,效果牛逼。就是每月几十刀,有点费钱,还有就是扩展性差。 对人物场景一致性要求高,或想用工作流做专属绘画工具应用,开源模型才是YYDS,比如stable diffusion系列,还有最近大火的Flux,自媒体平台都被这两个屠榜了。 开源的魅力,就在于扩展性、可控性,还能用工作流打包产品,而且目前效果不断逼近Mid…- 4.9k
-
可以轻松上手的Dify开源大模型开发平台,Agent与RAG的结合打造专属AI智能工作台
Dify 是一个用于构建 AI 应用程序的开源平台。Dify融合了后端即服务(Backend as Service)和LLMOps理念。它支持多种大型语言模型,如Claude3、OpenAI等,并与多个模型供应商合作,确保开发者能根据需求选择最适合的模型。Dify通过提供强大的数据集管理功能、可视化的Prompt编排以及应用运营工具,大大降低了AI应用开发的复杂度。 Dify 一、Dify 什么是…- 8k
-
端侧最强开源 AI模型 Llama 3.2 登场:可在手机运行,从 1B 纯文本到 90B 多模态,挑战 OpenAI 4o mini
Meta 公司9 月 25 日发布博文,正式推出了 Llama 3.2 AI 模型,其特点是开放和可定制,开发者可以根据其需求定制实现边缘人工智能和视觉革命。 Llama 3.2 提供了多模态视觉和轻量级模型,代表了 Meta 在大型语言模型(LLMs)方面的最新进展,在各种使用案例中提供了更强大的功能和更广泛的适用性。 其中包括适合边缘和移动设备的中小型视觉 LLMs (11B 和 90B),以…- 3.4k
-
阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama
在 2024 云栖大会上,阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5,其中,旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。 Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型。 Qwen2.5 语言模型:0.5B、1.5B、3B、7B、14B、32B 以及 …- 2.3k
-
面壁智能发布小钢炮MiniCPM 3.0端侧模型:2GB内存即可运行 性能超GPT-3.5
面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源 MiniCPM3-4B AI模型,声称“端侧 ChatGPT 时刻到来”。这是一款性能卓越的AI模型,能够在仅2GB内存的设备上运行,预示着端侧AI体验的新时代。 MiniCPM3.0模型拥有4B参数,性能上超越了GPT-3.5,能够在移动设备上实现与GPT-3.5水平相当的AI服务。这使得用户无需依赖云端处理即可享受快速、安全且功能…- 12.2k
-
零一万物开源 Yi-Coder 系列编程助手模型,支持 52 种编程语言
零一万物今日宣布开源 Yi-Coder 系列模型,该模型是Yi 系列模型家族中的编程助手。 Yi-Coder 系列模型专为编码任务而生,提供 1.5B 和 9B 两种参数。其中,Yi-Coder-9B 的表现号称“优于其他 10B 参数以下的模型”,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至能够“与 DeepSeek-Coder 33B 相媲美”。 据介绍,…- 5.5k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!