-
苹果研究人员质疑 AI 的推理能力:简单数学问题稍作改动就会答错
近年来,人工智能(AI)在各个领域取得了显著的进展,其中大型语言模型(LLM)能够生成人类水平的文本,甚至在某些任务上超越人类的表现。然而,研究人员对 LLM 的推理能力提出了质疑,他们发现这些模型在解决简单的数学问题时,只要稍加改动,就会犯错误,这表明它们可能并不具备真正的逻辑推理能力。 周四,苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性》的论文,揭示 LLM 在解决…- 1.7k
-
研究发现:AI 越聪明就越有可能“胡编乱造”
一项新研究发现,随着大型语言模型(LLM)变得越来越强大,它们似乎也越来越容易编造事实,而不是避免或拒绝回答它们无法回答的问题。这表明,这些更聪明的 AI聊天机器人实际上变得不太可靠。 该研究发表在《自然》杂志上,研究人员研究了一些业界领先的商业 LLM:OpenAI 的 GPT 和 Meta 的 LLaMA,以及由研究小组 BigScience 创建的开源模型 BLOOM。 研究发现,虽然这些 …- 1.8k
-
微软 CTO 坚信大型语言模型的“规模定律”依然奏效,未来可期
微软首席技术官(CTO)凯文・斯科特(Kevin Scott)上周在接受红杉资本旗下播客采访时,重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点,尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。 斯科特表示:“其他人可能持不同观点,但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里…- 2.4k
-
三星确认今年将推出 AI 升级版 Bixby,由自研大语言模型提供支持
三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后,三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示,公司将在今年晚些时候发布升级版 Bixby,并由三星自家的大语言模型(LLM)提供支持。Roh 表示:“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前,三星推出过名为“Samsung …- 1.8k
-
Hebbia 获得 1.3 亿美元融资,打造 AI 知识检索平台
总部位于纽约的 Hebbia 宣布获得了1.3亿美元的 B 轮融资,投资方包括 Andreessen Horowitz、Index Ventures、Peter Thiel 和谷歌的风险投资部门。 Hebbia 正在构建的是一个相当简单的东西:一个 LLM 本地化的生产力界面,使从数据中获取价值变得更加容易,无论其类型或大小如何。该公司已经与金融服务行业的一些大型公司合作,包括对冲基金和投资银行,…- 2.6k
-
AI常用词汇有哪些?你应该知道的20个AI人工智能专业词汇!
正如加密货币的热潮带来了许多新行话一样,人工智能的热潮也带来了很多我们经常听到,但不一定都能理解的专业术语。 如果你想了解聊天机器人和LLM(大型语言模型)之间的区别,或者深度学习和机器学习的区别,那你来对地方了,这里汇总了20个人工智能相关的术语,并提供了详细的解释。 人工智能(AI) 简单来说,人工智能就是让计算机或机器具备像人类一样的智能。这个词非常宽泛,包含了很多不同类型的机器智能。 目前…- 11.4k
-
聊天机器人胡说八道?牛津研究人员利用语义熵来识破 AI“幻觉”
近年来,人工智能蓬勃发展,聊天机器人等应用逐渐普及,人们可以通过简单的指令从这些聊天机器人(例如 ChatGPT)获取信息。然而,这些聊天机器人仍然容易出现“AI幻觉”问题,即提供错误的答案,有时甚至是危险的信息。 图源 Pexels 造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过,牛津大学的研究人员另辟蹊径,在最新出版的《自然》杂志上详细介绍了一种他们新开发…- 1.9k
-
苹果高管:正努力将“Apple Intelligence”引入中国市场
苹果在 WWDC 2024 上发布了备受瞩目的 iOS 18 和 macOS 15 系统,其中一项重要的新功能是“Apple Intelligence”—— 一套基于人工智能的工具集。该功能将于今年晚些时候正式上线,苹果软件工程主管 Craig Federighi 在接受 Fast Company 采访时透露了一些关于 Apple Intelligence 的未来发展计划。 “Apple Inte…- 2.3k
-
麻省理工科技评论称:数据是生成式AI的基础
预训练的大型语言模型(LLM)如 GPT-4和 Gemini 备受组织关注,他们渴望利用 LLM 构建聊天机器人、副驾驶等应用。根据麻省理工科技评论的最新报告,名为 “C 级领导人的 AI 准备情况”,该报告是代表 ETL 供应商 Fivetran 进行的调查发现,将 AI 或 GenAI 扩展是82% 受访高管的 “首要任务”。 图源备注:图片由AI生成,图片授权服务商Midjourney 调查…- 1.3k
-
古尔曼:苹果正自研设备端大型语言模型,赋能 AI 功能
据彭博社记者马克・古尔曼 (Mark Gurman) 报道,苹果公司正在研发一种运行于设备端的大型语言模型 (LLM) ,旨在提升即将发布的生成式 AI 功能的响应速度和隐私保护能力。 古尔曼在其“Power On”通讯中提到,苹果的这个 LLM 将成为该公司未来生成式人工智能功能的基础。与现今大多数云端人工智能服务不同的是,所有迹象都表明该模型将完全运行于用户设备之上。 由于运行于设备端,苹果的…- 1k
-
蔡崇信:中国AI技术可能落后美国OpenAI两年
据媒体报道,阿里巴巴联合创始人、董事长蔡崇信坦诚地指出,在AI技术领域,中国相较于美国存在一定的差距”。他进一步指出,与美国的顶级大型语言模型(LLM)如OpenAI ChatGPT相比,中国可能落后两年”。然而,这并不意味着中国在这一领域的追赶步伐会放缓。 蔡崇信强调,中国正积极努力迎头赶上由美国企业引领的新一轮AI浪潮。他坚信,长远来看,在面临英伟达芯片禁售的挑战下,中国将有能力自主制造高端G…- 1.9k
-
研究发现:GPT-4在临床推理中表现优于医生,但也更经常出错
在一项新研究中,美国贝斯以色列医疗中心(BIDMC)的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。研究人员使用了修订后的 IDEA(r-IDEA)评分,这是一种常用工具,用于评估临床推理能力。 这项研究包括给予一个由 GPT-4提供支持的聊天机器人、21名主治医生和18名住院医生20个临床案例,以建立诊断推理并解决问题。然后,评估了这三组答案的 r-IDEA 分数。研究人员发现,…- 1.4k
-
70 亿参数,联发科推出 MR Breeze-7B 模型:擅长洞察数据、支持双语互动
联发科旗下研究机构联发科技研究中心(MediaTek Research)近日发布公告,展示推出了名为 MR Breeze-7B 的全新开源大语言模型(LLM)。 这款开源模型擅长处理繁体中文和英文,共有 70 亿个参数,以广受赞誉的 Mistral 模型为基础进行设计。 与上一代产品 BLOOM-3B 相比,MR Breeze-7B 所吸收的知识显著增加了 20 倍,让其能以更高的精确度驾驭繁体中…- 2.4k
-
Meta发布全新AI自动剪辑视频工具Agents LAVE
Agents LAVE是Meta发布的全新AI自动剪辑视频工具,采用AI技术实现简单短视频和广告视频的自动生成,无需人工干预。工具界面包括输入提示、素材库和视频时间轴,而Agents设计则指导编辑行动计划的执行。 论文地址:https://arxiv.org/pdf/2402.10294.pdf Agents支持五种LLM功能,包括素材概览、创意头脑风暴、视频检索、故事板和剪辑修剪,实现自动生成的…- 34.6k
-
ChatGPT高质量prompt技巧分享,26条Prompt提升ChatGPT输出质量!
今天,给大家找到了一篇指导写大语言模型提示(prompt)的论文~(有实验数据支撑,效果杠杠滴!) 论文介绍了26条指导原则,目标是简化为不同规模的大语言模型制定问题的概念,检验它们的能力,并增强用户对于不同规模的模型在接受不同提示时的行为理解。研究者在LLaMA-1/2(7B、13B和70B)和GPT-3.5/4上进行了广泛实验,以验证这些原则在指令和提示设计上的有效性。 论文中指出:大语言模型…- 4.6k
-
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
亚马逊云计算人工智能实验室的研究人员发现,网络上大量内容来自机器翻译 (MT) 生成,这些跨越多种语言的翻译内容质量普遍较低。研究团队强调,这凸显了在训练大型语言模型 (LLM) 时,数据质量和来源考量的重要性。 图源 Pexels 研究还发现,机器生成内容在资源较少语言的翻译中很普遍,并占网络内容的很大一部分。 IT之家注意到,研究团队开发了名为多维 cc 矩阵 (MWccMatrix) 的庞大…- 1.3k
-
甲骨文的 OCI 生成式 AI 服务现已推出
Oracle 宣布了 Oracle Cloud Infrastructure(OCI)Generative AI 服务的普遍可用性,以及使企业更轻松地利用生成 AI 的最新进展的新创新。 OCI Generative AI 服务是一项完全托管的服务,无缝集成了来自 Cohere 和 Meta Llama2的大型语言模型(LLM),以解决各种业务用例。OCI Generative AI 服务现在具有…- 1.2k
-
苹果AIM自回归视觉模型验证性能与模型规模有关
苹果公司的研究者通过自回归图像模型(AIM)验证了视觉模型“参数越多性能越强”的规律,进一步证明随着容量或预训练数据量的增加,模型能不断提升性能。AIM能有效利用大量未经整理的图像数据,训练方法和稳定性与最近的大型语言模型(LLM)类似。这一观察结果与之前关于扩展大型语言模型的研究结果是一致的。 虽然本文实验所使用的模型规模有限,还需进一步探索是否能在更大参数量级的模型上验证此规律。研究者使用的预…- 2.6k
-
LLM AutoEval:AI平台自动评估Google Colab中的LLM
在自然语言处理领域,语言模型的评估对于开发人员推动语言理解和生成的边界至关重要。LLM AutoEval是一款旨在简化和加速语言模型(LLMs)评估过程的工具,专为寻求快速高效评估LLM性能的开发者定制。 LLM AutoEval具有以下关键特点: 1. **自动化设置和执行:** LLM AutoEval通过使用RunPod简化设置和执行过程,提供方便的Colab笔记本,实现无缝部署。 2. *…- 6.5k
-
Canalys:预计中国厂商将率先将 AI 手机打入更低价位段
今日分析机构Canalys发布报告称,中国本土智能手机厂商近期积极投资于自主开发的大语言模型(LLM)。随着 SoC 的更新迭代和市场存储配置的快速升级,中国厂商开始更加聚焦于端侧 AI 能力。 中国本土厂商在当地市场拥有生态优势,这使得 AI 能够发挥更大的效用。他们通常在本地市场拥有更高的附加率,并提供更全面的硬件产品覆盖。在硬件品类广泛覆盖和坚实的用户基础下,AI 能够催生更多样化的使用场景…- 2.1k
-
谷歌DeepMind发布“机器人宪法”以确保其AI机器人不会伤害人类
谷歌DeepMind的机器人团队宣布了三项新进展,旨在帮助机器人在复杂环境中做出更快、更好、更安全的决策。其中之一是一个用于收集训练数据的系统,配备了“机器人宪法”,以确保您的AI机器人办公助手在为您取更多打印纸的同时不会撞到处于途中的人类同事。 谷歌的数据收集系统AutoRT使用了视觉语言模型(VLM)和大型语言模型(LLM),相互协作以理解环境、适应陌生情境,并决定适当的任务。该“机器人宪法”…- 1.8k
-
OpenAI官方的Prompt工程指南:你可以这么玩ChatGPT
随着 ChatGPT、GPT-4等大型语言模型(LLM)的出现,提示工程(Prompt Engineering)变得越来越重要。很多人将 prompt 视为 LLM 的咒语,其好坏直接影响模型输出的结果。 如何写好 prompt,已经成为 LLM 研究的一项必修课。 引领大模型发展潮流的 OpenAI,近日官方发布了一份提示工程指南,该指南分享了如何借助一些策略让 GPT-4等 LLM 输出更好的…- 3.1k
-
研究人员诱导AI聊天机器人泄露有害内容,成功率高达 98%
印第安纳州普渡大学的研究人员设计了一种新的方法,成功地诱导大型语言模型(LLM)生成有害内容,揭示了隐藏在合规回答中的潜在危害。在与聊天机器人进行对话时,研究人员发现通过利用模型制作者公开的概率数据和软标签,可以迫使模型生成有害内容,成功率高达98%。 图源备注:图片由AI生成,图片授权服务商Midjourney 传统的越狱方法通常需要提供提示来绕过安全功能,而这种新方法使用概率数据和软标签来强制…- 2.4k
-
Real AI发布欧洲首个人本主义开源大语言模型项目HOMINIS
在贝尔格莱德于2023年11月23日举办的数据科学大会上,Real AI宣布成功中标ISCRA项目。Real AI将建设欧洲首个基于LEONARDO超级计算机的人本主义大语言模型(LLM)。 LEONARDO超级计算机位于博洛尼亚的CINECA数据中心,是一台高性能计算巨无霸。它基于Atos BullSequana XH2000计算机系统构建,集成了近14,000个Nvidia Ampere GP…- 2.7k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!