LLM

号称“业界首个对知识产权友好、商用安全”的 LLM，Adobe Firefly 文生视频 AI模型发布

Adobe 2 月 12 日推出了号称是“业界首个对知识产权友好、商业层面可安全使用”的 Firefly 文生视频 AI 模型。相应模型目前可以在 Adobe Firefly 网页端和 Adobe Premiere Pro 的 Generative Extend 功能中体验（当前处于 Beta 测试）。据 Adobe 介绍，用户可以通过文本提示或图像创建视频，然后通过添加“调整镜头角度”和各种氛…
资讯
- 1.7k
2 个月前
研究：训练数据含 0.001% 的错误信息足以“毒害”医学 AI模型

1月14日消息，纽约大学的一项研究揭示了大型语言模型（LLM）在医学信息训练中的潜在风险。研究表明，即使训练数据中仅含有 0.001% 的错误信息，也可能导致模型输出不准确的医学答案。数据“投毒”是一个相对简单的概念。LLM 通常通过大量文本进行训练，这些文本大多来自互联网。通过在训练数据中注入特定信息，可以使模型在生成答案时将这些信息视为事实。这种方法甚至不需要直接访问 LLM 本身，只需将目…
资讯
- 1.8k
3 个月前
豆包大模型发布各领域技术进展，首次披露 300 万长文本能力

字节跳动旗下豆包大模型12 月 30 日对外公布了 2024 年全领域的技术进展，宣称自 5 月 15 日首次亮相的 7 个月以来，在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。据介绍，截至 2024 年 12 月，最新版豆包通用模型 Doubao-pro-1215 综合能力较 5 月提升 32%，已全面对齐 GPT-4o，在数学、专业知识等部分复杂场景任务中，效果…
资讯
- 3.2k
3 个月前
Anthropic 新研究：打错字就能“越狱”GPT-4、Claude 等 AI 模型

12 月 25 日消息，据 404 Media 报道，人工智能公司 Anthropic 近期发布了一项研究，揭示了大型语言模型（LLM）的安全防护仍然十分脆弱，且绕过这些防护的“越狱”过程可以被自动化。研究表明，仅仅通过改变提示词（prompt）的格式，例如随意的大小写混合，就可能诱导 LLM 产生不应输出的内容。为了验证这一发现，Anthropic 与牛津大学、斯坦福大学和 MATS 的研究人…
资讯
- 3.2k
3 个月前
苹果研究人员质疑 AI 的推理能力：简单数学问题稍作改动就会答错

近年来，人工智能（AI）在各个领域取得了显著的进展，其中大型语言模型（LLM）能够生成人类水平的文本，甚至在某些任务上超越人类的表现。然而，研究人员对 LLM 的推理能力提出了质疑，他们发现这些模型在解决简单的数学问题时，只要稍加改动，就会犯错误，这表明它们可能并不具备真正的逻辑推理能力。周四，苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性》的论文，揭示 LLM 在解决…
资讯
- 3.3k
6 个月前
研究发现：AI 越聪明就越有可能“胡编乱造”

一项新研究发现，随着大型语言模型（LLM）变得越来越强大，它们似乎也越来越容易编造事实，而不是避免或拒绝回答它们无法回答的问题。这表明，这些更聪明的 AI聊天机器人实际上变得不太可靠。该研究发表在《自然》杂志上，研究人员研究了一些业界领先的商业 LLM：OpenAI 的 GPT 和 Meta 的 LLaMA，以及由研究小组 BigScience 创建的开源模型 BLOOM。研究发现，虽然这些 …
资讯
- 2.5k
6 个月前
微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期

微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里…
资讯
- 3.3k
9 个月前
三星确认今年将推出 AI 升级版 Bixby，由自研大语言模型提供支持

三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后，三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示，公司将在今年晚些时候发布升级版 Bixby，并由三星自家的大语言模型（LLM）提供支持。Roh 表示：“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前，三星推出过名为“Samsung …
资讯
- 3k
9 个月前
Hebbia 获得 1.3 亿美元融资，打造 AI 知识检索平台

总部位于纽约的 Hebbia 宣布获得了1.3亿美元的 B 轮融资，投资方包括 Andreessen Horowitz、Index Ventures、Peter Thiel 和谷歌的风险投资部门。 Hebbia 正在构建的是一个相当简单的东西:一个 LLM 本地化的生产力界面，使从数据中获取价值变得更加容易，无论其类型或大小如何。该公司已经与金融服务行业的一些大型公司合作，包括对冲基金和投资银行，…
资讯
- 3.6k
9 个月前
AI常用词汇有哪些？你应该知道的20个AI人工智能专业词汇！

正如加密货币的热潮带来了许多新行话一样，人工智能的热潮也带来了很多我们经常听到，但不一定都能理解的专业术语。如果你想了解聊天机器人和LLM（大型语言模型）之间的区别，或者深度学习和机器学习的区别，那你来对地方了，这里汇总了20个人工智能相关的术语，并提供了详细的解释。人工智能（AI）简单来说，人工智能就是让计算机或机器具备像人类一样的智能。这个词非常宽泛，包含了很多不同类型的机器智能。目前…
百科
- 23.9k
9 个月前
聊天机器人胡说八道？牛津研究人员利用语义熵来识破 AI“幻觉”

近年来，人工智能蓬勃发展，聊天机器人等应用逐渐普及，人们可以通过简单的指令从这些聊天机器人（例如 ChatGPT）获取信息。然而，这些聊天机器人仍然容易出现“AI幻觉”问题，即提供错误的答案，有时甚至是危险的信息。图源 Pexels 造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过，牛津大学的研究人员另辟蹊径，在最新出版的《自然》杂志上详细介绍了一种他们新开发…
资讯
- 2.6k
9 个月前
苹果高管：正努力将“Apple Intelligence”引入中国市场

苹果在 WWDC 2024 上发布了备受瞩目的 iOS 18 和 macOS 15 系统，其中一项重要的新功能是“Apple Intelligence”—— 一套基于人工智能的工具集。该功能将于今年晚些时候正式上线，苹果软件工程主管 Craig Federighi 在接受 Fast Company 采访时透露了一些关于 Apple Intelligence 的未来发展计划。 “Apple Inte…
资讯
- 3k
10 个月前
麻省理工科技评论称：数据是生成式AI的基础

预训练的大型语言模型（LLM）如 GPT-4和 Gemini 备受组织关注，他们渴望利用 LLM 构建聊天机器人、副驾驶等应用。根据麻省理工科技评论的最新报告，名为 “C 级领导人的 AI 准备情况”，该报告是代表 ETL 供应商 Fivetran 进行的调查发现，将 AI 或 GenAI 扩展是82% 受访高管的 “首要任务”。图源备注:图片由AI生成，图片授权服务商Midjourney 调查…
资讯
- 3.6k
10 个月前
古尔曼：苹果正自研设备端大型语言模型，赋能 AI 功能

据彭博社记者马克・古尔曼 (Mark Gurman) 报道，苹果公司正在研发一种运行于设备端的大型语言模型 (LLM) ，旨在提升即将发布的生成式 AI 功能的响应速度和隐私保护能力。古尔曼在其“Power On”通讯中提到，苹果的这个 LLM 将成为该公司未来生成式人工智能功能的基础。与现今大多数云端人工智能服务不同的是，所有迹象都表明该模型将完全运行于用户设备之上。由于运行于设备端，苹果的…
资讯
- 2.4k
11 个月前
蔡崇信：中国AI技术可能落后美国OpenAI两年

据媒体报道，阿里巴巴联合创始人、董事长蔡崇信坦诚地指出，在AI技术领域，中国相较于美国存在一定的差距”。他进一步指出，与美国的顶级大型语言模型（LLM）如OpenAI ChatGPT相比，中国可能落后两年”。然而，这并不意味着中国在这一领域的追赶步伐会放缓。蔡崇信强调，中国正积极努力迎头赶上由美国企业引领的新一轮AI浪潮。他坚信，长远来看，在面临英伟达芯片禁售的挑战下，中国将有能力自主制造高端G…
资讯
- 3.9k
1 年前
研究发现：GPT-4在临床推理中表现优于医生，但也更经常出错

在一项新研究中，美国贝斯以色列医疗中心（BIDMC）的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。研究人员使用了修订后的 IDEA(r-IDEA)评分，这是一种常用工具，用于评估临床推理能力。这项研究包括给予一个由 GPT-4提供支持的聊天机器人、21名主治医生和18名住院医生20个临床案例，以建立诊断推理并解决问题。然后，评估了这三组答案的 r-IDEA 分数。研究人员发现，…
资讯
- 1.7k
1 年前
70 亿参数，联发科推出 MR Breeze-7B 模型：擅长洞察数据、支持双语互动

联发科旗下研究机构联发科技研究中心（MediaTek Research）近日发布公告，展示推出了名为 MR Breeze-7B 的全新开源大语言模型（LLM）。这款开源模型擅长处理繁体中文和英文，共有 70 亿个参数，以广受赞誉的 Mistral 模型为基础进行设计。与上一代产品 BLOOM-3B 相比，MR Breeze-7B 所吸收的知识显著增加了 20 倍，让其能以更高的精确度驾驭繁体中…
资讯
- 3.6k
1 年前
Meta发布全新AI自动剪辑视频工具Agents LAVE

Agents LAVE是Meta发布的全新AI自动剪辑视频工具，采用AI技术实现简单短视频和广告视频的自动生成，无需人工干预。工具界面包括输入提示、素材库和视频时间轴，而Agents设计则指导编辑行动计划的执行。论文地址:https://arxiv.org/pdf/2402.10294.pdf Agents支持五种LLM功能，包括素材概览、创意头脑风暴、视频检索、故事板和剪辑修剪，实现自动生成的…
资讯
- 64.9k
1 年前
ChatGPT高质量prompt技巧分享，26条Prompt提升ChatGPT输出质量！

今天，给大家找到了一篇指导写大语言模型提示（prompt）的论文～（有实验数据支撑，效果杠杠滴！）论文介绍了26条指导原则，目标是简化为不同规模的大语言模型制定问题的概念，检验它们的能力，并增强用户对于不同规模的模型在接受不同提示时的行为理解。研究者在LLaMA-1/2（7B、13B和70B）和GPT-3.5/4上进行了广泛实验，以验证这些原则在指令和提示设计上的有效性。论文中指出：大语言模型…
教程
- 5.9k
1 年前
研究：网络充斥低质机翻内容，大语言模型训练需警惕数据陷阱

亚马逊云计算人工智能实验室的研究人员发现，网络上大量内容来自机器翻译 (MT) 生成，这些跨越多种语言的翻译内容质量普遍较低。研究团队强调，这凸显了在训练大型语言模型 (LLM) 时，数据质量和来源考量的重要性。图源 Pexels 研究还发现，机器生成内容在资源较少语言的翻译中很普遍，并占网络内容的很大一部分。 IT之家注意到，研究团队开发了名为多维 cc 矩阵 (MWccMatrix) 的庞大…
资讯
- 2.2k
1 年前
甲骨文的 OCI 生成式 AI 服务现已推出

Oracle 宣布了 Oracle Cloud Infrastructure（OCI）Generative AI 服务的普遍可用性，以及使企业更轻松地利用生成 AI 的最新进展的新创新。 OCI Generative AI 服务是一项完全托管的服务，无缝集成了来自 Cohere 和 Meta Llama2的大型语言模型（LLM），以解决各种业务用例。OCI Generative AI 服务现在具有…
资讯
- 2.7k
1 年前
苹果AIM自回归视觉模型验证性能与模型规模有关

苹果公司的研究者通过自回归图像模型（AIM）验证了视觉模型“参数越多性能越强”的规律，进一步证明随着容量或预训练数据量的增加，模型能不断提升性能。AIM能有效利用大量未经整理的图像数据，训练方法和稳定性与最近的大型语言模型(LLM)类似。这一观察结果与之前关于扩展大型语言模型的研究结果是一致的。虽然本文实验所使用的模型规模有限，还需进一步探索是否能在更大参数量级的模型上验证此规律。研究者使用的预…
资讯
- 4.3k
1 年前
LLM AutoEval:AI平台自动评估Google Colab中的LLM

在自然语言处理领域，语言模型的评估对于开发人员推动语言理解和生成的边界至关重要。LLM AutoEval是一款旨在简化和加速语言模型（LLMs）评估过程的工具，专为寻求快速高效评估LLM性能的开发者定制。 LLM AutoEval具有以下关键特点: 1. **自动化设置和执行:** LLM AutoEval通过使用RunPod简化设置和执行过程，提供方便的Colab笔记本，实现无缝部署。 2. *…
资讯
- 8.7k
1 年前
Canalys：预计中国厂商将率先将 AI 手机打入更低价位段

今日分析机构Canalys发布报告称，中国本土智能手机厂商近期积极投资于自主开发的大语言模型（LLM）。随着 SoC 的更新迭代和市场存储配置的快速升级，中国厂商开始更加聚焦于端侧 AI 能力。中国本土厂商在当地市场拥有生态优势，这使得 AI 能够发挥更大的效用。他们通常在本地市场拥有更高的附加率，并提供更全面的硬件产品覆盖。在硬件品类广泛覆盖和坚实的用户基础下，AI 能够催生更多样化的使用场景…
资讯
- 2.9k
1 年前