最近,几乎每天(真的,排期排到了下周末…),我都在给各单位(有律师、行政、市场、医生、教育工作者以及创业者等)做DeepSeek的线下分享。
在这些分享中,大家提了很多有意思的问题,这些问题是AI从业者绝对想不到的问题,比如:
- 我的文件传给了AI,会不会泄密?
- 为什么扣子不能订阅公众号?
- 这个AI到底是个什么东西?
- 为什么AI会编造法律条文和案件编号,而且表现得如此自信?
- AI能不能像抖音一样懂我?
- ……
是不是很有意思?真・用户根本不Care什么参数、性能、模型架构这些东西,人家就三大哲学问题——这玩意到底能不能用?怎么用?用了会不会有事?
尽管这轮生成式AI通过自然语言交互降低了我们的使用门槛,但要将其从“玩具”升级为“工具”,仍有一定的难度。
以DeepSeek-R1推理模型为例,要想充分发挥其潜力,掌握一些使用技巧是必要的。
今天,我将继续探讨一些实用的技巧,以帮助大家更好地用好推理模型。
1、非必要不联网
联网后,如果提供的RAG知识库不够权威或丰富,反而会降低模型的智力表现。而且,中文互联网上的垃圾实在太多,难以保证搜索结果的可靠性。
这里,给小学生解释一下RAG(Retrieval检索-Augmented增强-Generation生成)。它是去年兴起的一种新技术,通过检索系统从海量数据中精准定位与用户查询最相关的信息片段,然后用这些信息作为模型的输入,来生成通顺、词意趋近的回答。
通常情况下,建议优先依赖模型自身的数据集来回答问题。
如果必须联网,建议优先选择搜索能力强的AI(比如秘塔AI搜索,信源广,且支持自定义“来源偏好”)、信源质量高的AI(如可搜公众号的腾讯元宝)以及能够搜外网资源(如GitHub、Reddit、Medium)的AI。
2、指定搜索信源
中文互联网上充斥着大量的垃圾信息和营销号内容,因此指定信源可以显著提升搜索结果的权威性。
1)添加“只搜索政府官方文件”提示。
如:《民营经济促进法》讲了哪些?只搜索政府官方文件。
可以看到,DeepSeek重点搜索了政府网站和官方媒体信息,再也没有那些乱七八糟的网站了,更不会有法律推广网站的信息。
2)使用“site:xx域名”命令。
如:宇树科技有哪些产品?site:unitree.com。
可以看到,模型重点抓了宇树科技官网unitree.com的信息。
3)如果你不知道该指定什么信源,可以直接使用这句万能模板(提法By云中江树)。
为了让搜索结果精准权威,请使用高级搜索技巧生成搜索关键词。
把这句话加在问题的最后,就可以了。
比如:中国科技“七姐妹”是哪七个?最近表现如何。为了让搜索结果精准权威,请使用高级搜索技巧生成搜索关键词。
我们来看看DS的回答,这个结果是不是要靠谱多了?
而且,它引用的都是正规媒体。50个搜索网页,我去一一溯源了下,几乎都是主流财经媒体的信息(比如界面新闻、新浪财经、东方财富、华尔街见闻、澎湃新闻等),没有营销号的内容。
3、DeepSeek+其他AI
DeepSeek有自己擅长的(思考、写作),也有不擅长的(比如视觉识别、联网能力、代码能力、多模态能力)。因此,将DeepSeek与其他AI工具结合使用,可以发挥各自的优势。
比如制作PPT,可以先通过DeepSeek生成大纲,然后再将大纲发给Gamma/百度文库/AiPPT/通义PPT/讯飞智文生成PPT。
再比如制作视频,可以先通过DeepSeek撰写脚本、提示词,再用可灵/万相/混元/海螺/清影等视频模型生成视频。
4、满血版≠真·满血版
最近,很多产品都宣称自己接入了DeepSeek-R1满血版。
但实际上,各家所谓的满血版基本都经过了微调或量化处理。
要么是修改了系统提示词,让AI模型的工作逻辑,变得跟自家公司画风一致。
DeepSeek-R1系统提示词(官方)。
DeepSeek-R1搜索提示词(官方)。
DeepSeek-R1文件上传提示词(官方)。
要么是做了模型量化,也就是对671B的原生R1模型做了“压缩”处理,比如减少思维链,减少输出tokens等。毕竟,量化后的模型又快又省钱嘛。
真正的满血版仅存在于DeepSeek官网、APP以及通过API调用的版本。
5、不是所有场景都需要R1
DeepSeek提供了V3通用模型和R1推理模型。
R1擅长复杂的推理和深度分析,适合处理“开放性”任务;而V3在“规范性”任务上表现更为高效和准确。
并非所有的场景,都一定要用R1。