DeepSeek 全面指南,95% 的人都不知道的9个技巧(建议收藏)

news/2025/2/2 14:05:25/文章来源:https://www.cnblogs.com/tangshiye/p/18696818

大家好,我是汤师爷~

最近,DeepSeek这款AI工具爆火国内外。

虽然许多人都开始尝试使用它,但有人吐槽说,没想象中那么牛。

其实问题不在工具,很多人的使用姿势就搞错了,用大炮打蚊子,白白浪费DeepSeek的强大功能。

接下来,我将为大家分享9个实用技巧,你会发现DeepSeek远比想象中更强大。

DeepSeek的三种模式

DeepSeek有三大适用模式:基础模型(V3)、深度思考(R1)、联网搜索。

1. 基础模型(V3)

基础模型(V3)是DeepSeek的标配,没有勾选默认就是基础模型。V3版自去年12月升级后,性能大幅提升,堪比业内顶尖模型如GPT-4、Claude-3.5等。

它的作用相当简单,回答日常的百科类问题,帮助用户快速获取信息。

不管是查询常见知识、处理简单的文本生成任务,V3都能迅速给出答案。它的优点就是高效、便捷,几乎没有什么门槛,适用于大部分场景。

尤其是在用户并不要求复杂推理、深度分析的情况下,V3就显得尤为合适。比如你只想问一个简单的问题,或者需要一个快速的解答,V3足够应付。简单、直接,是它的最大特点。

2. 深度思考(R1)

R1作为DeepSeek的深度推理模型,专门用来解决那些需要复杂推理和深度思考的问题。它处理的任务更具挑战性,比如数理逻辑推理、编程代码分析等。

R1模型有660B的参数,并采用了后训练+RL强化学习方法,擅长从多个角度分析问题,并给出经过严密推理后的解答。

R1决定是一位专家,能够为你提供精确、深刻的推理和分析。因此,如果你的问题涉及到复杂的推理,R1便是不二的选择。

3. 联网搜索

联网搜索模式是DeepSeek的AI搜索功能,基于RAG(检索增强生成),这一模式让DeepSeek不仅能依赖它自己的知识库,还能根据互联网实时搜索相关内容来回答问题。

换句话说,联网搜索不仅让模型能够回答2024年7月以后的问题,还可以利用网络上的最新信息来补充自己的回答。

如何对标其他模型?

DeepSeek的三个核心模式,能够与chatGPT对标,为我们提供更清晰的选择。

1. V3对标GPT-4o

DeepSeek的V3模型堪比GPT-4o,二者的设计理念和应用场景非常相似。V3采用了Moe架构,拥有671B的参数量,能够在百科知识领域提供快速响应。

2. R1对标o1

R1是DeepSeek的深度推理模型,和OpenAI的o1模型非常类似。二者都在处理推理、深度思考以及复杂逻辑问题时,展现出了非凡的能力。

R1采用了660B的参数,并且在强化学习和后训练方面表现出色。R1更擅长逻辑推理和复杂问题的解答,在这一点上,R1已经超越了o1模型。

知识库的更新时间

目前,DeepSeek的预训练数据已经更新到2024年7月。

但对于之后的新闻或技术动态,DeepSeek的联网搜索模式就显得尤为重要,它能够根据网络实时获取最新信息,弥补知识库的空白。

告别提示词

很多AI熟手可能会囤一堆提示词模板,但是,DeepSeek 完全不用准备提示词,只要简单明了地描述你的需求,DeepSeek 就能理解并给出精准的答案。

举个例子,如果你想让 DeepSeek 帮你写一段蛇年拜年祝福语,直接告诉它这个需求,它就能立刻生成多个风格的版本。

与DeepSeek的对话,尽量使用简单、直白的语言。越是接地气的表达,DeepSeek就越能发挥其最大潜力。

避免过于正式、结构化的表述,简单、直白、带点口语化的语言往往能够获得最自然、流畅的答案。

DeepSeek的理解能力非常强,不需要过多的引导,给它一个清晰的问题,它就能提供精准的答复。

“小学生”沟通技巧

与DeepSeek对话时,有时我们可能觉得AI的回答过于抽象。

这其实源于传统AI模型过于注重结构化表达,结果都是“八股文”的回答,我们可以借助DeepSeek的“小学生”沟通技巧。

可以给它一个提示:“我是一名小学生,请用小学生能听懂的话解释什么是大模型。”

通过持续追问,获取详细答案

运用持续追问的技巧,能够帮你快速搞清楚一个复杂问题,大致步骤如下:

  1. 提出一个概括性的问题
  2. 基于回答内容进行深入追问
  3. 继续挖掘具体细节
  4. 将对话信息整理成清单格式

例如,我先问DeepSeek:“如何写好提示词?”

对于如何提供上下文,我还是不明白,我可以继续追问DeepSeek。

最后我让DeepSeek把对话整理成详细的清单格式。

活用联网搜索

联网搜索是DeepSeek的一大亮点,它让模型在回答时不仅仅依赖预训练数据,还能实时从网络上检索最新的信息。

你可以问到2024年7月以后发生的事件,或者某些新兴技术领域的问题,DeepSeek都能通过联网搜索为你提供更准确、及时的回答。

例如,你问DeepSeek:“2025年春晚有哪些节目?”它可以在网络上找到最相关的资料,并结合大语言模型的能力生成确的回答。

但是,最近DeepSeek受国外网络攻击,联网搜索暂不可用了,尴尬~

上传附件功能

除了联网搜索,DeepSeek还支持上传附件功能,这为用户提供了更多个性化的体验。

通过上传附件,你可以将自己的私密资料、知识库、甚至是一些需要深度推理的材料直接交给DeepSeek,让它基于这些专有的文件进行分析和推理。

上传附件最多支持50个文件,每个文件最大100MB,数据量较大的文件,DeepSeek也能处理自如。

R1的三个开放特性

对于深度思考(R1)模型,DeepSeek做到了三个重要的开放特性,让R1不仅仅是一个“黑盒”模型,它的思维过程、训练技术和模型参数都是透明开放的。

1. 思维链全开放

R1的思维链是完全开放的,用户可以看到模型进行推理时的每一步逻辑。

这不仅是一个回答,而是一个完整的思考过程。通过这种方式,用户能获得最终答案,还能够理解AI是如何得出这个结论的。

2. 训练技术全部公开

DeepSeek采用了RL(强化学习)技术,通过极少的标注数据提高了推理能力。

所有的训练技术,包括模型的后训练过程和数据增强方法,都是公开的。

这让广大网友都能深入理解模型的训练过程,并且可以根据需要进行调整和优化。

3. 开源模型

DeepSeek还将R1的部分模型进行开源。虽然R1模型本身的参数高达660B,通常只有大公司才能使用,但DeepSeek也为社区提供了更小的开源模型,让更多的开发者和研究者可以使用。

最小的模型只有1.5B参数,适合个人开发者进行实验和开发。

这格局太顶了,帮助全球的开发者共同推动AI的发展。

以上9个技巧,希望能帮助你更好地使用DeepSeek。欢迎大家在评论区分享你的使用技巧,一起探讨、学习。

本文已收录于,我的技术网站:tangshiye.cn 里面有,AI 编程、算法 Leetcode 详解、面试八股文、BAT面试真题、简历模版、架构设计,等经验分享。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/877993.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ez_pz_hackover_2016(shellcode)

首先检查一下保护,发现没有开启NX保护,说明可以往栈上写shellcode 首先要确定距离ebp的偏移,还有shellcode的地址(将ret覆盖到shellcode的地址上)确定离ebp偏移的代码 from pwn import * io=process("./ez_pz_hackover_2016") context.log_level=debug gdb.atta…

Android Studio 2024 不需要三方插件,直接wifi 开发调试,真方便

在测试旧版本时,wifi插件折腾了几天,还是没折腾上,最后下载了最新Android Studio Ladybug Feature Drop | 2024.2.2版本,发现居然已经集成,且放到了最显眼的位置,wifi开发,一步到位了。手机中,进开发者模式,选中 无线调试 ,再点使用二维码配对设备然后扫码,即可,…

Maven高级 -2025/1/22

分模块开发 依赖管理 可选依赖 <dependency><groupId>com.itheima</groupId><artifactId>maven_03_pojo</artifactId><version>1.0-SNAPSHOT</version><!--可选依赖是隐藏当前工程所依赖的资源,隐藏后对应资源将不具有依赖传递-…

独立开发经验谈:如何借助 AI 辅助产品 UI 设计

我在业余时间开发了一款自己的独立产品:升讯威在线客服与营销系统。陆陆续续开发了几年,从一开始的偶有用户尝试,到如今线上环境和私有化部署均有了越来越多的稳定用户,在这个过程中,我也积累了不少如何开发运营一款独立产品的经验。我将在本文中介绍如何借助 AI 辅助产品…

Lazarus4Android 环境搭建

Lazarus4Android 开发环境搭建Lazarus4Android 开发环境搭建 一、下载相关文件最关键的就是这两个文件,其他的JDK、NDK、Java环境另说。 这里要注意,gradle版本必须小于7,不然无法使用。 二、IDE内部设置 安装完成laz4A之后可能会报错,无需理会,启动IDE即可。安装卸载软件…

14-断点调试单个用例

在pycharm的Terminal输入hytest,其实是输入了python -m hytest.run,意思就是执行了hytest包里面的run.py文件 然后再点击debug按钮的时候就可以进行调试了,相当于执行了cd H:\my\autotest后 python.exe -m hytest.run --test *0101

博图18安装过程记录

博图V18安装过程记录刚开通博客园,搬运一些之前的帖子过来。 博图18安装过程记录 下载 西门子中智赛官网给的链接,是正版软件。 安装 TIA Potral STEP7将ISO解压或装载。管理员身份运行。 选择典型安装,等待安装完成。 插曲1 无法更改安装路径 这是因为之前安装过博图15.1(或…

题解:P11617 递推

前言 第一次在 OI 中见到求数列极限的题,有点意思。 但是为什么会过这么多人啊。 思路分析 做一点尝试: \[\sum_{i=m} \sum_{j=0}^{m} r_ja_{i-j}=0 \]然后对于相同的 \(a_i\),合并同类项: \[\sum_{i=m}\sum_{j=0}^{m} r_ja_i + \sum_{i=0}^{m-1}\sum_{j=0}^{i} r_{m-j}a_i…

AI编程助手带来的洞察和启发——程序员职业的变革

前言 从chatgpt的横空出世到国内大模型的强势崛起, 从AI只会写诗作画到辅助编程, AI作为新质生产力的重要角色逐渐进入各行各业,为行业带来新的可能性。Cursor、通义灵码这类"AI程序员"的出现一方面给编码工作带来了便利,另一方面也对软件从业人员带来极大的冲击…

个人数据保全计划:部署joplin server笔记同步服务

前言 在这个数据爆炸的时代,个人数据的价值愈发凸显,成为我们生活与工作中无可替代的重要资产。上一篇文章里,我介绍了从印象笔记迁移至 Joplin 的过程,这是我寻求数据自主掌控的关键一步。在探索同步方案时,我尝试了 OneDrive,原以为它能提供稳定高效的同步服务,可实际…

【deepseek】在deepin系统上部署运行deepseek-r1

环境配置LM-Studio官网:https://lmstudio.ai/修改“镜像源”cd /opt/apps/ai.lmstudio/files/LM_Studio/resources/app/.webpack/main 使用vscode打开进行编辑,./resources/app/.webpack/main/index.js./resources/app/.webpack/main/llmworker.js./resources/app/.webpack/m…

C++ 编译静态链接 (-static)

因为很长一段时间内并不知道这个编译参数究竟是干什么用的,只知道这个参数在 NOI 系列赛事中普遍使用,并且会导致编译输出文件变大,直到碰到具体问题了才发现这个参数的作用 -static 参数是静态链接开关,不加这个参数默认是动态链接,加上这个参数以后是静态链接,先说一下…