第 1 章 AI 大语言模型 (LLM)

你可能会想:「AI 对话到底能帮我做什么?我从来没写过代码,能用吗?」

放心,这一章就是写给像你一样的普通人看的。大语言模型说白了,就是一个「特别会聊天的超级助手」——你可以用大白话问它问题、让它帮你写邮件、总结长文章、甚至一起想点子。下面我们会用最直白的话解释它是什么、怎么选、以及手把手教你在每个工具里点哪里、输入什么,一步步跟着做就能会。

一、本类概览与工作原理

1.1 用一句话理解「大语言模型」

你可以把大语言模型(LLM)想象成一个读过很多很多书、而且特别会聊天的助手:它不光能回答问题,还能根据你的要求写一段文字、列一个清单、甚至帮你改作文、写简单的代码。你用什么话问,它就尽量用你能懂的话答;你让它「简短点」或「正式一点」,它也会跟着调整。

记住这一点就够了不需要你会编程,只要会打字、会说话,就能用——就像和一位见多识广的朋友聊天一样简单。

1.2 它能帮你解决哪些实际问题?

日常里很多「费脑子」的事,都可以先丢给 AI 试试:

✉️

不知道怎么写

请假邮件、活动通知、朋友圈文案——说「帮我写一封……的邮件」,几秒钟就有一版,改改就能用。

📄

文章太长看不完

把长文或 PDF 丢给它,「用三句话总结」「列出五个要点」,省下不少阅读时间。

💡

想点子、列方案

「周末团建有什么好主意」「产品名字起几个备选」——随时帮你头脑风暴。

🔍

查东西、解释概念

「什么是 XX」「YY 和 ZZ 有啥区别」——用对话问,比自己在网上翻来翻去快很多。

不同产品有的更擅长写长文,有的更擅长写代码,有的支持上传图片或文件一起分析。后面同类工具对比会帮你按需求选一个最合适的。

1.3 原理一句话(好奇再读)

技术上说,大语言模型是在海量文本上「学过」的 AI:它学会了语言里的规律和常识,所以能根据你输入的话预测下一句最可能是什么,于是就有了「在跟你对话」的感觉。你不需要懂这些也能用好它;只要记住:你问得越清楚,它答得越靠谱

1.4 谁适合用?需要会什么?

零基础、非专业完全没问题。绝大多数产品都是「打开网页或 App → 输入框里打字 → 等回复」,跟发微信差不多。只有当你打算把 AI 接到自己的网站、或自己部署开源模型时,才需要一点技术背景。

国内用户注意豆包Kimi通义千问文心一言等需要在合规网络下使用,具体以各官网为准;使用前建议看一眼各家的隐私政策服务条款,做到心里有数。

二、同类工具对比

市面上的大模型很多,不用全试一遍。下面先给你一个「懒人速查」,再看详细表。

懒人速查:如果你只想先玩一玩、啥都试试 → 选 ChatGPT豆包(国内);如果你经常要处理很长很长的文档 → 选 KimiClaude;如果你想省钱、又要写代码 → 试试 DeepSeek;如果你用 Google 比较多 → 选 Gemini;如果你常刷 X(Twitter)、想要实时资讯和犀利风格 → 试试 Grok(马斯克旗下 xAI)。没有「天下第一」,按你的使用习惯选一个先用熟就好。
想先玩一玩 → ChatGPT / 豆包
长文档、办公 → Kimi / Claude
省钱 + 写代码 → DeepSeek
常用 Google → Gemini
刷 X、要实时信息 → Grok

2.1 主流模型对比表

下表按综合能力由强到弱排序(同一梯队内顺序不分先后),方便你一眼看出「第一梯队是谁、谁更偏性价比」。多数模型有多个版本(如 GPT 有 5.2 Pro / 5.3-Codex),在「典型版本」列做了标注;价格与最新版本以各官网为准,产品名可点击直达。

梯队 模型 / 产品 典型版本 厂商 上下文 多模态 开源 免费层 国内可用 主要优势 适用场景
1ChatGPT / GPT5.2 Pro(主力)、5.3-Codex(编程/Agent);GPT-6 规划中OpenAI图/音有(限)需网络推理与综合领先、响应快通用对话、复杂任务
1ClaudeOpus 4.6、Sonnet 4.6;1M 上下文(beta)Anthropic超长/1M图/文档有(限)需网络编程与长文档 SOTA、Excel/PPT写代码、长文、办公
1Gemini3 Pro、3.1 Pro;1M 上下文、Deep ThinkGoogle超长/1M图/音/视频有(限)需网络知识广、性价比高、多模态长文档、多模态、Google 用户
2GrokGrok 4、Grok 4 Heavy;扩展推理、实时xAI图/文档有(限)需网络实时信息、与 X 整合、风格可选通用、追热点、刷 X
2DeepSeekV3.2、V3.2-Speciale;成本约 GPT 1/30DeepSeek有(限)近前沿、极低 API 价、代码强省钱、写代码、批量
2豆包2.0(Seed-2.0);Seedance 2.0 视频、Seedream 5.0 图字节跳动图/音/视频有(限)国内日活领先、多模态原生国内、手机、短视频
3Kimi超长上下文系列(约 20 万字级)、Agent月之暗面超长文档有(限)超长文本、办公流长文阅读、办公、研究
3通义千问Qwen 3.5-Plus 等;MoE、开源生态多阿里巴巴图/音可选有(限)多模态、电商、B 端、开源电商、B 端、自建
3智谱 GLMGLM-5;Agent 长工程、部分榜单第一智谱 AI有(限)企业 Agent、复杂系统企业、工程、B 端
3文心一言多版本;RAG 2.0、知识增强百度有(限)政企金融、知识增强金融、政务、医疗
4MistralLarge 3;开源/商业可选Mistral可选需网络接近前沿、多语言企业、自建、多语言
4Llama4 Maverick;开放权重、自托管Meta部分自建免费需自建隐私、本地、可商用权重本地部署、隐私、开发
5腾讯混元多版本;视频生成强腾讯图/视频有(限)通用中文、视频质量一流通用、国内、视频
5讯飞星火多版本;深度推理、语音强科大讯飞图/音有(限)语音+多模态、教育/办公语音、教育、办公
5华为盘古行业大模型、L1/L2 架构华为多模态商用政企、行业定制政企、B 端、华为云

说明:梯队 1 为当前综合能力顶尖,2 为一线/高性价比,3 为国内 T0/T1 或强通用,4 为开源/自建友好,5 为垂直或政企向。多模态含图/音/视频等;免费层「有(限)」表示有免费额度但有限制。

三、各工具从零到熟练教程

下面按对比表顺序(能力由强到弱)依次介绍:ChatGPT → Claude → Gemini → Grok → DeepSeek → 豆包。每个工具都会一步一步教你怎么打开、怎么发第一句话、怎么玩转常用功能,跟着做零基础也能立刻上手。

ChatGPT(OpenAI)—— 最出名的 AI 对话

第一步:打开网站并登录

在浏览器地址栏输入 chat.openai.com(或搜索「ChatGPT 官网」)。第一次打开会提示你登录或注册。

1

点「Log in」或「Sign up」。可以用邮箱注册,也可以选「Continue with Google」或「Continue with Apple」用已有账号登录,按页面提示填完就行。

2

部分地区会要求验证手机号,按提示输入收到的验证码即可。完成后就会进入对话界面。

第二步:发你的第一句话

进入后你会看到:下方一个大输入框,有时上面还会有一两句示例问题(比如「解释量子力学」「写一首诗」)。

3

在输入框里用键盘打字,比如:「你好,请用一句话介绍你自己。」然后按 回车(Enter) 或点输入框右侧的发送按钮。

4

几秒钟后,下方会出现 AI 的回复。这就是一次完整的「一问一答」。你可以接着在同一个输入框里继续问,比如「那你能帮我做什么?」——它会记住你们刚才的对话,这就是多轮对话

第三步:试试「让它帮你写东西」

5

在输入框里输入:「帮我写一封简短的请假邮件,理由是家里有事,请假一天。」发送后,AI 会给你一整段写好的邮件,你可以直接复制到邮箱里用,或者再说「语气再正式一点」「改成半天」让它改一版。

第四步:上传文件或图片(可选)

6

在输入框的左边,一般会有一个「+」号或「回形针」图标,点一下可以选择上传图片或文件(如 PDF、Word)。选好后,再在输入框里输入你的问题,比如「请总结这份 PDF 的要点」或「这张图片里有什么」,AI 就会结合你传的内容来回答。

小技巧:说得越具体,回答越有用。比如不说「写个邮件」,而说「写一封给领导的请假邮件,理由生病,请假两天,语气礼貌」——AI 会更容易写出你要的风格。
使用限制与注意:免费版有次数/频率限制,高强度使用需订阅 ChatGPT Plus;部分地区或网络可能无法直接访问,需自行确认当地政策。你的对话内容可能被用于模型改进(详见 隐私政策),敏感信息建议勿输入。回答受内容政策约束,某些话题可能被拒绝;商用请以 服务条款为准。
Claude(Anthropic)—— 擅长长文和编程的助手

第一步:打开并登录

在浏览器里输入 claude.ai,或搜索「Claude 官网」。

1

点「Sign up」或「Log in」,可以用邮箱注册,也可以选「Continue with Google」等。部分功能需要订阅 Pro,但免费版也足够日常对话和写东西

第二步:先聊一句,再丢长文

2

登录后同样是一个大输入框。先随便问一句「你好,你能做什么?」熟悉一下界面。

3

Claude 的强项之一是处理很长的文字。你可以把一篇长文章复制粘贴到输入框里,然后在下面加一句:「请用 3 个要点总结上面这篇文章」,或者「根据上文,列出所有提到的人名和他们的观点」。它会把整段都读进去再回答。

第三步:上传文件

4

输入框附近有上传入口(图标或「Attach」),可以上传 PDF、TXT 等。上传后,在输入框里输入「请总结这份文档的主要内容」或「第二页里说了什么」,Claude 会结合文档内容回答。

小技巧:如果你要它「按格式」输出,直接说清楚,比如「请用 bullet points 列出」「用表格形式总结」,效果会更好。
使用限制与注意:免费版可用日常对话与长文分析,Pro 订阅解锁更多额度与功能,见 定价页。部分地区需合规网络才能访问。对话受内容政策限制;隐私与数据处理见 Anthropic 隐私政策。若通过 API 或集成商用,请查阅 官方文档与商业条款。
Gemini(Google)—— 用 Google 账号就能玩

第一步:用 Google 账号打开

在浏览器输入 gemini.google.com,或搜索「Google Gemini」。

1

页面会提示你用 Google 账号登录。如果你已经有 Gmail,直接选账号、输入密码即可,无需重新注册。

第二步:对话 + 传图

2

进入后同样是输入框。你可以打字问问题,也可以点「上传」或「图片」图标,传一张照片,然后问「这张图里有什么」「请描述一下」,Gemini 会同时「看」图和你写的字来回答,这就是多模态

第三步:和 Gmail、Drive 联动(可选)

3

如果你开通了 Google 的 AI Premium 等方案,Gemini 可以读取你的 Gmail、网盘文件(需授权)。在界面里会有「连接到 Google 应用」之类的选项,按提示操作即可;不用也没关系,单对话和传图已经很好用。

小技巧:问「用中文回答」或「请用简体中文」,它会优先用中文回复,避免出现整段英文。
使用限制与注意:免费版有额度限制Google One AI Premium 等订阅可提升用量。服务与你的Google 账号关联,部分数据可能用于产品改进,详见 Google 隐私政策。回答受内容政策约束;商用与 API请以 Google AI 文档及条款为准。
Grok(xAI / 马斯克)—— 实时资讯与「犀利」风格

第一步:打开网页、App 或在 X 里用

Grok 是马斯克旗下 xAI 的 AI 对话产品,有三种常用入口:

1

网页版:在浏览器打开 grok.com,用邮箱或 X(Twitter) 账号登录即可开始对话。界面和 ChatGPT 类似,下方输入框打字、上传图片或文件都可以。

2

手机 App:在 App Store 或 Google Play 搜索「Grok」安装 iOS / Android 版,登录后即可使用。

3

在 X 里用:如果你已是 X Premium+ 订阅用户,在 X 网页或 App 的左侧边栏或导航里找到 Grok 图标(或打开 x.com/i/grok),点进去即可在时间线旁和 Grok 对话,无需再单独开网页。

第二步:发第一句话,试试「实时」和风格

4

在输入框里打字问问题,比如:「今天科技圈有什么大新闻?」「用三句话总结一下某某事件。」Grok 能结合 X 平台和网络实时信息 回答,适合追热点、要「刚发生的事」时用。

5

部分版本可选「标准/实用」「趣味/犀利」等风格,回答会更有个性;需要严肃、简洁时选标准即可。

第三步:传图、文档与高级能力(视订阅)

6

在 grok.com 或 App 里可以上传图片、PDF,让 Grok 看图、总结文档。若订阅 SuperGrok,还可使用更强模型(如 Grok Heavy)、更高额度及深度推理等,详见 grok.com/plans

小技巧:问「用中文回答」或「请用简体中文」即可获得中文回复。适合「刚发生的新闻、社交媒体热点、实时趋势」类问题;写代码、长文档总结也支持,可按需和 ChatGPT、Claude 换着用。
使用限制与注意免费版有额度与功能限制,完整能力与更高额度需 SuperGrok 订阅。在 X 内使用需 X Premium+ 会员。服务与 xAI / X 账号 关联,隐私与数据xAI 隐私政策;回答受内容与安全政策约束,详见 Safety商用与 APIdocs.x.aiconsole.x.ai,部分地区/网络可能受限,以官网为准。
DeepSeek —— 便宜又好用的「写代码小能手」

第一步:打开聊天页或注册 API

在浏览器输入 chat.deepseek.complatform.deepseek.com(后者偏开发者)。

1

若用网页聊天:打开 chat.deepseek.com,按提示注册/登录(可用邮箱或手机),就会看到和 ChatGPT 很像的对话界面,直接打字问即可。

2

若你打算在自己写的程序里调用:打开 platform.deepseek.com,注册后进入「API Keys」,创建一个 Key,然后按照页面的「文档」把 Key 填进你的代码里(这一步需要一点编程基础,零基础可以先用网页版)。

第二步:日常怎么用网页版

3

在输入框里用中文或英文提问都可以。比如:「用 Python 写一个程序,读入一个列表,输出里面的最大值。」DeepSeek 会给你一整段代码,并简单解释。你可以把代码复制到本地运行,或继续问「如果列表是空的怎么办」让它改进。

小技巧:DeepSeek 价格很低,适合「问很多次、写很多段代码」也不心疼;回答质量接近大厂,尤其写代码很实用。
使用限制与注意:网页版有免费额度与限流,大量使用或接入应用需用 API 并按 计费说明付费。对话数据与隐私以平台政策为准;回答受内容政策约束。商用请查阅官网服务条款与 API 使用规范。
豆包(国内)—— 手机上也很好用

第一步:下载 App 或打开网页

国内用户可以直接在应用商店搜索「豆包」下载 App,或用浏览器打开豆包官网:www.doubao.com电脑版下载)。

1

打开后需要用手机号或抖音/头条账号登录(属字节系产品)。登录后就能看到主界面:通常是底部或中间有一个输入框,上面可能有一些推荐问题或最近对话。

第二步:打字或语音

2

在输入框里打字提问,和用 ChatGPT 一样。很多版本还支持语音输入:点麦克风图标,直接说话,它会转成文字再回答,特别适合在路上或不想打字的时候。

第三步:传图、生成图片或视频(视版本)

3

豆包集成了多模态:可以上传图片让 AI 看图回答;部分版本还支持「生成图片」「生成短视频」(Seedream、Seedance),在对话里直接说「画一张……」「生成一段……的视频」,按提示操作即可。具体入口以当前 App 或网页为准。

小技巧:国内访问稳定,手机端体验好;若涉及隐私或工作内容,注意阅读豆包的隐私条款和数据处理说明。
使用限制与注意:基础功能免费,部分高级能力(如专业创作、更多文档解析)需订阅,见 官网说明。使用需国内网络与账号(如手机号、抖音/头条)。隐私与数据处理请阅读豆包/字节的隐私政策;内容受审核与内容政策约束。图片/视频生成(如 Seedream、Seedance)以当前产品说明与使用范围为准;商用请查阅服务条款。

其他如 Kimi通义千问文心一言智谱 GLMMistral Le Chat讯飞星火腾讯混元华为盘古 等,用法大同小异:都是「打开官网或 App → 登录 → 在输入框里打字或上传内容 → 看回复」。你只要记住:先选一个用熟,再慢慢试别的,就不会乱。

四、进阶与延伸学习链接

下面这些链接适合你想深入了解、查最新功能或价格时用。零基础先把上面「从零到熟练」练会,再按需点开即可。

4.1 官方文档(查功能、价格、API)

下面每个链接都可以直接点击跳转到对应页面,查模型说明、价格和接入方式。

4.2 想看看「谁更强」?

4.3 社区和延伸阅读

国内知乎即刻等平台搜索「ChatGPT 技巧」「Claude 用法」会有很多接地气的分享;知乎可搜 ChatGPT 技巧Claude 用法 直接跳转搜索结果。

小结:这一章你学会了「大语言模型是什么」「怎么按需求选一个」以及 ChatGPT、Claude、Gemini、Grok、DeepSeek、豆包 六个工具从打开到熟练的详细步骤;对比表里还列出了 Mistral、Llama、腾讯混元、讯飞星火、华为盘古等,可按需点链接进一步了解。接下来可以选一个你最喜欢的,先玩一周,再回来看对比表试试别的。下一章我们会讲「企业级 Agent」—— 让 AI 不只回答,还能帮你自动执行任务。