第 10 章：AI 时代：当你的手机比你还懂你

约 8820 字大约 29 分钟

2025-12-22

两年前，ChatGPT 横空出世，全世界第一次意识到"机器真的能聊天了"。
两年后的今天，AI 已经能写代码、画图、作曲、做视频、通过律师资格考试。最新的模型每隔几个月就刷新一次认知。价格在崩盘，能力在暴涨，开源在追赶闭源，中国的 DeepSeek 用不到 OpenAI 十分之一的成本做出了同级别的模型。
你生活在这个时代，但你真的理解这一切是怎么回事吗？

先搞懂原理：神经网络是什么东西

你不需要数学基础。用三件事就能理解神经网络：

1. 神经元：一个会投票的开关

想象一个神经元是班上的一个同学。他接收其他几个同学传来的消息（输入），每条消息有一个"重要程度"（权重）。他把这些消息加权求和，如果总和超过某个阈值——他就举手（激活），把消息传给下一排同学。

一个神经元做的事就这么简单：接收 → 加权求和 → 过阈值 → 输出。

2. 网络：一堆神经元堆叠

一个神经元没啥用，但几千亿个神经元叠在一起——分层排列，每一层的输出变成下一层的输入——就形成了"神经网络"。层数越多，网络越"深"。"深度学习"的"深"，指的就是这个层数。

第一层可能只认边缘和颜色，第三层认出了眼睛和鼻子，第十层认出了整张脸。没有人去教每一层"你应该干什么"——它是自己从数据里"悟"出来的。

3. 训练：不断猜、不断改

训练一个神经网络，逻辑上很简单：

给网络看一张猫的照片 → 网络猜"狗" → 错了，回头调权重
给网络看一张猫的照片 → 网络猜"猫" → 对了，保留这个方向

这个过程重复几十亿次。每次猜错，算法（反向传播 + 梯度下降）会自动把所有权重往"猜得更对"的方向微调一点点。几十亿次微调之后，网络就"学会"了猫和狗的区别。

没有人告诉网络"猫有尖耳朵，狗有长嘴巴"——这些规则是它自己从几亿张图片中归纳出来的。这就是为什么我们称它为"学习"而不是"编程"。

为什么 2012 年之后突然爆发

神经网络的理论基础在 1980 年代就已经完善了。为什么等到 2012 年才爆发？三个条件同时到齐：

GPU 并行计算：一块显卡能同时跑几千个简单计算——恰好就是神经元干的事。训练速度提升了 100 倍。
海量数据：互联网产出了 ImageNet（1400 万张标注图片）、Common Crawl（几十亿网页）。神经网络需要海量例子才能学好。
更好的初始化算法：以前网络层数一多就"训不动"，2012 年 AlexNet 用 ReLU 激活函数和 Dropout 正则化解决了这个问题。

2012 年 AlexNet 在 ImageNet 图像识别比赛中碾压了所有传统方法——误差率从 25% 降到 16%。研究界一夜之间全部转向深度学习。

规模定律（Scaling Laws）

2020 年，OpenAI 发现了一个看起来"暴力"但极其有效的规律：模型参数越多、训练数据越多、算力越大，模型的能力就越强——而且这种提升是可预测的。

就像一个数学公式：投入翻倍，能力按固定比例涨。这解释了为什么科技公司愿意砸几十亿美元训练更大的模型——他们不是在猜，他们知道砸钱一定有效。

但这个规律也有天花板，后面会讲到。

Token：AI 世界的"字"

和 AI 打交道时，你会频繁看到"Token"这个词。它的中文翻译很乱——"令牌"、"词元"、"标记"，都指同一个东西。

Token 是什么？

AI 读文本时逐个处理 Token——Token 是 AI 的"最小阅读单位"。它介于字和词之间，不完全对应汉字也不完全对应英文单词。一个粗略的对应：

1 个中文字 ≈ 1-2 个 Token
1 个英文单词 ≈ 1-3 个 Token
代码里的符号和括号通常是 1 个 Token

为什么你在乎 Token？

因为 AI 计费按 Token 算。API 调用的价格表写着"每百万 Token X 元"——输入算一次，输出算一次。而且每个模型有 Token 上限（上下文窗口）——GPT 5.5 一次最多读 256K Token（大约可以读一本《三体》第一部）。超过这个量，旧的对话内容就会被截断。

中文在 Token 数量上通常比英文省——同样的意思，中文需要的 Token 数更少。这就是为什么国内 AI 模型的 API 定价，按 Token 算看起来比国外便宜的一个原因（另一个原因是确实便宜）。

AI 天梯榜：到底谁最厉害

"哪个 AI 最强？"——这个问题没有绝对答案，因为不同的评测测不同的东西。但目前最有参考价值的评测平台是 LMSYS Chatbot Arena（聊天机器人竞技场）。

它的运作方式很简单：你随便问两个匿名模型同一个问题，你选哪个回答更好，然后公布排名。这种"盲测"机制很难作弊——投票者是真实用户，不是固定题库。

截至 2026 年 5 月，榜单前几名变化极快：

排名	模型	特点
Top 3	GPT 5.5（OpenAI）	推理深度最强，考试型选手，成本也最高
Top 3	Claude Opus 4.7（Anthropic）	编码和长文本最强，可靠性最高
Top 3	Gemini 3.1 Pro（Google）	多模态原生整合，上下文窗口最大
Top 10	DeepSeek R1/V3（深度求索）	开源最强，成本极低，推理能力追平闭源
Top 10	Qwen 3.7（阿里通义）	国内开源旗舰，多语言能力突出
Top 20	GLM 5.1（智谱）	清华系，学术能力突出，Agent 工具调用好

这个榜单的教训：没有任何一个模型能在所有维度上同时拿第一。排名每周都在微调，每个月可能有新面孔进入前十。在 AI 领域，今天的王者可能下周就变成第二名——这个节奏本身才是真正的故事。

除了 LMSYS，还有哪些评测

MMLU / MMLU-Pro：大学水平知识考试，测"博学程度"
HumanEval / SWE-bench：编程能力评测，自动修 GitHub Issue
AIME / GPQA：数学和科学推理，研究生难度
Chatbot Arena 分类榜：按编程、写作、长文本、多语言等维度拆分排名

每个榜单测的是不同维度的能力。没有一个榜单能完整描述一个模型的全部能力。

2026 年 AI 全景图

DeepSeek：中国团队震动硅谷

2025 年初，一家不太有名的中国公司"深度求索"发布了 DeepSeek V3 和 DeepSeek R1，整个 AI 行业震动了。

震动的原因很简单：

成本：训练成本只有 OpenAI 同类模型的十分之一。不是大公司烧不起——是大公司发现自己的烧法可能不对。
开源：模型权重全公开，任何人都能下载、微调、商用。开源社区一晚上就把它部署到了全世界。
推理能力：R1 的"思维链"推理追平了 OpenAI o1，但完全开源，你可以在本地跑。
价格战：DeepSeek API 的价格低到让整个行业被迫跟进。API 使用成本在 18 个月内降了 90% 以上。

DeepSeek 证明了一件事：算力优势不是护城河。算法效率可以追平算力差距。

对国内大学生的意义更大——DeepSeek 是国内团队、完全开源、免费使用。你不需要翻墙，不需要美元信用卡，打开官网就能用。它就是你能日常对话的最强 AI 之一。

MoE 架构：DeepSeek 的工程技术秘密

DeepSeek 的省钱秘诀之一叫 MoE（Mixture of Experts，混合专家）。传统大模型在处理每个 Token 时激活全部参数，MoE 只激活其中一小部分"专家"子网络——就像一个诊所，你来看眼睛就只叫眼科医生，其他科室歇着。

DeepSeek V3 有 671B 参数，但处理每个 Token 只激活了 37B。这就是为什么它能用很小的成本获得几乎一样的能力。

国际三大阵营

OpenAI（GPT 5.5）：推理深度无人能及

GPT 5.5 在复杂推理上仍然最强——数学证明、代码分析、法律论证。它的"慢思考"模式会在回答前内部推演多个步骤，像考试时在草稿纸上演算。缺点是贵、闭源、以及 OpenAI 和微软的合作关系一直在变化中。

Anthropic（Claude Opus 4.7 / Sonnet 4.6）：编程和可靠性

Claude 的特色是"认真"。在编程任务上，Opus 4.7 和 Sonnet 4.6 是目前最可靠的——写代码的可用率、长文本的指令遵循率，这几项压过了 GPT。Claude Code 工具已成为专业开发者的主力 AI 编程工具之一。Anthropic 把自己定位为"安全优先"，产品设计和企业文化都在强调这一点。

Google（Gemini 3.1 Pro）：多模态和上下文窗口

Gemini 的原生多模态整合最深——同一个模型对文本、图片、音频、视频建立联合表征，不用先 OCR 转文字再喂给文本模型。上下文窗口大到 200 万 Token，能一次性处理几小时的视频或一整个代码库。Google 的优势是拥有所有基础设施层——搜索、云、YouTube、Android——想象空间最大。

国内阵营：百花齐放

通义千问（Qwen 3.7，阿里）

Qwen 系列是国内开源阵营的旗帜。Qwen 3.7 在多语言能力、代码生成、数学推理上追平了国际一线模型，而且开源。国内很多 AI 创业公司和高校实验室直接基于 Qwen 做二次开发。阿里云上部署 Qwen，还能享受云算力一体化。

GLM 5.1（智谱，清华系）

清华系学术团队出身的智谱，GLM 5.1 在学术能力和 Agent 工具调用上做得很好。它的特色是"智能体"——AI 可以自己使用浏览器、调用 API、操作软件。智谱也在推动 AI 在科研场景的落地。

豆包/即梦（字节跳动）

字节的模型在创意和内容生成上投入最大。Sora 下架之后，视频生成赛道上豆包的 Seedance 接过了接力棒——国内用户直接能用，中文创作理解天然好。即梦（Jimeng）在短视频和营销内容生成上铺得很广。

其他值得关注的玩家：百度的文心一言、科大讯飞的星火认知模型、昆仑万维的天工、月之暗面的 Kimi（长文本能力突出）……

价格战：AI 正在变成水电

2025 年初，DeepSeek 的极低价 API 引发了一场全行业价格战。OpenAI、Google、阿里、字节全部跟进降价。API 的价格在 18 个月内降了 90% 以上。

硬件端也在革新。NVIDIA 的下一代 GPU（Blackwell B200 / B100）、AMD 的 MI300 系列、华为的昇腾 910C——芯片供应不再是一家独大。国产芯片虽然跟 NVIDIA 还有代差，但在推理场景上已经可用了。

对于大学生：AI 的使用成本正在趋近于零。这是你用 AI 最好的时代。

推荐算法：手机在监听你吗

一个经典场景

你和朋友在餐厅聊天，随口说了句"最近皮肤好干，该换护肤品了"。第二天打开手机——抖音推护肤视频，淘宝首页出现控油保湿套装，小红书推肤质测试。

你惊了："手机在偷听！"

手机真的在后台录音吗？ 技术可行但违法风险高——App 被发现在后台录音，罚款是按年营收比例算的。一个更现实的解释是数据关联：

你女朋友在你之前搜索了护肤品
你们的账号存在社交关联（互相关注、同一位置、同一 Wi-Fi）
算法推断"这条关系链上的人，偏好可能相似"
加上注意偏差——以前也推过护肤广告，但你没注意到

不需要监听，光凭社交关系、位置、时间、购买力标签，算法对你的了解就已经超过你的想象。

算法怎么猜你的喜好

你在抖音的十五分钟：
├── 猫咪视频 → 三秒划走 ❌（-2 分）
├── 游戏集锦 → 看完了 + 点赞 ❤️（+10 分）
├── 科技评测 → 看完还收藏了 📂（+15 分）
├── 舞蹈视频 → 直接跳过 →（-5 分）
└── 系统更新画像：游戏硬核 + 科技深度，讨厌跳舞和卖萌

单次行为收集十个信号。一天几百次交互 × 一年三百天 = 算法对你的理解逼近你自己。而且它不会疲劳、不会遗忘、不会感情用事。

各平台推荐策略

平台	推荐逻辑	驯服方法
抖音/快手	3 秒判定生死（完播率是最高权重）	长按 → 不感兴趣，多用搜索代替刷
B站	订阅 + 社区 + 观看历史，长视频权重高	多用"稍后再看"，少依赖首页推荐
淘宝/京东	购买力 + 浏览轨迹 + 相似用户协同过滤	搜索加"测评""对比"打破购物推荐链
小红书	收藏权重远超点赞，地理位置敏感	主动搜冷门标签，打破茧房
YouTube	观看时长 > 点击率 > 用户画像	定期清除观看历史，关闭自动播放

信息茧房：算法喂你吃一种味道

只想看你想看的 → 算法只推你想看的 → 你以为世界就是那样 → 再多看一眼不同观点都觉得不对。这就是信息茧房。

破茧方式：

开小号：一个号看专业领域，一个号随便刷。人格分裂式信息摄入
主动反向调参：故意搜索反对意见，看完几篇你不认同的文章
用 RSS 订阅：Feedly、Inoreader——自己选信源，算法靠边站
临时浏览模式：抖音的"临时浏览"、Chrome 无痕模式——看完不留痕

AI 创作工具：从文字到视频，全部被重写

文字生成

ChatGPT（GPT 5.5）：推理深度最高，写论文、做分析、法律文书。但需要学会提问——废问题 = 废回答
Claude（Opus 4.7 / Sonnet 4.6）：可靠性高，编程和长篇写作最强。适合技术文档、代码分析、长文校对
DeepSeek（V3 / R1）：免费、开源、中文友好。国内学生的日常首选
通义千问（Qwen 3.7）：阿里生态，中文创意写作好，和钉钉/夸克等国内产品整合深
GLM 5.1（智谱）：学术场景，Agent 工具调用

图片生成

GPT image2：OpenAI 最新图像模型，从 GPT 5.5 直接出图。理解力是目前最强的——你给一段复杂描述，它构图比大部分人类设计师清楚
Midjourney：艺术感和美学风格仍然最强，但需要 Discord 操作，对国内用户不友好
Stable Diffusion：开源，可本地运行。适合不想把图传上服务器的敏感场景
通义万相 / 即梦：国内可用，中文理解天然好。即梦的产品化程度最高

视频生成

OpenAI 的 Sora 曾经震惊世界，但后来下架了。来不及哀悼，接棒的是：

豆包 Seedance（字节跳动）：国内目前最强的视频生成模型。节奏感、运镜、人物一致性都很好。直接集成在抖音生态里
即梦（字节）：面向普通用户的短视频生成工具，模板化和定制化都有
可灵（快手）：快手出品，在短剧和剧情类视频生成上很强
Runway：国际侧产品化最好的视频工具，但需要付费

Sora 为什么下架

Sora 2024 年初发布 demo 时惊艳全球——但到实际产品阶段，生成一个 60 秒视频需要几分钟到十几分钟，质量不稳定，加上产品定位模糊。OpenAI 最终选择了下架并重新定位。这本身就说明了一件事：demo 惊艳和生产可用的产品，中间隔着巨大的工程鸿沟。

音乐和音频

Suno：输入描述，生成完整歌曲（配乐 + 人声 + 混音）。质量已到"普通人分不出是不是 AI 写的"
AIVA：古典音乐和影视配乐生成
ElevenLabs：语音克隆和 TTS，声音自然度几乎和人一样

AI 创作的法律边界

目前全球没有统一的 AI 著作权法。美国版权局的态度是：完全由 AI 生成的内容没有版权。但"人类主导创作 + AI 辅助"可以受保护。这个边界依然在法庭和立法机构之间反复。

实用建议：拿 AI 做草稿和灵感，最终版本要有你的"实质性修改"。商用之前确认平台的服务条款。

AI 编程：代码不再只是人写的

这是对大学生最直接的影响区域。AI 编程工具在 2024-2026 年间发生了质变：

主流工具

Claude Code（Anthropic，命令行工具）

目前专业开发者中口碑最强的 AI 编程工具。在终端里直接描述需求，Claude Code 自动在代码库里搜索、理解上下文、生成并编辑代码。它能跨文件追踪逻辑，一次性修改几十个文件关联的代码。不是补全——是直接动手改。

Cursor（AI 原生编辑器）

基于 VS Code 的 AI 编辑器，内置了多模型支持。你选中一段代码，告诉它"把这个重构"或"加错误处理"或"解释这段在干啥"，它直接在你的代码库上下文里操作。

GitHub Copilot（微软）

编辑器里的自动补全——你写函数名，它猜你接下来要写什么。已经深度整合进 VS Code 和 JetBrains 全家桶。对日常编码效率的提升是显著的，但在复杂重构和多文件操作上不如 Claude Code 和 Cursor。

Windsurf（Codeium）

新崛起的 AI 编辑器，强调"流式 AI 编程"——你像聊天一样描述需求，它边写边跟你确认方向。

AI 编程改变了什么

一个 CS 专业学生过去的学习路径是：学语法 → 学算法 → 学框架 → 写项目。现在多了 AI 这条路：描述需求 → AI 生成代码 → 你理解、修改、验证。

但这不意味着不需要学编程了。不会编程的人，AI 生成的代码出了 bug 你找不到。会编程的人用 AI 提效 3-5 倍。

掌握编程基础 + 会驱动 AI = 未来五年最值钱的技能组合之一。

自动驾驶：AI 的"物理考试"

自动驾驶是 AI 落地最难的一道题：生成文字在服务器里就能验证，开车要在物理世界里做生死判断。

六个等级

L0-L2（辅助驾驶）：你需要时刻盯着。特斯拉 Autopilot、小鹏 NGP、华为 ADS 基础版都在这个范围。出了事是你责任
L3（有条件自动驾驶）：特定场景下你不需要盯——高速堵车这种简单场景，出了事厂商负责。奔驰 DRIVE PILOT 和华为 ADS 高阶版已在国内高速场景落地
L4（高度自动驾驶）：特定区域完全无人。Waymo 在美国几个城市运营 Robotaxi，百度 Apollo 已在国内多个城市铺开，车速较保守但事故率远低于人类司机
L5（全场景无人驾驶）：还没有，哪家都没达到

核心矛盾：传感器 vs 成本

自动驾驶的传感器方案一直在打架：

纯视觉派（特斯拉）：只用摄像头 + AI 算法。成本低、可规模化，但极端天气和误识别风险高
激光雷达派（华为、Waymo）：多个传感器融合，安全性更高，但激光雷达贵，早期一个十几万，现在降到几千
融合派（多数国内车企）：视觉为主 + 一个激光雷达做安全冗余。也是目前国内新车的主流方案

96% 的交通事故源于人为失误，长期看自动驾驶能大幅降低死亡人数。但过渡期的伦理难题——AI 在"两难选择"中应该保谁——依然没有统一答案。

AI 与隐私：你的数据去哪了

语音数据的真实流向

你说的话被上传到服务器分析，可能被真人抽查（亚马逊、苹果都爆出过员工听录音用于质量评估），可能用于模型训练和广告。

做这几件事降低风险：

关掉持续性语音唤醒（"Hey Siri"以外的后台监听）
定期删除语音和对话历史
敏感对话不用 AI——私人事务、工作机密、政治观点

隐私检查清单

iPhone： 设置 → 隐私与安全性 → 跟踪 → 关"允许 App 请求跟踪"；分析与改进 → 全关；Apple 广告 → 关个性化广告

安卓： 谷歌设置 → 广告 → 关广告个性化；手机设置 → 隐私 → 重置广告 ID（每月一次）

Windows： 设置 → 隐私与安全性 → 常规 → 全关；诊断与反馈 → 选"基本诊断数据"

通用习惯：

能用网页版不用 App（App 权限更大）
注册时用临时邮箱（如 10 分钟邮箱）
不同平台用不同密码 + 2FA（这个在第 5 章说过）

识别 AI 生成的内容

图片破绽： 手指数量不对、文字乱码、光影方向不一致、对称物品不对称。但 GPT image2 已经把手画对了绝大多数时候——这个"漏洞"正在快速消失。

视频破绽： 闪烁不自然、物理错误（头发穿过身体）、嘴型和声音微妙错位。高质量 AI 视频越来越难用肉眼识别。

文字破绽： 句式过于整齐、缺乏个人经验细节、引用来源不存在、语气一致性过强（真人写作语气会波动）。

检测工具： GPTZero、Copyleaks 有一定参考价值。但任何检测工具都不完美——它们打出的分是一个概率，不是确定性结论。

参数之争 → 上下文之争 → 智能密度之争

AI 行业这两年的发展路线，经历了三次思路转换。

第一回合：卷参数

2020-2024 年，行业的主流信仰是 Scaling Laws——模型越大越聪明。GPT-3（175B）→ GPT-4（~1.8T，传闻）→ 各厂商军备竞赛，参数数量是核心宣传数字。

但 2024 年底开始，这个信仰动摇了。参数翻倍的边际收益在递减——从 1B 到 100B 的跃升是质的飞跃，从 1T 到 2T 几乎感觉不到变化。而且超大模型的训练成本指数级增长——训练一次的电费已经是千万美元级。

第二回合：卷上下文

2025 年，竞争焦点从参数转移到了上下文窗口——AI 一次能"看"多少内容。

Gemini 3.1 Pro 把上下文推到了 200 万 Token。Claude 紧随其后。GPT 5.5 也有 256K。现在你可以把一整本书、一整份代码库、或者几小时的会议录音直接丢给 AI，它一次性理解全部上下文。

上下文竞争的意义比参数更实际——它直接扩展了 AI 的应用场景。但上下文窗口也有边际递减：超过一定长度后，AI 对窗口中间部分的信息的关注度会下降（"中间丢失"问题），而且超大上下文带来的是推理成本线性增加。

第三回合：卷智能密度

2025 年底到现在，出现了一个更根本的思路转变。这个转变的最佳代言人就是 DeepSeek：

同样的能力，用更小的模型、更少的算力、更低的成本做到——比拼"单位参数的智能密度"。

这个逻辑的证据链：

DeepSeek V3（671B，MoE 只激活 37B）≈ GPT-4o 级别能力，训练成本十分之一
小模型的追赶速度远超预期——Qwen 3.7 的 7B 版本在很多日常任务上已经不输一年前的 70B 模型
合成数据（用大模型生成训练数据给小模型用）正在抹平大小模型之间的差距
推理阶段的优化（量化、蒸馏、投机解码）让同一个模型用更少算力跑出一样的效果

这意味着：通往 AGI 的路上，不是拼谁最大，是拼谁最聪明。 把每一亿参数能产出的智能最大化——智能密度——才是真正的技术竞争力。

为什么智能密度比你想象的更重要

如果 AGI 靠堆参数就能实现，那 AGI 只会属于少数几个能烧几百亿美元的巨头。但如果提升智能的核心是算法效率和数据质量——小团队就有机会。DeepSeek 用不到两年和不到一亿美金的训练成本追平了 GPT-4o，就是最好的证明。

对消费者来说——便宜的、能跑在手机上的、不需要联网的 AI 才是真正普及的 AI。

AI 的未来：四个方向

1. Agent：AI 不再只是聊天

2026 年最重要的趋势是 Agent——AI 能自主使用工具。不再是"你问它答"，而是你给一个目标，AI 自己规划步骤、调用软件、操作浏览器、读写文件、反复纠错，直到完成。

Claude Code 就是一个 Agent——你告诉它"在代码库里加一个功能"，它自己去搜文件、读代码、写修改、运行测试、修 bug。全程你只需要在旁边看着。

Agent 的终极形态是 AI 拥有自己的工作流程——你给目标，它自己找路。

2. 多模态：AI 真正理解物理世界

第一代大模型只处理文字。第二代能看图。现在的第三代（GPT 5.5、Gemini 3.1 Pro）原生理解文本、图像、音频、视频，这些信号进入同一个表征空间——不用先各自处理再拼接。

这意味着 AI 正在建立对物理世界的统一表征——视觉、声音、文字指向同一个底层概念。"猫"这个词和猫的照片在 AI 内部是同一个东西的不同投影。这是通向"真正理解世界"的必经之路。

3. 端侧 AI：AI 跑在你的手机上

大模型"瘦身"的速度远快于预期。一年前需要云端大 GPU 才能跑的模型，现在经过量化压缩，能在手机上运行。苹果的 Apple Intelligence 已经有部分模型在本地跑。高通和联发科的新芯片里都内置了专门的 AI 计算单元（NPU）。

端侧 AI 意味着：不需要联网，不需要把数据传上服务器，隐私和延迟同时解决。对于国内用户，这是"不需要翻墙的 AI"的前置条件。

4. 科学的 AI：从聊天到发现新知识

Google DeepMind 的 AlphaFold 3 已经预测了几乎所有已知蛋白质的结构。AI 正在加速药物发现（模拟分子结合）、材料科学（预测新型合金性质）、数学（辅助证明推演）。

这是 AI 从"帮人干活"到"发现人类不知道的东西"的跨越。你在大学学的任何一门科学或工程学科，五年内都会被 AI 深度嵌入。

什么样的职业最危险（和最安全）

AI 正在快速替代的方向：

初级翻译（除了高文学性和本地化创意工作）
模板化文案（电商详情页、企业通稿、SEO 文章）
基础美工和素材生成（Banner、海报、图标）
电话销售和初级客服
表格型数据分析（Excel 建模和报表生成）

AI 暂时替代不了的方向：

需要肢体接触和现场判断（护士、设备检修）
需要建立深层信任（心理咨询、管理咨询）
需要跨领域整合和模糊决策（创业、产品方向）
需要面对物理世界的不确定性（建筑工人、野外作业）

核心规律：AI 替代的是任务，不是职业。每个职业都有一部分任务会被 AI 加速，也有一部分任务只有人能完成。适应最快的人留到最后。

如何与 AI 共存

学会提问

糟糕的提问："写一篇 AI 的文章"
好的提问："以大学生能理解的语言，写一篇关于 AI 如何影响计算机专业的 800 字文章，包含 3 个 2025-2026 年的具体案例，说明哪些技能会贬值、哪些技能会升值"

提示词工程不是玄学——就是你要什么，说清楚。背景、受众、格式、长度、例子。越具体，AI 的输出越能直接用。

学会验证

AI 回答的质量取决于：

训练数据质量（喂它垃圾，吐出来也是垃圾）
上下文理解（对话太长会"忘"）
知识截止日期（它不知道训练后发生的事）
幻觉（它会自信地编造不存在的论文和引用）

交叉验证是一种本能，不是一种技巧。 凡是关键信息，至少确认两个来源。

学会人机分工

AI 更强	人类更强
海量数据处理	跨领域创造性连接
重复性内容生成	情感理解和共情
多维度快速分析	模糊条件下的决策
不疲劳不遗忘	对"不对劲"的直觉
多语言翻译和总结	真正的原创思想

理想的协作方式是：人提出方向、做关键决策、做最终审查；AI 做筛查、做草稿、做重复工作。

常见问题

Q：AI 能毁灭人类吗？

A：目前的 AI 没有自我意识，没有"想"这个动作。但它可能通过三种方式造成伤害：

目标偏差：你给 AI 的指令有漏洞，它按字面执行。比如"最大化回形针产量"——AI 可能把所有能用的原子都变成回形针
被恶意使用：坏人用 AI 做假新闻、伪造证据、开发攻击工具
系统性风险：金融市场同时使用同一个 AI 模型做决策，触发连锁反应

应对需要法律、技术、社会三层防线。这不是"AI 强了就会毁灭人类"的简单叙事。

Q：我的工作会被 AI 取代吗？

A：工作内容会变，大部分职业不会消失。就像计算机没让会计消失（但打算盘的会计消失了），汽车没让运输业消失（但马车夫消失了）。AI 不会让所有工作消失——但会让工作方式彻底改变。

与其担心"被替代"，不如去想"我现在的哪部分工作可以被 AI 加速"。

Q：AI 有感情和自我意识吗？

A：目前为止，没有。AI 可以说"我爱你"、可以表现出"伤心"、可以"生气"——但这些是它从训练数据中学到的语言模式，不是内心体验。它像一本会说话的字典——字典里写了"伤心"的定义，但字典不会真的伤心。

意识是什么？科学界还没有一个可操作的共识定义。AI 有没有意识，取决于你怎么测——而目前我们没有一个公认的测法。

Q：AI 生成的作业和论文会被发现吗？

A：大概率会。现在学校用的检测工具（Turnitin、GPTZero 等）识别率在持续提高。而且老师们也在熟悉 AI 写作的特征——过度流畅、缺乏个人经验细节、引用模糊。

用 AI 查资料、改语法、当讨论对象——大部分老师不反对。完全让 AI 代写——被发现只是时间问题。

Q：AI 时代还需要学编程吗？

A：需要。不会编程的人只能等 AI 猜他要什么，会编程的人能精确描述需求 + 审查 AI 的输出。编程的核心——分解问题、逻辑推理、容错设计——不会因为 AI 而贬值。

一个趋势：编程的门槛在降低（AI 帮你处理语法和框架），但编程的天花板在升高（能用 AI 的人效率翻倍）。两者之间的差距在拉大。

Q：AI 会越来越贵还是越来越便宜？

A：越来越便宜。API 价格在 18 个月内降了 90% 以上，趋势还没有停。技术原因是模型蒸馏、量化、更高效的架构（比如 MoE）。商业原因是竞争——五个大玩家同时在打价格战。

对个人用户：你日常用的 AI（ChatGPT 免费版、Claude 免费版、DeepSeek 完全免费）已经足够好。付费版提供的额外能力（更大上下文、更高推理深度、更快响应）对于专业用途值这个钱。

Q：什么是 AGI？它什么时候来？

A：AGI（通用人工智能）是能完成人类能完成的任何智力任务水平的 AI。不是在单一任务上超过人类（计算器早做到了），是像一个能适应任何工作的"通用大脑"。

什么时候来？业内没有共识。乐观的人说 2030 年前，保守的人说可能需要几十年甚至更久。唯一确定的是：2025-2026 年没有 AGI 出现。目前所有的 AI 都是"窄 AI"——在某些任务上极其出色，但在它们没训练过的事情上可能完全无法应对。

终章寄语

我们从"你的手机比 NASA 登月计算机强"开始，走完了文件管理、软件安装、Wi-Fi 排查、账号密码、系统设置、多设备协同、命令行、性能优化，最后来到 AI 时代。

如果你一路跟下来，现在你应该具备的不只是"会用某个软件"——而是能：

遇到问题知道怎么拆解——不是害怕，是分析
新东西敢上手试——不是等别人教，是自己探
明白数字世界的运作方式——账号是什么、网络怎么连、AI 怎么猜你喜欢
能分辨哪些是忽悠，哪些是真东西——"电脑管家"、"加速大师"、"AI 有意识"

技术会继续变。Windows 12 会来，AI 会更聪明，新的设备形态会冒出来。但这些能力——拆解问题、搜索答案、大胆验证、保持怀疑——不会过时。

你不是数字世界的客人，不需要等别人来教你怎么用。你是主人，工具应该为你服务。

（课程正式完结，但你的数字生活刚刚开始。）