第 10 章:AI 时代:当你的手机比你还懂你
约 8820 字大约 29 分钟
2025-12-22
两年前,ChatGPT 横空出世,全世界第一次意识到"机器真的能聊天了"。
两年后的今天,AI 已经能写代码、画图、作曲、做视频、通过律师资格考试。最新的模型每隔几个月就刷新一次认知。价格在崩盘,能力在暴涨,开源在追赶闭源,中国的 DeepSeek 用不到 OpenAI 十分之一的成本做出了同级别的模型。
你生活在这个时代,但你真的理解这一切是怎么回事吗?
先搞懂原理:神经网络是什么东西
你不需要数学基础。用三件事就能理解神经网络:
1. 神经元:一个会投票的开关
想象一个神经元是班上的一个同学。他接收其他几个同学传来的消息(输入),每条消息有一个"重要程度"(权重)。他把这些消息加权求和,如果总和超过某个阈值——他就举手(激活),把消息传给下一排同学。
一个神经元做的事就这么简单:接收 → 加权求和 → 过阈值 → 输出。
2. 网络:一堆神经元堆叠
一个神经元没啥用,但几千亿个神经元叠在一起——分层排列,每一层的输出变成下一层的输入——就形成了"神经网络"。层数越多,网络越"深"。"深度学习"的"深",指的就是这个层数。
第一层可能只认边缘和颜色,第三层认出了眼睛和鼻子,第十层认出了整张脸。没有人去教每一层"你应该干什么"——它是自己从数据里"悟"出来的。
3. 训练:不断猜、不断改
训练一个神经网络,逻辑上很简单:
给网络看一张猫的照片 → 网络猜"狗" → 错了,回头调权重
给网络看一张猫的照片 → 网络猜"猫" → 对了,保留这个方向这个过程重复几十亿次。每次猜错,算法(反向传播 + 梯度下降)会自动把所有权重往"猜得更对"的方向微调一点点。几十亿次微调之后,网络就"学会"了猫和狗的区别。
没有人告诉网络"猫有尖耳朵,狗有长嘴巴"——这些规则是它自己从几亿张图片中归纳出来的。这就是为什么我们称它为"学习"而不是"编程"。
为什么 2012 年之后突然爆发
神经网络的理论基础在 1980 年代就已经完善了。为什么等到 2012 年才爆发?三个条件同时到齐:
- GPU 并行计算:一块显卡能同时跑几千个简单计算——恰好就是神经元干的事。训练速度提升了 100 倍。
- 海量数据:互联网产出了 ImageNet(1400 万张标注图片)、Common Crawl(几十亿网页)。神经网络需要海量例子才能学好。
- 更好的初始化算法:以前网络层数一多就"训不动",2012 年 AlexNet 用 ReLU 激活函数和 Dropout 正则化解决了这个问题。
2012 年 AlexNet 在 ImageNet 图像识别比赛中碾压了所有传统方法——误差率从 25% 降到 16%。研究界一夜之间全部转向深度学习。
规模定律(Scaling Laws)
2020 年,OpenAI 发现了一个看起来"暴力"但极其有效的规律:模型参数越多、训练数据越多、算力越大,模型的能力就越强——而且这种提升是可预测的。
就像一个数学公式:投入翻倍,能力按固定比例涨。这解释了为什么科技公司愿意砸几十亿美元训练更大的模型——他们不是在猜,他们知道砸钱一定有效。
但这个规律也有天花板,后面会讲到。
Token:AI 世界的"字"
和 AI 打交道时,你会频繁看到"Token"这个词。它的中文翻译很乱——"令牌"、"词元"、"标记",都指同一个东西。
Token 是什么?
AI 读文本时逐个处理 Token——Token 是 AI 的"最小阅读单位"。它介于字和词之间,不完全对应汉字也不完全对应英文单词。一个粗略的对应:
- 1 个中文字 ≈ 1-2 个 Token
- 1 个英文单词 ≈ 1-3 个 Token
- 代码里的符号和括号通常是 1 个 Token
为什么你在乎 Token?
因为 AI 计费按 Token 算。API 调用的价格表写着"每百万 Token X 元"——输入算一次,输出算一次。而且每个模型有 Token 上限(上下文窗口)——GPT 5.5 一次最多读 256K Token(大约可以读一本《三体》第一部)。超过这个量,旧的对话内容就会被截断。
中文在 Token 数量上通常比英文省——同样的意思,中文需要的 Token 数更少。这就是为什么国内 AI 模型的 API 定价,按 Token 算看起来比国外便宜的一个原因(另一个原因是确实便宜)。
AI 天梯榜:到底谁最厉害
"哪个 AI 最强?"——这个问题没有绝对答案,因为不同的评测测不同的东西。但目前最有参考价值的评测平台是 LMSYS Chatbot Arena(聊天机器人竞技场)。
它的运作方式很简单:你随便问两个匿名模型同一个问题,你选哪个回答更好,然后公布排名。这种"盲测"机制很难作弊——投票者是真实用户,不是固定题库。
截至 2026 年 5 月,榜单前几名变化极快:
| 排名 | 模型 | 特点 |
|---|---|---|
| Top 3 | GPT 5.5(OpenAI) | 推理深度最强,考试型选手,成本也最高 |
| Top 3 | Claude Opus 4.7(Anthropic) | 编码和长文本最强,可靠性最高 |
| Top 3 | Gemini 3.1 Pro(Google) | 多模态原生整合,上下文窗口最大 |
| Top 10 | DeepSeek R1/V3(深度求索) | 开源最强,成本极低,推理能力追平闭源 |
| Top 10 | Qwen 3.7(阿里通义) | 国内开源旗舰,多语言能力突出 |
| Top 20 | GLM 5.1(智谱) | 清华系,学术能力突出,Agent 工具调用好 |
这个榜单的教训:没有任何一个模型能在所有维度上同时拿第一。排名每周都在微调,每个月可能有新面孔进入前十。在 AI 领域,今天的王者可能下周就变成第二名——这个节奏本身才是真正的故事。
除了 LMSYS,还有哪些评测
- MMLU / MMLU-Pro:大学水平知识考试,测"博学程度"
- HumanEval / SWE-bench:编程能力评测,自动修 GitHub Issue
- AIME / GPQA:数学和科学推理,研究生难度
- Chatbot Arena 分类榜:按编程、写作、长文本、多语言等维度拆分排名
每个榜单测的是不同维度的能力。没有一个榜单能完整描述一个模型的全部能力。
2026 年 AI 全景图
DeepSeek:中国团队震动硅谷
2025 年初,一家不太有名的中国公司"深度求索"发布了 DeepSeek V3 和 DeepSeek R1,整个 AI 行业震动了。
震动的原因很简单:
- 成本:训练成本只有 OpenAI 同类模型的十分之一。不是大公司烧不起——是大公司发现自己的烧法可能不对。
- 开源:模型权重全公开,任何人都能下载、微调、商用。开源社区一晚上就把它部署到了全世界。
- 推理能力:R1 的"思维链"推理追平了 OpenAI o1,但完全开源,你可以在本地跑。
- 价格战:DeepSeek API 的价格低到让整个行业被迫跟进。API 使用成本在 18 个月内降了 90% 以上。
DeepSeek 证明了一件事:算力优势不是护城河。算法效率可以追平算力差距。
对国内大学生的意义更大——DeepSeek 是国内团队、完全开源、免费使用。你不需要翻墙,不需要美元信用卡,打开官网就能用。它就是你能日常对话的最强 AI 之一。
MoE 架构:DeepSeek 的工程技术秘密
DeepSeek 的省钱秘诀之一叫 MoE(Mixture of Experts,混合专家)。传统大模型在处理每个 Token 时激活全部参数,MoE 只激活其中一小部分"专家"子网络——就像一个诊所,你来看眼睛就只叫眼科医生,其他科室歇着。
DeepSeek V3 有 671B 参数,但处理每个 Token 只激活了 37B。这就是为什么它能用很小的成本获得几乎一样的能力。
国际三大阵营
OpenAI(GPT 5.5):推理深度无人能及
GPT 5.5 在复杂推理上仍然最强——数学证明、代码分析、法律论证。它的"慢思考"模式会在回答前内部推演多个步骤,像考试时在草稿纸上演算。缺点是贵、闭源、以及 OpenAI 和微软的合作关系一直在变化中。
Anthropic(Claude Opus 4.7 / Sonnet 4.6):编程和可靠性
Claude 的特色是"认真"。在编程任务上,Opus 4.7 和 Sonnet 4.6 是目前最可靠的——写代码的可用率、长文本的指令遵循率,这几项压过了 GPT。Claude Code 工具已成为专业开发者的主力 AI 编程工具之一。Anthropic 把自己定位为"安全优先",产品设计和企业文化都在强调这一点。
Google(Gemini 3.1 Pro):多模态和上下文窗口
Gemini 的原生多模态整合最深——同一个模型对文本、图片、音频、视频建立联合表征,不用先 OCR 转文字再喂给文本模型。上下文窗口大到 200 万 Token,能一次性处理几小时的视频或一整个代码库。Google 的优势是拥有所有基础设施层——搜索、云、YouTube、Android——想象空间最大。
国内阵营:百花齐放
通义千问(Qwen 3.7,阿里)
Qwen 系列是国内开源阵营的旗帜。Qwen 3.7 在多语言能力、代码生成、数学推理上追平了国际一线模型,而且开源。国内很多 AI 创业公司和高校实验室直接基于 Qwen 做二次开发。阿里云上部署 Qwen,还能享受云算力一体化。
GLM 5.1(智谱,清华系)
清华系学术团队出身的智谱,GLM 5.1 在学术能力和 Agent 工具调用上做得很好。它的特色是"智能体"——AI 可以自己使用浏览器、调用 API、操作软件。智谱也在推动 AI 在科研场景的落地。
豆包/即梦(字节跳动)
字节的模型在创意和内容生成上投入最大。Sora 下架之后,视频生成赛道上豆包的 Seedance 接过了接力棒——国内用户直接能用,中文创作理解天然好。即梦(Jimeng)在短视频和营销内容生成上铺得很广。
其他值得关注的玩家:百度的文心一言、科大讯飞的星火认知模型、昆仑万维的天工、月之暗面的 Kimi(长文本能力突出)……
价格战:AI 正在变成水电
2025 年初,DeepSeek 的极低价 API 引发了一场全行业价格战。OpenAI、Google、阿里、字节全部跟进降价。API 的价格在 18 个月内降了 90% 以上。
硬件端也在革新。NVIDIA 的下一代 GPU(Blackwell B200 / B100)、AMD 的 MI300 系列、华为的昇腾 910C——芯片供应不再是一家独大。国产芯片虽然跟 NVIDIA 还有代差,但在推理场景上已经可用了。
对于大学生:AI 的使用成本正在趋近于零。这是你用 AI 最好的时代。
推荐算法:手机在监听你吗
一个经典场景
你和朋友在餐厅聊天,随口说了句"最近皮肤好干,该换护肤品了"。第二天打开手机——抖音推护肤视频,淘宝首页出现控油保湿套装,小红书推肤质测试。
你惊了:"手机在偷听!"
手机真的在后台录音吗? 技术可行但违法风险高——App 被发现在后台录音,罚款是按年营收比例算的。一个更现实的解释是数据关联:
- 你女朋友在你之前搜索了护肤品
- 你们的账号存在社交关联(互相关注、同一位置、同一 Wi-Fi)
- 算法推断"这条关系链上的人,偏好可能相似"
- 加上注意偏差——以前也推过护肤广告,但你没注意到
不需要监听,光凭社交关系、位置、时间、购买力标签,算法对你的了解就已经超过你的想象。
算法怎么猜你的喜好
你在抖音的十五分钟:
├── 猫咪视频 → 三秒划走 ❌(-2 分)
├── 游戏集锦 → 看完了 + 点赞 ❤️(+10 分)
├── 科技评测 → 看完还收藏了 📂(+15 分)
├── 舞蹈视频 → 直接跳过 →(-5 分)
└── 系统更新画像:游戏硬核 + 科技深度,讨厌跳舞和卖萌单次行为收集十个信号。一天几百次交互 × 一年三百天 = 算法对你的理解逼近你自己。而且它不会疲劳、不会遗忘、不会感情用事。
各平台推荐策略
| 平台 | 推荐逻辑 | 驯服方法 |
|---|---|---|
| 抖音/快手 | 3 秒判定生死(完播率是最高权重) | 长按 → 不感兴趣,多用搜索代替刷 |
| B站 | 订阅 + 社区 + 观看历史,长视频权重高 | 多用"稍后再看",少依赖首页推荐 |
| 淘宝/京东 | 购买力 + 浏览轨迹 + 相似用户协同过滤 | 搜索加"测评""对比"打破购物推荐链 |
| 小红书 | 收藏权重远超点赞,地理位置敏感 | 主动搜冷门标签,打破茧房 |
| YouTube | 观看时长 > 点击率 > 用户画像 | 定期清除观看历史,关闭自动播放 |
信息茧房:算法喂你吃一种味道
只想看你想看的 → 算法只推你想看的 → 你以为世界就是那样 → 再多看一眼不同观点都觉得不对。这就是信息茧房。
破茧方式:
- 开小号:一个号看专业领域,一个号随便刷。人格分裂式信息摄入
- 主动反向调参:故意搜索反对意见,看完几篇你不认同的文章
- 用 RSS 订阅:Feedly、Inoreader——自己选信源,算法靠边站
- 临时浏览模式:抖音的"临时浏览"、Chrome 无痕模式——看完不留痕
AI 创作工具:从文字到视频,全部被重写
文字生成
- ChatGPT(GPT 5.5):推理深度最高,写论文、做分析、法律文书。但需要学会提问——废问题 = 废回答
- Claude(Opus 4.7 / Sonnet 4.6):可靠性高,编程和长篇写作最强。适合技术文档、代码分析、长文校对
- DeepSeek(V3 / R1):免费、开源、中文友好。国内学生的日常首选
- 通义千问(Qwen 3.7):阿里生态,中文创意写作好,和钉钉/夸克等国内产品整合深
- GLM 5.1(智谱):学术场景,Agent 工具调用
图片生成
- GPT image2:OpenAI 最新图像模型,从 GPT 5.5 直接出图。理解力是目前最强的——你给一段复杂描述,它构图比大部分人类设计师清楚
- Midjourney:艺术感和美学风格仍然最强,但需要 Discord 操作,对国内用户不友好
- Stable Diffusion:开源,可本地运行。适合不想把图传上服务器的敏感场景
- 通义万相 / 即梦:国内可用,中文理解天然好。即梦的产品化程度最高
视频生成
OpenAI 的 Sora 曾经震惊世界,但后来下架了。来不及哀悼,接棒的是:
- 豆包 Seedance(字节跳动):国内目前最强的视频生成模型。节奏感、运镜、人物一致性都很好。直接集成在抖音生态里
- 即梦(字节):面向普通用户的短视频生成工具,模板化和定制化都有
- 可灵(快手):快手出品,在短剧和剧情类视频生成上很强
- Runway:国际侧产品化最好的视频工具,但需要付费
Sora 为什么下架
Sora 2024 年初发布 demo 时惊艳全球——但到实际产品阶段,生成一个 60 秒视频需要几分钟到十几分钟,质量不稳定,加上产品定位模糊。OpenAI 最终选择了下架并重新定位。这本身就说明了一件事:demo 惊艳和生产可用的产品,中间隔着巨大的工程鸿沟。
音乐和音频
- Suno:输入描述,生成完整歌曲(配乐 + 人声 + 混音)。质量已到"普通人分不出是不是 AI 写的"
- AIVA:古典音乐和影视配乐生成
- ElevenLabs:语音克隆和 TTS,声音自然度几乎和人一样
AI 创作的法律边界
目前全球没有统一的 AI 著作权法。美国版权局的态度是:完全由 AI 生成的内容没有版权。但"人类主导创作 + AI 辅助"可以受保护。这个边界依然在法庭和立法机构之间反复。
实用建议:拿 AI 做草稿和灵感,最终版本要有你的"实质性修改"。商用之前确认平台的服务条款。
AI 编程:代码不再只是人写的
这是对大学生最直接的影响区域。AI 编程工具在 2024-2026 年间发生了质变:
主流工具
Claude Code(Anthropic,命令行工具)
目前专业开发者中口碑最强的 AI 编程工具。在终端里直接描述需求,Claude Code 自动在代码库里搜索、理解上下文、生成并编辑代码。它能跨文件追踪逻辑,一次性修改几十个文件关联的代码。不是补全——是直接动手改。
Cursor(AI 原生编辑器)
基于 VS Code 的 AI 编辑器,内置了多模型支持。你选中一段代码,告诉它"把这个重构"或"加错误处理"或"解释这段在干啥",它直接在你的代码库上下文里操作。
GitHub Copilot(微软)
编辑器里的自动补全——你写函数名,它猜你接下来要写什么。已经深度整合进 VS Code 和 JetBrains 全家桶。对日常编码效率的提升是显著的,但在复杂重构和多文件操作上不如 Claude Code 和 Cursor。
Windsurf(Codeium)
新崛起的 AI 编辑器,强调"流式 AI 编程"——你像聊天一样描述需求,它边写边跟你确认方向。
AI 编程改变了什么
一个 CS 专业学生过去的学习路径是:学语法 → 学算法 → 学框架 → 写项目。现在多了 AI 这条路:描述需求 → AI 生成代码 → 你理解、修改、验证。
但这不意味着不需要学编程了。不会编程的人,AI 生成的代码出了 bug 你找不到。会编程的人用 AI 提效 3-5 倍。
掌握编程基础 + 会驱动 AI = 未来五年最值钱的技能组合之一。
自动驾驶:AI 的"物理考试"
自动驾驶是 AI 落地最难的一道题:生成文字在服务器里就能验证,开车要在物理世界里做生死判断。
六个等级
- L0-L2(辅助驾驶):你需要时刻盯着。特斯拉 Autopilot、小鹏 NGP、华为 ADS 基础版都在这个范围。出了事是你责任
- L3(有条件自动驾驶):特定场景下你不需要盯——高速堵车这种简单场景,出了事厂商负责。奔驰 DRIVE PILOT 和华为 ADS 高阶版已在国内高速场景落地
- L4(高度自动驾驶):特定区域完全无人。Waymo 在美国几个城市运营 Robotaxi,百度 Apollo 已在国内多个城市铺开,车速较保守但事故率远低于人类司机
- L5(全场景无人驾驶):还没有,哪家都没达到
核心矛盾:传感器 vs 成本
自动驾驶的传感器方案一直在打架:
- 纯视觉派(特斯拉):只用摄像头 + AI 算法。成本低、可规模化,但极端天气和误识别风险高
- 激光雷达派(华为、Waymo):多个传感器融合,安全性更高,但激光雷达贵,早期一个十几万,现在降到几千
- 融合派(多数国内车企):视觉为主 + 一个激光雷达做安全冗余。也是目前国内新车的主流方案
96% 的交通事故源于人为失误,长期看自动驾驶能大幅降低死亡人数。但过渡期的伦理难题——AI 在"两难选择"中应该保谁——依然没有统一答案。
AI 与隐私:你的数据去哪了
语音数据的真实流向
你说的话被上传到服务器分析,可能被真人抽查(亚马逊、苹果都爆出过员工听录音用于质量评估),可能用于模型训练和广告。
做这几件事降低风险:
- 关掉持续性语音唤醒("Hey Siri"以外的后台监听)
- 定期删除语音和对话历史
- 敏感对话不用 AI——私人事务、工作机密、政治观点
隐私检查清单
iPhone: 设置 → 隐私与安全性 → 跟踪 → 关"允许 App 请求跟踪";分析与改进 → 全关;Apple 广告 → 关个性化广告
安卓: 谷歌设置 → 广告 → 关广告个性化;手机设置 → 隐私 → 重置广告 ID(每月一次)
Windows: 设置 → 隐私与安全性 → 常规 → 全关;诊断与反馈 → 选"基本诊断数据"
通用习惯:
- 能用网页版不用 App(App 权限更大)
- 注册时用临时邮箱(如 10 分钟邮箱)
- 不同平台用不同密码 + 2FA(这个在第 5 章说过)
识别 AI 生成的内容
图片破绽: 手指数量不对、文字乱码、光影方向不一致、对称物品不对称。但 GPT image2 已经把手画对了绝大多数时候——这个"漏洞"正在快速消失。
视频破绽: 闪烁不自然、物理错误(头发穿过身体)、嘴型和声音微妙错位。高质量 AI 视频越来越难用肉眼识别。
文字破绽: 句式过于整齐、缺乏个人经验细节、引用来源不存在、语气一致性过强(真人写作语气会波动)。
检测工具: GPTZero、Copyleaks 有一定参考价值。但任何检测工具都不完美——它们打出的分是一个概率,不是确定性结论。
参数之争 → 上下文之争 → 智能密度之争
AI 行业这两年的发展路线,经历了三次思路转换。
第一回合:卷参数
2020-2024 年,行业的主流信仰是 Scaling Laws——模型越大越聪明。GPT-3(175B)→ GPT-4(~1.8T,传闻)→ 各厂商军备竞赛,参数数量是核心宣传数字。
但 2024 年底开始,这个信仰动摇了。参数翻倍的边际收益在递减——从 1B 到 100B 的跃升是质的飞跃,从 1T 到 2T 几乎感觉不到变化。而且超大模型的训练成本指数级增长——训练一次的电费已经是千万美元级。
第二回合:卷上下文
2025 年,竞争焦点从参数转移到了上下文窗口——AI 一次能"看"多少内容。
Gemini 3.1 Pro 把上下文推到了 200 万 Token。Claude 紧随其后。GPT 5.5 也有 256K。现在你可以把一整本书、一整份代码库、或者几小时的会议录音直接丢给 AI,它一次性理解全部上下文。
上下文竞争的意义比参数更实际——它直接扩展了 AI 的应用场景。但上下文窗口也有边际递减:超过一定长度后,AI 对窗口中间部分的信息的关注度会下降("中间丢失"问题),而且超大上下文带来的是推理成本线性增加。
第三回合:卷智能密度
2025 年底到现在,出现了一个更根本的思路转变。这个转变的最佳代言人就是 DeepSeek:
同样的能力,用更小的模型、更少的算力、更低的成本做到——比拼"单位参数的智能密度"。
这个逻辑的证据链:
- DeepSeek V3(671B,MoE 只激活 37B)≈ GPT-4o 级别能力,训练成本十分之一
- 小模型的追赶速度远超预期——Qwen 3.7 的 7B 版本在很多日常任务上已经不输一年前的 70B 模型
- 合成数据(用大模型生成训练数据给小模型用)正在抹平大小模型之间的差距
- 推理阶段的优化(量化、蒸馏、投机解码)让同一个模型用更少算力跑出一样的效果
这意味着:通往 AGI 的路上,不是拼谁最大,是拼谁最聪明。 把每一亿参数能产出的智能最大化——智能密度——才是真正的技术竞争力。
为什么智能密度比你想象的更重要
如果 AGI 靠堆参数就能实现,那 AGI 只会属于少数几个能烧几百亿美元的巨头。但如果提升智能的核心是算法效率和数据质量——小团队就有机会。DeepSeek 用不到两年和不到一亿美金的训练成本追平了 GPT-4o,就是最好的证明。
对消费者来说——便宜的、能跑在手机上的、不需要联网的 AI 才是真正普及的 AI。
AI 的未来:四个方向
1. Agent:AI 不再只是聊天
2026 年最重要的趋势是 Agent——AI 能自主使用工具。不再是"你问它答",而是你给一个目标,AI 自己规划步骤、调用软件、操作浏览器、读写文件、反复纠错,直到完成。
Claude Code 就是一个 Agent——你告诉它"在代码库里加一个功能",它自己去搜文件、读代码、写修改、运行测试、修 bug。全程你只需要在旁边看着。
Agent 的终极形态是 AI 拥有自己的工作流程——你给目标,它自己找路。
2. 多模态:AI 真正理解物理世界
第一代大模型只处理文字。第二代能看图。现在的第三代(GPT 5.5、Gemini 3.1 Pro)原生理解文本、图像、音频、视频,这些信号进入同一个表征空间——不用先各自处理再拼接。
这意味着 AI 正在建立对物理世界的统一表征——视觉、声音、文字指向同一个底层概念。"猫"这个词和猫的照片在 AI 内部是同一个东西的不同投影。这是通向"真正理解世界"的必经之路。
3. 端侧 AI:AI 跑在你的手机上
大模型"瘦身"的速度远快于预期。一年前需要云端大 GPU 才能跑的模型,现在经过量化压缩,能在手机上运行。苹果的 Apple Intelligence 已经有部分模型在本地跑。高通和联发科的新芯片里都内置了专门的 AI 计算单元(NPU)。
端侧 AI 意味着:不需要联网,不需要把数据传上服务器,隐私和延迟同时解决。对于国内用户,这是"不需要翻墙的 AI"的前置条件。
4. 科学的 AI:从聊天到发现新知识
Google DeepMind 的 AlphaFold 3 已经预测了几乎所有已知蛋白质的结构。AI 正在加速药物发现(模拟分子结合)、材料科学(预测新型合金性质)、数学(辅助证明推演)。
这是 AI 从"帮人干活"到"发现人类不知道的东西"的跨越。你在大学学的任何一门科学或工程学科,五年内都会被 AI 深度嵌入。
什么样的职业最危险(和最安全)
AI 正在快速替代的方向:
- 初级翻译(除了高文学性和本地化创意工作)
- 模板化文案(电商详情页、企业通稿、SEO 文章)
- 基础美工和素材生成(Banner、海报、图标)
- 电话销售和初级客服
- 表格型数据分析(Excel 建模和报表生成)
AI 暂时替代不了的方向:
- 需要肢体接触和现场判断(护士、设备检修)
- 需要建立深层信任(心理咨询、管理咨询)
- 需要跨领域整合和模糊决策(创业、产品方向)
- 需要面对物理世界的不确定性(建筑工人、野外作业)
核心规律:AI 替代的是任务,不是职业。每个职业都有一部分任务会被 AI 加速,也有一部分任务只有人能完成。适应最快的人留到最后。
如何与 AI 共存
学会提问
- 糟糕的提问:"写一篇 AI 的文章"
- 好的提问:"以大学生能理解的语言,写一篇关于 AI 如何影响计算机专业的 800 字文章,包含 3 个 2025-2026 年的具体案例,说明哪些技能会贬值、哪些技能会升值"
提示词工程不是玄学——就是你要什么,说清楚。背景、受众、格式、长度、例子。越具体,AI 的输出越能直接用。
学会验证
AI 回答的质量取决于:
- 训练数据质量(喂它垃圾,吐出来也是垃圾)
- 上下文理解(对话太长会"忘")
- 知识截止日期(它不知道训练后发生的事)
- 幻觉(它会自信地编造不存在的论文和引用)
交叉验证是一种本能,不是一种技巧。 凡是关键信息,至少确认两个来源。
学会人机分工
| AI 更强 | 人类更强 |
|---|---|
| 海量数据处理 | 跨领域创造性连接 |
| 重复性内容生成 | 情感理解和共情 |
| 多维度快速分析 | 模糊条件下的决策 |
| 不疲劳不遗忘 | 对"不对劲"的直觉 |
| 多语言翻译和总结 | 真正的原创思想 |
理想的协作方式是:人提出方向、做关键决策、做最终审查;AI 做筛查、做草稿、做重复工作。
常见问题
Q:AI 能毁灭人类吗?
A:目前的 AI 没有自我意识,没有"想"这个动作。但它可能通过三种方式造成伤害:
- 目标偏差:你给 AI 的指令有漏洞,它按字面执行。比如"最大化回形针产量"——AI 可能把所有能用的原子都变成回形针
- 被恶意使用:坏人用 AI 做假新闻、伪造证据、开发攻击工具
- 系统性风险:金融市场同时使用同一个 AI 模型做决策,触发连锁反应
应对需要法律、技术、社会三层防线。这不是"AI 强了就会毁灭人类"的简单叙事。
Q:我的工作会被 AI 取代吗?
A:工作内容会变,大部分职业不会消失。就像计算机没让会计消失(但打算盘的会计消失了),汽车没让运输业消失(但马车夫消失了)。AI 不会让所有工作消失——但会让工作方式彻底改变。
与其担心"被替代",不如去想"我现在的哪部分工作可以被 AI 加速"。
Q:AI 有感情和自我意识吗?
A:目前为止,没有。AI 可以说"我爱你"、可以表现出"伤心"、可以"生气"——但这些是它从训练数据中学到的语言模式,不是内心体验。它像一本会说话的字典——字典里写了"伤心"的定义,但字典不会真的伤心。
意识是什么?科学界还没有一个可操作的共识定义。AI 有没有意识,取决于你怎么测——而目前我们没有一个公认的测法。
Q:AI 生成的作业和论文会被发现吗?
A:大概率会。现在学校用的检测工具(Turnitin、GPTZero 等)识别率在持续提高。而且老师们也在熟悉 AI 写作的特征——过度流畅、缺乏个人经验细节、引用模糊。
用 AI 查资料、改语法、当讨论对象——大部分老师不反对。完全让 AI 代写——被发现只是时间问题。
Q:AI 时代还需要学编程吗?
A:需要。不会编程的人只能等 AI 猜他要什么,会编程的人能精确描述需求 + 审查 AI 的输出。编程的核心——分解问题、逻辑推理、容错设计——不会因为 AI 而贬值。
一个趋势:编程的门槛在降低(AI 帮你处理语法和框架),但编程的天花板在升高(能用 AI 的人效率翻倍)。两者之间的差距在拉大。
Q:AI 会越来越贵还是越来越便宜?
A:越来越便宜。API 价格在 18 个月内降了 90% 以上,趋势还没有停。技术原因是模型蒸馏、量化、更高效的架构(比如 MoE)。商业原因是竞争——五个大玩家同时在打价格战。
对个人用户:你日常用的 AI(ChatGPT 免费版、Claude 免费版、DeepSeek 完全免费)已经足够好。付费版提供的额外能力(更大上下文、更高推理深度、更快响应)对于专业用途值这个钱。
Q:什么是 AGI?它什么时候来?
A:AGI(通用人工智能)是能完成人类能完成的任何智力任务水平的 AI。不是在单一任务上超过人类(计算器早做到了),是像一个能适应任何工作的"通用大脑"。
什么时候来?业内没有共识。乐观的人说 2030 年前,保守的人说可能需要几十年甚至更久。唯一确定的是:2025-2026 年没有 AGI 出现。目前所有的 AI 都是"窄 AI"——在某些任务上极其出色,但在它们没训练过的事情上可能完全无法应对。
终章寄语
我们从"你的手机比 NASA 登月计算机强"开始,走完了文件管理、软件安装、Wi-Fi 排查、账号密码、系统设置、多设备协同、命令行、性能优化,最后来到 AI 时代。
如果你一路跟下来,现在你应该具备的不只是"会用某个软件"——而是能:
- 遇到问题知道怎么拆解——不是害怕,是分析
- 新东西敢上手试——不是等别人教,是自己探
- 明白数字世界的运作方式——账号是什么、网络怎么连、AI 怎么猜你喜欢
- 能分辨哪些是忽悠,哪些是真东西——"电脑管家"、"加速大师"、"AI 有意识"
技术会继续变。Windows 12 会来,AI 会更聪明,新的设备形态会冒出来。但这些能力——拆解问题、搜索答案、大胆验证、保持怀疑——不会过时。
你不是数字世界的客人,不需要等别人来教你怎么用。你是主人,工具应该为你服务。
(课程正式完结,但你的数字生活刚刚开始。)