昨天晚上又又又熬夜了,实在没忍住,睡之前又打开Claude Code开始聊。(这次真不是为了烧“词元”😂)
起因是一个很简单的问题,我在刷牙的时候,就突然冒出来一句话:到底什么叫用AI用得好?
然后事情变得有意思了。
我问完这个问题之后,脑子里立刻冒出第二个问题:我为什么想知道这个?
接着是第三个问题、第四个问题....我是怎么判断别人用AI的水平的?我凭什么判断?我的标准是什么?这个标准有没有人研究过?他们怎么说的?跟我的想法一样吗?如果不一样,为什么不一样?
每一层问题都打开下一层。像俄罗斯套娃,但没有最小的那一个,每打开一层,里面还有一层。
更好玩的是,我在用AI来研究"什么叫用AI用得好",这个行为本身,就是我最近沉迷的事情,让AI来帮助你提升元认知!会上瘾,真的。
停不下来了。翻了一堆论文和数据报告,一直聊到凌晨,不过,我的思考也也不一定就是对的,分享出来一起学习呗。
1-使用AI好不好,有没有标准?
其实,大家有没有发现,如果你是一个AI 重度用户,几乎你和别人聊几句,就能判断对方用AI的程度。
但到了一定的程度后,你自己都没办法判断自己用AI的方式是否还需要精进,因为市面上还真没啥统一的标准。
不过,2026年2月23日,做Claude的公司Anthropic发了一份报告。
他们分析了9830条真实用户对话,总结出AI使用能力的4个维度,叫"4D框架"。看
看完你就基本知道自己使用AI的水平了。
维度
核心问题
翻译成人话
Delegation
该不该让AI做这件事?
你知道AI的边界在哪吗
Description
能说清你要什么吗?
就是Prompt能力
Discernment
能评估AI给的东西吗?
它说的对不对你能判断吗
Diligence
你对AI的产出负责吗?
会告诉别人这是AI帮你写的吗
Prompt能力排在第二位,这让我意外。排在第一位的,是"判断该不该让AI做"。
报告里有一句话让我印象很深:
"完美的Prompt无法弥补糟糕的委派决策。"
你Prompt写得再好,如果这件事本来就不该交给AI,或者你把不该交的部分也交了,结果不会好。
他们还统计了11个可观察的AI素养行为在对话中的出现频率。
排在第一的是"迭代和精炼"——85.7%的对话都有。大部分人确实在跟AI来回改。
但往下看就扎心了:
"质疑AI的推理逻辑"——只有15.8%。
"核查AI给的事实和数据"——只有8.7%。
85%的人会跟AI反复改稿,但不到9%的人会停下来想:它说的这个,是对的吗?
再看迭代用户和非迭代用户的对比,差距更明显:会迭代的用户质疑AI推理的频率,是不迭代用户的5.6倍。发现AI遗漏关键信息的能力,是后者的4倍。
所以,用好AI 的人,真的更像是在跟一个需要你持续追问的合作者一起工作。
2、锯齿前沿:为什么你永远不能照搬别人的方法
哈佛商学院和BCG做过一个实验。758名BCG顾问,一半人用GPT-4辅助工作,一半人不用。
结果用AI的那组,任务量多了12%,速度快了25%,质量高了40%。
听起来AI全面碾压?
但故事没这么简单。研究者发现了一个危险的现象:当任务超出AI的能力边界时,那些依赖AI的顾问,准确率反而低了19个百分点。
他们给这个现象起了一个名字,叫**"锯齿前沿"(Jagged Frontier)**。
啥事锯齿前沿呢?
大白话说就是:AI的能力边界不是一条平滑的线。它是锯齿形的,有些看起来很难的事,AI做得极好;有些看起来很简单的事,AI做得一塌糊涂。
而且,没有人知道这条锯齿线在哪。包括做AI的人自己。
这就解释了一件事,为什么你不能照搬任何人的AI使用方法。而且你大概率会发现,你看着别人和你操作一样,但是你们的输出结果完全不同,甚至你还会带来很多的bug。
至少到目前为止,用好AI 这件事,我还没发现捷径,只能自己去试、去撞、去积累。
沃顿商学院教授Ethan Mollick说过一段话:
"很多人以为有一本秘密说明书。OpenAI自己也不知道你不知道的东西。唯一的方法就是大量使用。"
我太认同了,很多人找我学AI,好像以为教了钱,老师就能把武功秘籍输入大脑一样。
3-真正的分水岭:元认知!
MIT做了一个实验,让250名员工分成两组,一组用ChatGPT,一组不用。
结论是:AI确实能提升创造力。
但有一个前提条件:只对有元认知策略的人有效。
元认知,说白了就是"思考自己怎么思考的"。
比如昨晚,我问AI"什么叫用AI用得好",问完之后我没有等答案,而是先问了自己:我为什么想知道这个?然后又问:我为什么在乎这个标准?
就是开头说的那个套娃。
在家里,我跟孩子聊天也是这个模式。他问了一个问题,我不急着回答,而是先问他:你为什么想知道这个?然后他答了,我再问:你为什么觉得这个重要?无限套娃,快乐无穷。
4-但用好AI的核心思维就是:递归
看到MIT的这个结论时,我有一种奇怪的感觉,好像我一直在做这件事,只是没有命名。
直到我这一期AI 素养训练营,我给这个思维做了个名称,我把它叫做"递归":用AI来学如何用AI。
然后10个学员,有的是过去都不碰电脑的,打通这个点后,居然已经开始玩龙虾了,逼得我赶紧修改我的教学计划。
不过,让我最爽的还是,用 AI 来做自我的反馈,让AI直接给的思维链条做检查,然后你就会发现,你一天比一天通。
在AI出现之前,你很难"看见"自己的思维。思维是看不到的,甚至你大部分时间都是潜意识。
但,有了AI 后,我真的像请了个大仙,我最常说的是:“快帮我一起分析一下,我为什么会这么想,背后的理论是啥?”
于是我做了个思维棱镜,现在大家都用上了,一片好评。
你把思考过程说出来,AI把它变成文字,文字变成可以被审视的对象。然后你看到AI的分析,产生新的思考,再交给AI,每转一圈,你对自己的理解就深一层。
普通的反思是单向的,我观察自己,调整行为。
递归是双向的,我观察自己,AI分析我的观察,我审视AI的分析,AI再分析我的审视……每一圈都产生之前不存在的认知。
5-所以,到底什么叫用AI用得好?
综合这些研究和我自己一路走来的经验,我发现了5条规律。不是工具层面的,是认知层面的:
1. 知道AI的边界在哪(至少在自己的领域里)。
不是泛泛地知道"AI会犯错",而是具体知道"这类任务AI很擅长,那类任务AI一定会出问题"。这只能通过大量使用来积累。
2. 会追问,而不是接受。
AI给了一个答案,第一反应不是"不错",而是"你为什么这么建议?有没有漏掉什么?"
3. 在迭代,而不是一次性使用。
Anthropic的数据说得很清楚:迭代用户的AI素养行为是非迭代用户的2倍。一次性"帮我写个XXX",不叫用AI用得好。
4. 在想自己怎么想的。
每次用完AI,花几秒钟想:"这次协作哪里顺畅,哪里别扭?下次怎么调整?"这就是元认知。
5. 在用AI来改进自己使用AI的方式。
这就是递归。也是我认为最关键的一条,因为它把前四条全部包含了。
而且,你还能让你的AI 来给你反馈,你怎么提升用AI的能力。(又是一个强大的递归和元认知啊~)
我做了一个skill-你的AI使用诊断报告。
让AI给你出一份"AI使用能力诊断报告"——你粘贴一段Prompt到任何一个有记忆的AI里,它就能基于和你的历史对话,告诉你你在哪个层级。
如果你也想要使用,欢迎联系我获取。
👀如果你也在探索 AI +个人成长 +家庭教育 ,关注后加入木妈2026年AI家庭教育学习社群~
也可以点击查看我的产品介绍。
我是木妈,一名AI+家庭教育实践者,得到AI学习圈讲师,已经上线2门给家长的AI实战课。私信我可获得讲师亲友价。
木妈未来社区是一个浸泡式学习「AI家庭教育」的社区。如果你也想找个组织浸泡学习,欢迎后台留言。
点击👇查看往期实践案例
