Jim Gray的第四范式理论:从“猜答案”到“让数据自己说话”(2/2)
而且这些数据是“全量数据”,不是以前的“抽样数据”。比如以前做市场调研,只能抽1000个人问“喜欢什么产品”;现在直接分析1亿用户的消费记录,数据更全面,找出来的规律也更靠谱。
(二)计算机是“规律发现者”,不是“计算器”
在前三个范式里,计算机最多只是个“超级计算器”,帮人类算复杂的公式、做模拟;但在第四范式里,计算机成了“主角”,用AI算法自主挖掘规律。比如用机器学习的算法分析工业设备的运行数据,AI能自己找出“温度超过80℃、转速达到3000转时,设备故障概率会增加5倍”的规律,这个过程不需要人类提前设定“温度和故障有关”的假设,全是AI从数据里分析出来的。
这就突破了人类的认知局限——人类的大脑最多能同时思考几个因素,而AI能同时分析几千、几万个因素之间的关系,找到那些人类根本想不到的关联。
(三)不追求“因果关系”,先抓“相关关系”
前三个范式都特别在意“为什么”,也就是因果关系,比如“因为万有引力,所以苹果落地”;但第四范式更在意“是什么”,也就是相关关系——只要从数据里发现“两个事物同时出现的概率很高”,就算暂时不知道为什么,也能用来做预测。
比如电商平台通过数据发现“买尿不湿的顾客,有30%会同时买啤酒”,虽然暂时搞不懂“尿不湿和啤酒有啥因果关系”,但平台可以把尿不湿和啤酒放在一起卖,提升销量;再比如气象数据显示“当东南风风速达到5级、湿度超过70%时,明天大概率下雨”,就算不知道具体的气象原理,也能靠这个规律精准预报天气。
当然,这不是说因果关系不重要,而是第四范式告诉我们:在数据足够多的情况下,先抓住相关关系解决实际问题,再慢慢研究因果关系,效率会高得多。
四、第四范式对现实的影响:不止是科学研究,还改变了企业做事的逻辑
Ji Gray的第四范式理论,不光影响了学术界的研究方式,更深刻改变了企业的经营和决策逻辑——这也是为什么戴文渊会用“第四范式”给公司命名,因为他的公司就是靠这个理论做核心业务的。
(一)对企业的影响:从“拍脑袋决策”到“数据决策”
以前企业做决策,大多是老板“拍脑袋”:“我觉得这个产品会好卖”“我认为应该在南方开分店”;现在用第四范式的思路,企业会把销售数据、用户数据、市场数据都输进AI系统,让数据告诉自己“哪个产品的销量会涨”“哪个地区的客户购买力强”。
比如零售企业用第四范式的AI分析用户消费数据,能精准预测“下个月某款牛奶的销量会增加20%”,提前备货就不会缺货;制造企业分析设备运行数据,能预测“某台机器下周会出故障”,提前维修就不会耽误生产。这些都是第四范式在企业里的实际应用,核心就是“让数据说话,代替人的主观判断”。
(二)对AI行业的影响:让AI从“聊天”变成“干活”
现在很多人觉得AI就是“聊天机器人”,能陪你说话、写文案,但这只是通用AI的一小部分功能。而第四范式理论启发的AI,是“决策AI”——帮企业从数据里找规律、做预测,解决实际业务问题。
戴文渊创办的第四范式公司,就是做这种“决策AI”的:比如他们的迁移学习技术,能让企业用少量数据快速训练出高精度的预测模型,解决“数据少、没法做AI”的问题;他们的先知AIOS 5.0平台,能帮企业搭建行业大模型,聚焦“预测下一个X”(比如设备故障、用户流失、金融风险),这都是完全遵循第四范式“数据驱动”的思路。
简单说,第四范式让AI从“能说会道的花瓶”,变成了“能帮企业赚钱、降本、增效的工具”。
(三)对普通人的影响:生活更便利,决策更靠谱
第四范式的思路也悄悄融入了我们的日常生活:比如刷短视频时,算法根据你的观看数据推荐你喜欢的内容;比如打车软件根据路况、司机、乘客的数据,精准预测“打车需要等5分钟”;比如银行根据你的消费和信用数据,判断你是否符合贷款条件。这些都是数据驱动的第四范式在发挥作用,让我们的生活更便利。
甚至我们自己做决策时,也会不自觉用第四范式的思路:比如买手机前,会去看几千条用户评价(数据),而不是只听朋友的推荐(经验),这就是从“经验驱动”转向“数据驱动”的体现。
五、最后聊聊:第四范式不是“万能的”,也有自己的局限
虽然第四范式很厉害,但它也不是解决所有问题的“银弹”,还有几个明显的局限:
第一,需要海量高质量的数据。如果数据是错的、不完整的,AI找出来的规律也是错的——这就是常说的“垃圾进,垃圾出”。比如企业用虚假的销售数据做分析,AI预测的结果肯定不靠谱。
第二,容易陷入“相关≠因果”的误区。比如数据显示“冰淇淋销量上涨,溺水事故也增多”,其实两者都是因为夏天到了,并不是冰淇淋导致了溺水。如果企业只看相关关系,不分析因果,可能会做出错误的决策。
第三,对隐私和安全的要求更高。第四范式需要海量的个人或企业数据,这些数据如果泄露,会造成严重的隐私问题。比如医院的病历数据、金融机构的交易数据,都需要严格的隐私保护技术,才能放心用来做分析。
但这些局限并不是第四范式本身的问题,而是技术应用过程中需要解决的挑战。随着数据治理、隐私计算、因果推理等技术的发展,这些问题都会慢慢得到解决,第四范式也会在更多领域发挥作用。
总的来说,Ji Gray的第四范式理论,本质上是给数据时代的人类指了一条新的探索路径:不再只靠人的经验和智慧,而是学会和数据合作,让数据成为我们探索世界、解决问题的“超级帮手”。而戴文渊创办的第四范式公司,就是把这个理论从学术界搬到了产业界,让千千万万的企业都能享受到数据驱动的红利——这也是为什么这个理论能一直影响到今天,成为大数据和AI时代的核心思想之一。