百度们放心，AI搜索还颠覆不了你

撰文 | 冯诺　编辑 | 龚正

毫无疑问，2024年最热门的科技赛道，AI搜索一定是排名靠前的。自2022年末的生成式AI大爆炸以来，这条赛道就一直络绎不绝，人满为患。

7月25日，曾经跳票过的OpenAI终于宣布开放自家AI搜索引擎SearchGPT的内测。

而仅在国内，近一个月就有两个新玩家涌入。6月30日，知乎宣布推出AI搜索产品**「知乎直答」；7月10日，阿里旗下的夸克**也推出了AI搜索，主打”能搜索、能创作、能总结的超级搜索框”概念。

加上之前已经入局的秘塔AI搜索、KIMI、360AI搜索、昆仑万维的天工AI、Genspark等等，AI搜索进入战国时代。

事实上，AI搜索听起来高精尖，但是门槛并不高。阿里前高管贾扬清用500行代码就写了一个AI搜索引擎；独立开发者「艾逗笔」花了一个周末就写了AI搜索ThinkAny，三个月时间做到了月访问量60万。进入2024年，此中翘楚Perplexity的估值连连跳涨，从1月份的5亿美元，暴增到30亿美元。

但是，AI搜索，真的会革掉传统搜索引擎的命吗？答案是，还早着呢。

业内最早布局AI搜索的微软必应，从去年二月推出New Bing以来，到2024年1月整整一年的时间，Bing的全球市场份额从2.81%上升到3.43%，增长只有0.62%。投资了秘塔AI搜索的猎豹移动董事长傅盛坦言，“只要大厂不犯重大错误，大搜索格局上，很难有大的变化。”

AI搜索至少要越过三个坎——足够高的准确性、足够低的成本和足够成熟的商业模式，才能勉强跟传统搜索引擎掰掰手腕。

AI搜索的嘴，骗人的鬼

今年5月，谷歌推出了自家的AI Overviews，也就是在谷歌搜索结果页的首条，展现由谷歌大语言模型Gemini生成的答案。但刚推出就翻车了，网友发现谷歌的AI答案常常不着边际。

网友问披萨上的芝士容易脱落怎么办，谷歌AI的回答是”要加上八分之一杯的胶水”；网友问每天应该吃多少石头时，谷歌AI给出建议”每天至少吃一块小石头”；网友表示自己心情沮丧，谷歌AI建议从金门大桥上跳下去。

即便是强如OpenAI，也堵不住SearchGPT的胡说八道。官方演示视频里，在回答某音乐节的相关问题时，SearchGPT给出了错误的购票日期。

《真故研究室》在测试天工AI搜索时，故意把美国畅销小说作家史蒂芬·金的国籍说成英国，天工AI便不假思索给史蒂芬·金办了移民。

《真故研究室》在百度上随意搜了一个词条，AI答案说梅西获得了七次金球奖，事实上梅西2023年获得了第八座金球奖。

美国科技杂志《连线》（Wired）也进行了测试，发现Perplexity是说谎惯犯。记者临时新建了一个网页，上面只有一句话「我是《连线》杂志记者」，然后让Perplexity总结网页内容。结果Perplexity直接编了一个童话故事。

统计学的结果，也与经验相吻合。一篇论文发现，在Perplexity等AI搜索中，AI生成的论点，仅有51.5%有参考链接支持，援引的参考链接，只有74.5%支持其论点。

也就是说，AI搜索结果的正确性，充其量也就5到7成而已。 这么高的错误率，让人不得不挨个点击链接，复查结果的准确性。但我既然都要一个个点开链接了，跟传统的搜索又有什么区别呢。

AI搜索产生的错误，在业内被称为”幻觉”。幻觉是大语言模型的劣根性，甚至有学者和业内人士悲观地表示，或许大模型永远也解决不了幻觉问题。

大模型并不理解人类和事物，它的核心运行法则是通过预测下一个字词的出现概率而生成文本。直白点说，大模型就是台概率机器，并不关注真相或事实，本质上是一只模仿能力极强的鹦鹉，可以模仿人类的说话方式，但并不理解人类说的是什么。

为了解决大模型”幻觉”，AI搜索引入了**检索增强生成（RAG）**技术。但这样的手段效果并没有传说中的那么好。

RAG加持的AI搜索，还面临一个要命的问题，无法辨别信源的优劣真伪。谷歌AI让网友用胶水涂在披萨上的建议，就是从10多年前Reddit上的一则开玩笑评论学来的。

更糟糕的是，AI搜索甚至无法判定信息源是不是AI内容。用AI文章生成AI答案，AI形成了自产自销的内容闭环。《福布斯》杂志将这种现象称为**“垃圾进，垃圾出”（Garbage In, Garbage Out）**。

大模型是头吞金兽，已经是业内的共识。挑战传统搜索，得先把自己的成本打下来。

谷歌母公司Alphabet的董事会主席约翰·轩尼诗表示，大语言模型每一次互动的成本可能比传统搜索要高10倍。 摩根士丹利的分析师估计，如果AI为谷歌50%的搜索关键词生成50字的答案，每年可能会让谷歌多付出60亿美元的成本。

传统搜索的成本是0.2美分左右。 AI搜索成本介于3至30美分之间——相差了十几倍到上百倍。

成本高，加上传统搜索引擎赚钱太容易了，是谷歌和百度在AI搜索上步子不敢迈得太大的原因。广告占谷歌总收入的一半以上；百度2024年第一季度的在线营销收入占其核心收入达71%。

所以，谷歌直到今年5月才正式在搜索中加入生成式AI，起初官宣的范围是15%的搜索结果，但到了7月，下降到了7%。李彦宏在一季度财报电话会上表示：“大约11%的搜索结果是利用生成式人工智能技术来推算的，但我们目前还没有对这部分生成式人工智能的结果进行商业变现。“

传统的搜索引擎是台印钞机，商业模式简单却高效。但AI搜索打破了这个利益链条——它直接生成答案，把饭喂到用户嘴边，相当于把所有的流量截留在自己的界面。用户是方便了，但那些靠搜索引擎流量过活的网站，一下子被断了生路。

但AI搜索生成的内容，却恰恰来自被剥夺了流量的网站。 你用着我的内容，还夺走了我的流量，这谁受得了。据报道，美国已经有88%的顶尖新闻机构禁止AI爬虫爬取网站内容。

《福布斯》、《连线》等新闻机构发现，Perplexity在搜索的时候，会偷偷绕过付费墙，抓取只有付费会员才能看到的内容，还剽窃记者辛辛苦苦花了几个月写成的文章。《福布斯》已经向Perplexity发函，要求删除相关内容并赔偿损失的收益。

AI搜索打破了网站与搜索引擎之间的互惠互利，但还未建立新的商业模式。高盛发现自2022年底以来，可能因AI受益的公司股票并没有跑赢标普500指数——整个投资市场，并没有太看好AI的商业前景。

所以，现在AI搜索能否取代传统搜索还言之过早。很多业内人士都认为，两者的关系是互补，而非取代。 AI搜索更容易满足在特定细分领域的搜索需求，比如知识类的分析与调查。而很多搜索行为只是想通过搜索去另一个网址，或者获得两三句话就能讲清楚的简单信息，在这些方面，传统引擎显然更合适。

至少到目前为止，这股淘金热，还没出现赢家，最大的受益者，反而是卖铲子的英伟达。