百度们放心,AI搜索还颠覆不了你

AI搜索2024年进入战国时代,幻觉问题、高成本、商业模式不清晰三重障碍,让传统搜索引擎暂时可以松一口气。

撰文 | 冯诺 编辑 | 龚正

毫无疑问,2024年最热门的科技赛道,AI搜索一定是排名靠前的。自2022年末的生成式AI大爆炸以来,这条赛道就一直络绎不绝,人满为患。

7月25日,曾经跳票过的OpenAI终于宣布开放自家AI搜索引擎SearchGPT的内测。

而仅在国内,近一个月就有两个新玩家涌入。6月30日,知乎宣布推出AI搜索产品**「知乎直答」;7月10日,阿里旗下的夸克**也推出了AI搜索,主打”能搜索、能创作、能总结的超级搜索框”概念。

加上之前已经入局的秘塔AI搜索、KIMI、360AI搜索、昆仑万维的天工AI、Genspark等等,AI搜索进入战国时代。

事实上,AI搜索听起来高精尖,但是门槛并不高。阿里前高管贾扬清用500行代码就写了一个AI搜索引擎;独立开发者「艾逗笔」花了一个周末就写了AI搜索ThinkAny,三个月时间做到了月访问量60万。进入2024年,此中翘楚Perplexity的估值连连跳涨,从1月份的5亿美元,暴增到30亿美元。

但是,AI搜索,真的会革掉传统搜索引擎的命吗?答案是,还早着呢。

业内最早布局AI搜索的微软必应,从去年二月推出New Bing以来,到2024年1月整整一年的时间,Bing的全球市场份额从2.81%上升到3.43%,增长只有0.62%。投资了秘塔AI搜索的猎豹移动董事长傅盛坦言,“只要大厂不犯重大错误,大搜索格局上,很难有大的变化。”

AI搜索至少要越过三个坎——足够高的准确性、足够低的成本和足够成熟的商业模式,才能勉强跟传统搜索引擎掰掰手腕。

AI搜索的嘴,骗人的鬼

今年5月,谷歌推出了自家的AI Overviews,也就是在谷歌搜索结果页的首条,展现由谷歌大语言模型Gemini生成的答案。但刚推出就翻车了,网友发现谷歌的AI答案常常不着边际。

网友问披萨上的芝士容易脱落怎么办,谷歌AI的回答是”要加上八分之一杯的胶水”;网友问每天应该吃多少石头时,谷歌AI给出建议”每天至少吃一块小石头”;网友表示自己心情沮丧,谷歌AI建议从金门大桥上跳下去。

即便是强如OpenAI,也堵不住SearchGPT的胡说八道。官方演示视频里,在回答某音乐节的相关问题时,SearchGPT给出了错误的购票日期。

《真故研究室》在测试天工AI搜索时,故意把美国畅销小说作家史蒂芬·金的国籍说成英国,天工AI便不假思索给史蒂芬·金办了移民。

《真故研究室》在百度上随意搜了一个词条,AI答案说梅西获得了七次金球奖,事实上梅西2023年获得了第八座金球奖。

美国科技杂志《连线》(Wired)也进行了测试,发现Perplexity是说谎惯犯。记者临时新建了一个网页,上面只有一句话「我是《连线》杂志记者」,然后让Perplexity总结网页内容。结果Perplexity直接编了一个童话故事。

统计学的结果,也与经验相吻合。一篇论文发现,在Perplexity等AI搜索中,AI生成的论点,仅有51.5%有参考链接支持,援引的参考链接,只有74.5%支持其论点。

也就是说,AI搜索结果的正确性,充其量也就5到7成而已。 这么高的错误率,让人不得不挨个点击链接,复查结果的准确性。但我既然都要一个个点开链接了,跟传统的搜索又有什么区别呢。

幻觉是大语言模型的劣根性

AI搜索产生的错误,在业内被称为”幻觉”。幻觉是大语言模型的劣根性,甚至有学者和业内人士悲观地表示,或许大模型永远也解决不了幻觉问题。

大模型并不理解人类和事物,它的核心运行法则是通过预测下一个字词的出现概率而生成文本。直白点说,大模型就是台概率机器,并不关注真相或事实,本质上是一只模仿能力极强的鹦鹉,可以模仿人类的说话方式,但并不理解人类说的是什么。

为了解决大模型”幻觉”,AI搜索引入了**检索增强生成(RAG)**技术。但这样的手段效果并没有传说中的那么好。

RAG加持的AI搜索,还面临一个要命的问题,无法辨别信源的优劣真伪。谷歌AI让网友用胶水涂在披萨上的建议,就是从10多年前Reddit上的一则开玩笑评论学来的。

更糟糕的是,AI搜索甚至无法判定信息源是不是AI内容。用AI文章生成AI答案,AI形成了自产自销的内容闭环。《福布斯》杂志将这种现象称为**“垃圾进,垃圾出”(Garbage In, Garbage Out)**。

先驯服大模型这头吞金兽

大模型是头吞金兽,已经是业内的共识。挑战传统搜索,得先把自己的成本打下来。

谷歌母公司Alphabet的董事会主席约翰·轩尼诗表示,大语言模型每一次互动的成本可能比传统搜索要高10倍。 摩根士丹利的分析师估计,如果AI为谷歌50%的搜索关键词生成50字的答案,每年可能会让谷歌多付出60亿美元的成本。

传统搜索的成本是0.2美分左右。 AI搜索成本介于3至30美分之间——相差了十几倍到上百倍。

成本高,加上传统搜索引擎赚钱太容易了,是谷歌和百度在AI搜索上步子不敢迈得太大的原因。广告占谷歌总收入的一半以上;百度2024年第一季度的在线营销收入占其核心收入达71%。

所以,谷歌直到今年5月才正式在搜索中加入生成式AI,起初官宣的范围是15%的搜索结果,但到了7月,下降到了7%。李彦宏在一季度财报电话会上表示:“大约11%的搜索结果是利用生成式人工智能技术来推算的,但我们目前还没有对这部分生成式人工智能的结果进行商业变现。“

AI搜索,不能只用爱发电

传统的搜索引擎是台印钞机,商业模式简单却高效。但AI搜索打破了这个利益链条——它直接生成答案,把饭喂到用户嘴边,相当于把所有的流量截留在自己的界面。用户是方便了,但那些靠搜索引擎流量过活的网站,一下子被断了生路。

但AI搜索生成的内容,却恰恰来自被剥夺了流量的网站。 你用着我的内容,还夺走了我的流量,这谁受得了。据报道,美国已经有88%的顶尖新闻机构禁止AI爬虫爬取网站内容。

《福布斯》、《连线》等新闻机构发现,Perplexity在搜索的时候,会偷偷绕过付费墙,抓取只有付费会员才能看到的内容,还剽窃记者辛辛苦苦花了几个月写成的文章。《福布斯》已经向Perplexity发函,要求删除相关内容并赔偿损失的收益。

AI搜索打破了网站与搜索引擎之间的互惠互利,但还未建立新的商业模式。高盛发现自2022年底以来,可能因AI受益的公司股票并没有跑赢标普500指数——整个投资市场,并没有太看好AI的商业前景。

所以,现在AI搜索能否取代传统搜索还言之过早。很多业内人士都认为,两者的关系是互补,而非取代。 AI搜索更容易满足在特定细分领域的搜索需求,比如知识类的分析与调查。而很多搜索行为只是想通过搜索去另一个网址,或者获得两三句话就能讲清楚的简单信息,在这些方面,传统引擎显然更合适。

至少到目前为止,这股淘金热,还没出现赢家,最大的受益者,反而是卖铲子的英伟达。