伴随文明信息载体飞速改变,视频和图文需求的此消彼长,视频搜索趋势同样无法逆转,注定会成为更多互联网巨头又一个争夺的战场——视频搜索,也就会凸显出它的更大价值所在。
作者 | 杨铭
“视频搜索这种更具画面感、个性化的搜索方式,会成为未来搜索引擎新趋势吗?”
这是2月17日,字节跳动CEO张楠透露,抖音视频搜索月活用户超5.5亿,日均视频搜索量已达4亿,抖音将加大对搜索的投入力度之后,在知乎,由官方“知乎科技”发起,已有400来人参与的热门问答。
在移动端积极布局搜索业务的不止抖音,其早已成为所有巨头布局方向。2021年微信公开课上,微信搜一搜首次完整亮相。更早之前,字节跳动等互联网巨头也公开宣布发力搜索业务。区别在于,无论是微信搜一搜,还是其他互联网巨头,重点发力方向都是通用搜索,而不是视频搜索。
搜索,英文名Search。过去30年来,作为用户需求、依赖最多的领域,搜索对互联网发展有天翻地覆的影响,如果没有搜索,那么大概率不会有如今的互联网。
从文字搜索到整合搜索、图片搜索、音频搜索,乃至现在的视频搜索,搜索成为互联网进化最快的领域之一。直到如今,智能设备和信息技术大爆炸仍持续影响着搜索方式,推动搜索变得越来越更聪明。
这也让过去多年来,众多业界人士,甚至谷歌搜索产品和用户体验副总裁玛丽莎.梅耶尔(Marissa Mayer),在十多年前的《搜索的未来》中发出相同提问:
搜索引擎会成为过去时吗?未来的搜索,又会是什么模样?
毋庸置疑。也许谷歌、百度会没落,但搜索引擎不会过时,它本就是一部在技术不断革新中变得更好的搜索简史——面对日益复杂的各种内容,越来越懂得用户的查询需求,并迅速为用户提供更精准的信息和答案,本就是搜索引擎诞生以来一直致力的前进方向。
归根结底,无论百度、谷歌、微软、雅虎、Pintrest,还是YouTube、抖音、微信搜索,尽管各大搜索引擎获取信息的方式已不尽相同,但其目标都一致:谁更准确理解用户想找什么,谁就将引领下一代搜索潮流。
01
PC时代:从萌芽到百度谷歌争霸
搜索引擎原理,很大程度源于传统文件检索技术。它的简史,要从30多年前互联网萌芽并兴起时代说起。
1990年以前,万维网还未出现,没人能搜索互联网。这一年,加拿大麦吉尔大学的三位学生发明了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,它没有机器人(Robot)程序,还不是真正的搜索引擎。
搜索引擎的萌芽
时代巨轮,正悄然启动。1993年,美国副总统戈尔提出“信息高速公路计划”,并由此爆发了互联网超常规发展的黄金十年。
信息高速公路网,也许就是搜索引擎。1994年,Lycos推出基于人工分类目录的搜索引擎,用户输入关键词就可根据内容需要查找网页,在此之前,用户需要通过人工收集和整理“网址索引”才能进入网页,雅虎正是这方面的代表。
早期的搜索引擎百花齐放,虽然功能都不完善、命运多舛,但为后来跨时代发展奠定了基础。
跨时代变革在1998年到来。这一年,拉里·佩奇和谢尔盖·布林在斯坦福大学学生宿舍开发了谷歌,他们发明了叫做PageRank的链接分析技术,使得搜索结果相关性大大增强,并且在界面等实现了革命性创新。
谷歌搜索引擎的出现,标志着全民互联网时代的来临。从此,世界网民都认识到,搜索是一个简单动作,输入关键词,就能在一页页蓝色链接中寻找到结果。
在国内,李彦宏携120万美元风险投资回国,成立众里寻他千百度的“百度”,通过建立在海量网站上的“超链分析”技术,走到了舞台中央。
此后,更多公司受搜索市场前景和谷歌神话吸引,积极进入搜索引擎市场,谋求一席之地。但也因为浏览器劫持、恶意捆绑等行为,在备受争议后寂然无声。
2004年9月,谷歌推出简体及繁体两种中文版本的搜索引擎,与百度在内地市场分庭抗礼,加上360、搜狗、网易有道等的出现,搜索引擎大战在国内爆发。
2010年谷歌退出内地市场,百度开始在国内一家独大无人撼动,一度在国内PC搜索市场占据83%以上市场份额。尽管它与谷歌占据全球90%市场份额相比,从全球来看依然是小众搜索。
回头看去,虽然外界对谷歌、百度迄今仍有诸多争议,但归根结底,他们能在PC时代占据统治地位,是通过技术让搜索质量有了质的飞跃,用户获得信息更快准确,让搜索引擎真正成为互联网的第一流量入口。
在这个基础上,还诞生了搜索广告、搜索引擎优化(SOE)、搜索引擎营销(SEM)等技术与商业化形式。而知识图谱、个性搜索、云计算、乃至人工智能等技术的发展,某种程度上也被搜索技术的进步所影响和推动。
这是谷歌、百度在搜索历史中所起到的巨大重要作用,也是谷歌、百度能成为科技巨头的根本原因,如同李彦宏所说:“搜索是百度成功的所有秘密”。
无论是谷歌,还是百度,他们仍然一直沿用的是上世纪的关键词来生成网址索引的模式——在互联网内容日益复杂、庞杂后,难以满足用户的搜索细分意图,导致大把时间都被消磨殆尽了。
这就是过去多年来,搜索引擎是否过时说法的主要原因。2011年,时任微软Bing的主管就如此批评:“在过去12年里,搜索本质上没有什么改变,传统搜索正在走向失败。搜索的概念不再有效,在网页上、在反向链接上、在所有一切上寻找文本不再管用了。”
02
移动十年:三大搜索方式潜力未兑现
潮起潮落,随着移动互联网兴起,PC端逐渐向移动端流量转移,搜索也开始进入移动时代。
移动搜索与传统搜索有着很大不同,搜索诉求、搜索方式、输入方式、输出结果,都因为各种移动设备而变得更自然、更广泛和更智能——人们不仅可以随时随地通过 Siri搜索,还可以在跑步时用可穿戴设备搜索,也可以懒洋洋地躺在沙发上用Alexa搜索。
文字搜索远远满足不了亿万网民需求后,语音搜索、图片搜索、视觉搜索,是过去移动互联网10年三大最有代表性的搜索方式。
2011年开始,在智能手机、可穿戴设备、智能语音助手、智能音箱等助推下,语音搜索让众多巨头兴奋不已。不过,几年发展后,尽管大多数语音识别技术识别率已达到了一个较高水准,但识别并不等同于理解,算法速率和准确率需要进一步提升,同时无法排除嘈杂的环境干扰,对使用者的说话语气、语速、口音等要求颇高。
语音搜索识别率仍不高
从咨询公司Roast2018年一份研究22个垂直行业的语音搜索情况来看,Google智能助理能回答的问题不足一半,即使是能回答的问题,答案类型也是千差万别。
语音搜索在某些人士看来,目前还是鸡肋的同时,图片搜索、视觉搜索又开始兴起。
图片搜索和视觉搜索背后的技术逻辑相通,比如都是基于算法和数据,与数据库中的特征照片进行对比,识别和搜索目标图片中的语义标签。因此无论是谷歌、百度、Facebook、微软、亚马逊,还是Pinterest(图片版的推特),他们都早早进入了上述领域并投入了大量的研发资金。
两者在输入上却完全不同。前者是一种以反馈图像有效信息结果的搜索模式,只需输入文本、关键字或者图片就可以得出结果,门槛相对较低;后者是用智能手机或其他摄影头来识别物理世界所有对象信息的模式,再使用发展近30年历史的图像识别技术,结合用户特征和搜索场景得出相关信息。
谷歌在2011年推出图片搜索,这个功能一经推出,让网络信息共享跨入新时代。不过,基于单幅图片来进行搜索,相对有局限性。
2009年,谷歌为安卓手机开发的Google Goggles可以说是最早的视觉搜索应用。Goggles目的在于搜索识别现实世界中拍摄对象的图片信息,并且能够使用物品的条形码进行产品搜索。
但是Goggles的技术非常基础,本质上是一个搜索引擎公司的Pinterest也在2015年就推出了它的视觉搜索功能,并取得了技术上的重大突破,比如如何更有效将图像识别和视觉搜索功能结合起来,包括能够在更广的可视范围内中逐个建立单个识别对象,并在视觉应用上显示搜索信息。
2019年2月,Pinterest推出了图片搜索功能Lens。经过1年探索后,Pinterest用户每月至少进行6亿次视觉搜索,且搜索总数在不断上升。其受欢迎原因在于,它能够为每一位用户创建一个独特的“品味图谱”,煽动并捕捉由此带来的购买欲。
Pinterest视觉搜索
谷歌也在2017年通过图像识别和OCR技术推出了Lens功能,让机器学会“看图说话”,并且用它正式取代了Goggles。不过,直到2020年6月,谷歌才宣布可以在所有稳定版本中使用Google Lens。
和传统搜索相比,用户在使用图片搜索、视觉搜索时,寻找的是图片而不是关键词,进一步满足了用户的搜索需求和体验需求。