首页 > 行业资讯 >> 信息技术 >> 2023年搜索引擎研究报告
文章来源:和仕咨询整理 作者:和仕咨询整理 阅读量:548 发布时间:2023-05-30
第一章 行业概况
搜索引擎是基于网络爬虫、检索排序、网页处理、大数据处理、自然语言处理等技术,根据用户需求与推荐算法,运用特定策略从互联网海量信息中检索出匹配信息反馈给用户的检索技术,为用户提供快速、高相关性的信息服务。
中国互联网与移动互联网的快速发展使中国网络用户的规模持续扩大,直接促进了搜索引擎用户的不断上升,进而强化了搜索引擎的媒体属性。同时,互联网日益成为消费者获取信息的主要渠道,广告主的营销预算与投入不断向互联网渠道及媒体转移,搜索引擎作为互联网的主要流量入口,成为广告主互联网广告营销与推广的渠道选择,使中国搜索引擎行业的广告业务营收稳步增长,从而推动行业整体快速发展。
中国的搜索引擎公司主要有百度、搜狗、好搜、必应、360搜索、谷歌中国等。国际上主要有谷歌、微软、苹果、Yahoo、Ask、维基、DuckDuckGo、Aol、Yandex、Webcrawler、WolframAlpha等。
第二章 商业模式和技术发展
2.1 搜索引擎产业链
在整个工业互联网产业中,搜索引擎是处于产业链的下游位置。当工业互联网将数据流数字化和信息识别后,再应用在搜索引擎中。但是在搜索引擎营销产业链中,搜索引擎属于产业链的中游。上游的广告商将广告投放在搜索引擎中,搜索引擎再将广告呈现给观众。因此搜索引擎会受到工业互联网发展、上游广告商广告投放和下游用户等三个因素的影响。
2.2 商业模式
搜索引擎的主流商业模式都是在搜索结果放置广告,通过用户的点击向广告商收取费用。国内的搜索引擎公司主要以竞价排序为其商业模式。根据广告商付费排列的结果。广告客户在选择和购买关键词时要进行竞价,根据竞价的多少决定在针对某个关键词进行搜索时的结果的排名先后顺序。按照互联网用户的搜索习惯,他们一般不会点击所有搜索结果,而通常点击前十个搜索结果。因此,通过竞价排名较前的企业将会有机会赢得更多直接客户的访问。
搜索引擎还可以以关键词广告为盈利模式。广告用户针对自己产品的特点,向搜索引擎服务商选择和购买相关的关键词。当搜索与这些关键词相关的内容时,广告用户的广告将会与搜索结果同时出现,从而将广告商的产品信息提供给互联网用户。随着搜索引擎的发展,众多的搜索引擎还组成了搜索引擎联盟,也就是多家网站使用同一个搜索引擎服务商的搜索页面。目前国内最有影响的搜索引擎联盟是由中搜联合5000多家网站组成的。
2.3 技术发展
现在搜索引擎进行的工作原理主要分为以下三个步骤:
搜索引擎蜘蛛访问Web,进行网页抓取;
对抓取来的网页进行预处理,然后再建立索引;
在搜索界面进行查询服务。
目前,常用的搜索引擎工具包含网络爬虫、索引建立、内容检索、链接分析等相关技术。
爬虫
批量型爬虫:目标和范围明确,目的实现立即停止;
增量型爬虫:为应对网页不断更新及时反应。
垂直型爬虫:针对某个特定领域通过主题过滤。
暗网抓取:针对常规方式难以爬取到的网页。
索引建立
(1)两遍文档遍历:通过扫描文档,将其包含的文档收集到临时数据集内,通过对关键字出现频次及其在海量文档中出现的全局信息进行统计,刻画该关键字的整体描述。在获取以上信息后,通过获取空间,即全局信息索引大小,将倒排索引内容储存起来并扫描遍历,生成关键字优先排列表信息;
(2)排序法:用内存存放中间结果及字典信息,随着新文档的不断增加,所占用的内存会越来越多,为了释放内存,将排好序的序列清出内存放入磁盘,可以实现以固定内存对任意文档集合创建索引;
(3)归并法:除了数据字典以外的字典信息都会被清空并写入磁盘,有效地避免后续索引被占用的情况。
内容检索
支撑搜索引擎对查询结果的排序,体现爬取网页和反馈结果的关联。
链接分析
随机游走:从某个网页以一定的概率跳转到其所包含的链接;
子集传播:依据规划的传播方式,分配给某子集特定的传播需求,依次将权重传递给其他链接网页。
搜索引擎作为工业互联网的下游产业,伴随着大数据、云计算等互联网技术的发展,搜索引擎也同样会不断发展。未来搜索引擎将会更加关注结果的准确性和相关性,面向更开放、高效、更智能的趋势发展,更加强调交互性和客户友好程度。
第三章 行业发展驱动因素分析
计算机技术发展
中国的计算机技术发展较快。搜索引擎与AI、大数据、云计算等技术的发展息息相关。因此随着中国计算机技术的不断发展,中国搜索引擎行业将会不断发展。
多产业的结合
行业内的头部企业的主营业务都不仅只有搜索引擎,还有其余业务。例如除了搜索引擎业务外,百度拥有爱奇艺、智能云等业务,微软拥有智能云和个人电脑计算机等业务。随着业务的拓展,这些公司会拥有更多的数据流,增强对搜索引擎相关性和精确性的发展。
第四章 行业竞争环境分析
4.1 SWOT分析
优势:行业壁垒高。目前国内处于寡头市场,百度、必应、IE、搜狗、有道、谷歌等企业掌握大多数的市场。进入行业需要很高的知名度,高投入,且技术需求高。
劣势:研发投入成本高。例如2020年百度研发投入高达195.1亿,同比增长6.3%,领先其他互联网头部公司,百度中国AI专利申请量第一,在深度学习、自然语言处理、语音、智能驾驶等呈现出明显优势。
机会:其他业务联合搜索引擎业务一同发展,扩展业务范围。
威胁:暂无。
中国搜索引擎行业与国际企业比较
目前国内的搜索引擎以百度为主。其他搜索引擎的市占率较低。我国搜索引擎用户规模达7.95亿人次,使用率为78.7%,从国内搜索引擎占有率数据来看,百度依然牢牢占据龙头地位,PC端市场占比81.26%,移动端市场占比80.62%。
国外市场以谷歌的Chorme浏览器为主。目前,Chrome浏览器市占率66.64%,遥遥领先;Microsoft Edge市占率10.07%,Safari市占率9.61%。
4.2 中国企业重要参与者
百度:是拥有强大互联网基础的领先AI公司。百度愿景是:成为最懂用户,并能帮助人们成长的全球顶级高科技公司。百度拥有数万名研发工程师,这是中国乃至全球都顶尖的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
网易:是中国领先的互联网技术公司。 在开发互联网应用、服务及其它技术方面,始终保持中国业界领先地位。本着对中国互联网发展强烈的使命感,缔造美好生活的愿景,网易利用最先进的互联网技术,加强人与人之间信息的交流和共享。
4.3 全球重要竞争者
苹果:苹果公司于1977年1月3日根据加利福尼亚州法律注册成立。公司设计,制造和销售智能手机,个人计算机,平板电脑,可穿戴设备和配件,并提供各种相关服务。
微软:微软公司成立于1975年4月4日。公司开发和支持软件,服务,设备和解决方案,这些软件,服务,设备和解决方案可为客户带来新价值,并帮助个人和企业充分发挥其潜力。公司提供一系列服务,包括基于云的解决方案,为客户提供软件,服务,平台和内容,并且公司提供解决方案支持和咨询服务。
谷歌:Alphabet Inc. 是谷歌(Google)及谷歌旗下各个子公司的控股公司,于2015年进行重组成立。谷歌于1998年9月4日在加利福尼亚成立,于2003年8月在特拉华州重新注册成立。Alphabet涉足各个领域,包括技术,生命科学,资本投资和研究。其子公司包括Google,Calico,GV,Google Capital,Google Fiber等等。谷歌公司致力于互联网搜索、云计算、广告技术等领域,开发并提供大量基于互联网的产品与服务。
第五章 未来展望
技术发展推动行业发展
中国的计算机技术发展较快。搜索引擎与AI、大数据、云计算等技术的发展息息相关。因此随着中国计算机技术的不断发展,中国搜索引擎行业将会不断发展。
多产业的结合
行业内的头部企业的主营业务都不仅只有搜索引擎,还有其余业务。例如除了搜索引擎业务外,百度拥有爱奇艺、智能云等业务,微软拥有智能云和个人电脑计算机等业务。随着业务的拓展,这些公司会拥有更多的数据流,增强对搜索引擎相关性和精确性的发展。