百度搜索已死后传,暗网来了
专栏:科技资讯
发布日期:2019-01-24
阅读量:44113
今天,1月23日,文章《搜索引擎百度已死》火了,各大媒体转载,百度公关亲自回应。说来也巧,昨天晚上我在准备一个材料时也发现同样问题,百度搜索已死。当时没有时间写,只好蹭个热点,今天补上。 昨晚,我想查下2018年上交所技术用户大会是哪天举行的。在百度反复变化关键词,硬是找不到答案。下图是浏览器的历史记录,有图有真相。 先是在百度搜索“上交所技术用户大会”,结果是这样的: 向后翻了两页,结果都是关键词"上交所技术"的检索页面。按照搜索引擎原理:1)对搜索关键词进行分词,"上交所技术行业用户大会"会切分成:上交所技术、行业、用户大会。2)搜索引擎向后台索引库依次检索关键词。索引库是对爬虫抓取回来的所有网页按网页所有的关键词进行了索引。3)根据后台返回的结果进行排序,返回给用户。 百度的问题或者说利润就在排序上,如果谁花钱买了该关键词,那么谁的网页就可以排在前面,这就是竞价排名,按钱给的多少来排序,这是百度赖以生存的根基,也是凤巢系统,一直被诟病。 文章《搜索引擎百度已死》反应的问题是,百度将百度全家桶的结果排在了前面,干拢了信息获取。 从搜索“上交所技术行业用户大会”结果来看,搜索返回的页面都指向"上交所技术",没有"用户大会"相关的网页。 这说明它的索引库没有包含同时含有"上交所技术"和"用户大会"的网页。 然后我反复变换关键词,加上2018、阿里云、券商中国等。结果还是没有。这问题就大了,当时行业媒体曾经报道过。但是百度搜索不到,说明百度的爬虫在互联网上没有抓取该文章,或者媒体发布的文章不在互联网上。 这就是百度将面临的暗网。暗网本来指那些存储在网络数据库里,但不能通过超链接访问,不属于那些可以被标准搜索引擎索引的表面网络。 虽然有些网站不在暗网的定义范围,但它屏蔽百度,像购物网站如淘宝、京东、视频网站等等。现在随着公众号、头条号等自媒体的涌现,百度爬虫同样无法抓取这些自媒体的内容。对百度来说,就是暗网。 在百度上搜索不到,我只好打开微信-发现-搜一搜,果然,第一条就是我要的结果。 百度危已! 也许是认识到该问题,百度开始扶持百家号,吸引自媒体入驻,通过搜索引擎向自媒体引流。自媒体自带百度广告,所以对百度而言是有利的。但对于用户体,跟竞价排名是一样的,令人讨厌。 当前,各大新闻app都在发展自媒体,希望优质内容留在自己的地盘,不让搜索引擎抓取。搜索引擎一旦没有内容,就没有价值。 众里寻他千百度,蓦然回首,那人却在灯火阑珊处。 灯火阑珊处就是暗网呀! 说点什么
发表
最新评论
|
点击开启品牌新篇章