为什么百度已不能提供优质信息以及我们该怎么办? - Go语言中文社区

为什么百度已不能提供优质信息以及我们该怎么办?


哈哈,没想到大年初二也会更新吧。

早晨起来胳膊有点酸,我一直在找原因。想起来了,大年三十晚上边看春晚边摇手机抢百度红包摇的!对了,赶紧去百度APP上把抢到的几块钱提现,也不枉我摇了一晚上……

我打开百度APP,点提现,此时我才知道,需要绑定银行卡、下载各种乱七八糟的APP,才能提现这7.85元!


图片发自简书App


图片发自简书App

不妨就把这篇写百度的文章写完吧……百度正在成为一个被嫌弃、被远离的信息搜索工具,他成为互联网游戏公司、互联网金融公司、互联网外卖公司、互联网广告公司……但不再是互联网搜索引擎。

方可成在“新闻实验室”2019年1月22日发布的《搜索引擎百度已死》刷爆了朋友圈,并上了微博热搜。方可成揭开了百度的面具,作为搜索引擎的百度,检索结果返回的前几页,要么是百度推广的广告,要么是百度自家的产品链接——百度百科、百度文库、百度百家号……有价值的信息在哪里?要么是隐藏在三五页之后,要么根本就没有。

百度的公关部门很快回应了《搜索引擎百度已死》,满篇否认的文字却坐实了百度的搜索功能真的将死,以搜索起家的百度,完全无法回答用户的疑问,为什么百度已不能提供优质信息

百度声称“目前百度搜索结果中,百家号内容全站占比小于10%。”百度当然知道,搜索引擎的性能评价指标中,搜索结果数并不是最重要的那一个,百度和谷歌之所以在一众搜索引擎中脱颖而出,靠的也不只是搜索结果数,而核心专利是搜索结果的排序。

我们在USPTO(美国专利与商标局)提供的检索系统USPTO Patent Full-Text and Image Database (PatFT)  中很容易检索到李彦宏同学在1997年提交、1999年获得授权专利Hypertext document retrieval system and method5,920,859)。这份专利说明书比较详细的介绍了一种互联网搜索的新技术。因为早期搜索引擎技术的检索结果排序过度依赖检索词出现的频率,而导致网民的信息需求满足度不高,“快速得到有用的信息”这就是网民的痛点需求,学习计算机软件的情报学毕业生李彦宏利用自己的编程能力发明了一种新的搜索技术,将指向页面的超链接加入了搜索结果排序的算法中。这就是百度早期搜索技术的核心之一。

据说李彦宏同学当年发明这个技术时,受到了在北大时所学过的分类、编目、索引知识的启发。我一直认为这是图书馆学、情报学专业人士的一厢情愿。(虽然我在课堂上也会拿百度举例子,让学生们了解深入了解一个图书馆的信息组织方法的必要性,顺便会有意无意地说一句我和他毕业于同一个系。/捂脸)倒是Google的Pagerank技术,能比较清晰地看出受了尤金•加菲尔德博士所发明的引文索引的启发,制定了自己的网页排序算法。


李彦宏有关搜索技术最早的一份专利

快速得到有用的信息,网民的需求没有变。

百度不能提供优质信息了,是因为互联网生态变了。

套用图书馆学最重要的理论之一——阮冈纳赞“图书馆学五定律”中的一句话——互联网是一个生长着的有机体。互联网一直在变。最初互联网是小河汇成了海洋,随后海洋上出现了一个又一个的岛屿,现在岛屿上竖起了高墙,每一个APP就是一个岛屿,而APP之间大都是孤立的,造成了一个个信息孤岛。(这里说的是用户界面是孤立的,而在底层端我们的各种信息被卖来卖去。)除了信息孤岛之外,还有一些网站限制了搜索引擎的搜索,比如淘宝。问渠哪得清如许,为有源头活水来,百度被断了源头,于是就有了方可成所写的情况,百度为了自救,就不仅要提供搜索,还要变成内容生产平台,搜索将百度自生产的内容放在了前面。百度走进了一个自生自灭的死胡同。

淘宝限制了搜索引擎抓取

百度不能提供优质信息了,是因为百度只关心你是否看到了广告,而不在乎是否是优质信息。

魏则西想在百度上搜索治病信息,结果他看到了莆田系医院的广告;作家六六想搜索美国大使馆驻上海领事馆的官方网站,结果她看到的都是代办签证公司的网站……每一次都引起了轩然大波,每一次都很快风平浪静。

根据百度2018年第三季度财报(Baidu Announces Third Quarter 2018 Results )披露,百度2018年第三季度总收入达到282亿元人民币(41.1亿美元),同比增长27%。网络营销收入为225亿元人民币(32.7亿美元),同比增长18%。百度拥有约52.2万活跃的在线营销客户。据说,百度在2018财年的总收入超过了1000亿人民币。网络营销收入超过70%。

这样,我们就明白了,百度优先关心的是广告是否抵达了你我的手机屏幕。但我万万没想到,百度根本不关心我们能搜索的信息质量。

算了,反正百度不会听,也不会改。本质上百度就是一家不能提供优质信息的互联网搜索公司,哎。

我们是否还能“快速得到优质信息”呢?试试下面这几条。

多掌握几个搜索引擎。除了百度,我还用Bing.com和Qwant.com、yandex.com。关于Qwant,可参阅《冬宝,给你介绍一个新朋友——Qwant》。

多掌握几个搜索引擎命令。在百度中,试试site命令,指定站内搜索。比如我只想看看知乎上对《流浪地球》的讨论;就用【流浪地球 site:zhihu.com】这个命令。同样的命令还包括filetype、“”等,但filetype已经沦陷了,不推荐。

site是常用的命令

主动靠近优质信息,远离垃圾信息。现在的搜索引擎是有记忆力的,你越对八卦感兴趣,它就会越推荐八卦给你。而我们的屏幕时间是一定量的,看了八卦,你就没机会看优质信息了。

多掌握几个图书馆的网址。互联网来了之后,图书馆一度被认为是过时的装置。但作为图书馆员,我负责任地说一下,图书馆(包括图书馆馆舍和图书馆系统中)里优质信息的比例更高一些。中国国家图书馆的文津搜索、北京大学图书馆的未名搜索、清华大学图书馆的水木搜索都是可以常常去挖掘一下的。

嗯,就酱。

版权声明:本文来源简书,感谢博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://www.jianshu.com/p/fbf6802722ba
站方申明:本站部分内容来自社区用户分享,若涉及侵权,请联系站方删除。
  • 发表于 2020-01-12 14:21:55
  • 阅读 ( 1264 )
  • 分类:职场

0 条评论

请先 登录 后评论

官方社群

GO教程

猜你喜欢