精校书屋

手机浏览器扫描二维码访问

第9部分(第1页)

户一些安心,使他们对视线以外谷歌发生的事情少一些担忧。如果谷歌愿意更多地开放,它就能够证明在公司的日常运行中并没有人为的干预:谷歌的模式建立在自动化的调节上,在谷歌的信息工厂里从事工作的是软件,而不是人。

独步天下的谷歌算法(1)

任何人都可以召唤谷歌主页并动员起谷歌搜索引擎的全副力量,而不必为登录提供任何个人信息。###别、种族、年龄、受教育程度、职业——一切都不必公开。搜索引擎只搜索它所接收的词语,以及连同搜索请求一道传过来的不起作用的网络地址。

谷歌之所以拥有回应匿名提交搜索请求方面的技术,源自其创始者们致力于尽一切可能从网络站点而非用户方提取信息。所谓算法就是为解决具体问题而设立的一套规则:它是用于构建复杂的计算机软件的基础材料。谷歌的PageRank算法就是用于对网页的链接进行分析,辨别某一个页面同其他页面何者名气更大。谷歌的搜索引擎不需要了解用户的任何情况,而只需猜测当搜索语词被键入时用户的心里在想什么。

若能在匿名搜索领域成为一种核心力量,将对谷歌有着极大的帮助,而且这种帮助的方式还是谷歌在创办之初未曾预料到的。随着在线世界以指数次幂的规模持续扩大,在线收集的个人信息飞速增加,用户们已经不安地看到一个又一个公司或蓄意或无意地释放了一些被用户当作个人###的信息。###每泄露一次,人们的提防心就加重一次;于是用户们希望得到承诺,使他们的个人信息受到切实保护。令谷歌感到幸运的是,它的搜索服务不需要了解用户的身份就可以开始工作。

谷歌的搜索方法借重数学模型,不需要个人信息,因而它提供的广告是由搜索内容决定,而不是由人工提交的,这样就能保证广告服务对象的身份不致泄露。谷歌的这种方式使它在与Facebook等社交网站的经济效益竞争中处于有利位置,因为后者向广告商提供的是接近具体用户目标的机会,而谷歌出售给广告商的只是接触被用户视为个人敏感信息的机会。

谷歌优于其社交网络竞争对手的地方在于毋需了解其用户的个人信息就可以完成网络搜索,不过,这个优点却被它在除搜索以外的其他许多服务项目上的扩张行为抵消了;在这些服务——如它的电子邮件服务Gmail——中,谷歌所获取的资料是极其私人###的。谷歌知道,用户们也许会担心它的雇员可以随意偷看谷歌用户的电子邮件。这个问题不仅谷歌有,微软、雅虎以及美国在线的雇员也可以在用户私人的电子邮件中乱翻,而且这几家公司的服务器所处理的电子邮件信息比谷歌要多得多。所以被担心陌生人擅自阅读他们个人信息的电子邮件的用户单独挑出来,这对谷歌的确有点儿不公平。就谷歌而言,它为了让公众放心而采取的措施无论如何也不能完全令人信服。谷歌说,只有一小部分职员被允许接触由Gmail保存的电子邮件,因此它们不会泄露。但是,令人不太放心的是,公司还规定了一些特殊类别的用户,他们的电子邮件是放在谷歌的雇员禁止进入的地方,“无论他是公众人物,还是某个具体公司雇员,还是谁的熟人”。这能禁止电子邮件被陌生人当作消遣物来阅读吗?为维护这一规定而制定的惩罚措施——解雇——足够严厉吗?能有效杜绝这种行为吗?规定公布后,有违规行为被查处吗?如果某个用户的电子邮件被偷,他能得到通知吗?

正如谷歌所断言的,这类担心是没有事实根据的,对某些公司安全缺口的担忧使人们对所有保存用户个人资料的公司都产生了不信任感。尽管2007年的一篇文章报道了Facebook的雇员(而非谷歌雇员)偷看了用户的资料(据推测可能是为了检查可能的候选人的日期),有的人篡改了电子邮件信息,还有的人更换了用户的文件夹的照片,但谷歌的私密###保护措施也受到了越来越多的怀疑。

独步天下的谷歌算法(2)

在谷歌创办时,佩奇和布林还不必有###方面的担忧。他们一心一意地钻研如何让评定网页的过程自动化。他们的方法无疑优于雅虎依靠人工编辑来维持一个用人手挑选的网站指南引擎的运行。谷歌取代雅虎进而赢得领袖群伦地位的故事的启发###就在于,谷歌在计算机的应用方面比那些大公司更加灵巧。

谷歌依靠搜索引擎起步,它只能从事检索和分析网页的单调工作。2000年,公司与当时比自己大得多的雅虎公司达成了一项交易——为雅虎的用户进行网页搜索。这对谷歌的财务而言算不上一宗大买卖,也无助于树立起自己的品牌。雅虎的用户甚至不知道谷歌才是提供搜索结果的“批发商”,而是以为这些结果都是雅虎找到的。但是这笔交易使谷歌得到了某种比销路和品牌意识更具战略价值的东西:它为谷歌提供了大量的搜索查询的第一手资料,这是谷歌改进搜索技术急需的原始材料,有了这项内在的能力,就可能将数据量的增长转变为搜索结果质量的提高。

随着收集的信息越来越多,佩奇和布林的技术也变得越来越“聪明”,自然,俩人迟早会开始思考如何着手处理无所不包的原始数据。如何使用这些没有相互联系的具体信息,在当时还没有被当作最迫切的问题。先收集,后分析。如果这些信息还没有被数字化,那么谷歌就不计成本将其数字化。谷歌最早的网络经验体现在它比任何公司都更具有搜集更多信息的智慧上,它以多种方式让搜集信息的规模受人喜爱,产生交叉检索、相互参照的更加密集的集合,贡献出世界上复杂程度最高的搜索结果。

谷歌比它的主要竞争对象雅虎和微软更早就认识到,一个将所有信息全部网罗殆尽的系统,依靠人工是根本无法完成的。正如人类的思维要依靠协调发展的神经系统内的连接一样,数字化的信息搜集也要依靠以软件带动的相互对接,而不必介入人工。软件的算法固然是由人制定的,但最终产品的复杂程度远远超过了人类凭借手工所能达到的水平。

在公司建立的过程中,佩奇和布林运用了许多不同的算法。但在哲学定义上,这些不同的法则却不属于物质范畴:谷歌的所有算法都可以说属于总的算法的组成部分,所谓“算法”就是软件公式的简化形式,谷歌的创立者们以为它们是解决任何现存问题的最好手段。他们对算法的力量坚信不移,因而采取了一种颇引人争议的推论:由算法所导致的结果无需以人工介入的方式进行编辑、调整甚至触摸。对于处理世界上的所有信息的系统进行调节的唯一途径是将一切过程都自动化。算法也可以用手动的方式加以调整和改进,但是修补过程只能由算法在进行搜索之前自行完成。一旦他们允许对算法进行复评,并在搜索完成之后用搜索结果来修补,这种人工介入就会使系统变慢,使它步履蹒跚。在谷歌,实现规模至高无上,而这必须依靠完全自动化的过程。

在谷歌成立之初,算法的力量在搜索业界并未得到广泛的赞赏。在雅虎-谷歌结盟时期,谷歌似乎不想对任何人摆出竞争姿态。在它的早年,即上世纪末和本世纪初,谷歌还没有找到明确的发展方向,也无法使人相信自己是一家能够将全世界的信息都组织起来的公司。倒是雅虎牢固地树立了作为值得信赖的信息来源的形象,似乎完全有可能将自己的任务完成好。作为门户网站,雅虎是许多网络用户在线访问的第一个地方,而且公司提供了一目了然的服务和信息。这使它成为用户必须访问的最可靠的网站。它提供的内容包括电子邮件、分类广告、游戏、新闻、体育、天气、股票行情以及管理员认为能吸引访客进来并使他们留下来的一切信息。

独步天下的谷歌算法(3)

如果它的用户感到有必要搜索网络,雅虎就能充当一个被公认为最权威的向导,因为它是由网站编辑亲手编纂的,他们仔仔细细地做着去芜存菁的工作,为网站整理清单,将内容分门别类层层分级。但是公司的管理层却不将他们稳定而高质量的网站目录系统视为值得珍视的战略财富。公司的观点与当时流行的看法完全相同,认为网站索引只不过是公共门户网站的一个次要组成部分,三分之二的雅虎访客都是为了其他目的或寻求其他服务而来。

在雅虎,网络搜索可以分为两个互不相干的步骤,当然,其中隐藏着相当的复杂###。第一步,当搜索词语提交后,雅虎就对由它自己的编辑们编制的网站名录中的主题词表进行查找,如果搜索词与它索引表中的任一词语相匹配,那么相关的目录项就会显示出来。如果没有相匹配的结果出来,那么搜索就会进入第二个阶段,雅虎将这个词语送到与之订有契约的外部搜索引擎上,由后者在它所搜集和整理的所有网站上的网页的拷贝页中进行查找。这第二步几乎被业界的每一个人都视为无趣的幕后服务,这种服务从任何可互换的提供者那里都可以得到,他们之间并无明显的差异。一个个看上去都十分相似,所以雅虎也定期更换为它提供幕后服务的公司。

2000年,雅虎决定将分作两步的搜索过程合并,并将此项业务交给新的一揽子服务提供商——谷歌。在当时还很弱小的谷歌看来,能以成立刚刚两年的资格就得到雅虎交付的如此重大的使命,无疑很有成就感。谷歌搜索的质量相当之高,它已经在强手如云的领域里脱颖而出。根据2000年对于用户体验的一项研究,在13个搜索网站中,谷歌名列第一。此外,谷歌之所以能得到雅虎的合同,不是因为它的搜索结果比此前的Inktomi公司好,而是因为当时的谷歌正愁无米下锅,所以它开给雅虎的提供同样服务的价格是最低的。在Inktomi丢掉了雅虎的合同后,它的一名负责人嗤之以鼻道:“我们不会为了赢得生意而不计代价。”

雅虎之所以未把谷歌作为潜在的竞争对手,原因就在于谷歌不同于Inktomi,它披着一件“零售商”的外衣——它自己的网站,它可以向顾客提供更好的搜索结果,从而为自己吸引越来越多的访问者。在谷歌与雅虎签订提供搜索结果的合同两年以后,谷歌在美国搜索业务市场的份额就达到了雅虎的水平。与此同时,谷歌在全球范围内也跃居前列,到2002年4月,谷歌就承担起全世界范围内47%的搜索量,而雅虎的比例是21%。尽管如此,直到又两年之后的2004年,雅虎才意识到,它与谷歌的合作是个巨大的错误。于是,雅虎立即在自己的网站用自己的搜索引擎换下了谷歌的引擎。雅虎试图使人相信,它仍然控制着一个功能,它终于懂得,这个功能对它继续保持成功者的位置至关重要。然而此时,谷歌作为搜索中心的地位已经得到了巩固。

雅虎甚至从未近距离地追上谷歌。根据一项研究,2007年5月,谷歌在美国在线搜索所占的份额已经超过了50%,雅虎占26%,而微软只占10%。谷歌的份额持续扩大,到2008年1月,谷歌占有了58%,而雅虎则掉至22%。新闻网站的CEO里奇·斯克伦塔说出了一个相当具有说服力的事实:谷歌所占有的搜索份额远远高于上述市场分析的结论,甚至早在2006年底就已经超过了70%。2007年初,斯克伦塔承认,他的数据表明,谷歌的市场份额实际上是78%~80%,但他用四舍五入的方法把这个比例降到比较保守的70%,“以使之更加可信”。 电子书 分享网站

独步天下的谷歌算法(4)

2008年,当微软洽购雅虎时,公司的雇员们都发表了意见,认为两家的工程师能合并为一支队伍,将更有利于与谷歌展开竞争。但是谷歌的算法之所以在它还是一家小公司的时候就能得到较好的搜索结果,关键在于谷歌工程师队伍的质量,而不在于它的人员数量。

无论是微软还是雅虎,两家公司对于谷歌算法的威力的认识都过于迟缓。在谷歌浮现的早年,雅虎就受到依赖人工编程这个注定要倒霉的决定的拖累。1998年,在40人的雅虎索引维护团队中负责的斯里尼瓦桑(Srinija Srinivasan)说,她和她的新编辑们总是赶不上网站的增长速度,尽管他们已经开始对“无限的资源”进行了自行处理。从这个较早的时候开始,他们就已经不再勉为其难了——而是决定简单地满足于将自己选出的东西描述为“已有的东西当中最好的”。当然,凭什么他们肯定自己能从急剧膨胀的数据池里鉴别出最好的东西,这是一个难以回答的问题。

而就在此时,谷歌已经享受到了依靠不断更新的技术所带来的好处。算法塞进的数据越多,结果就越好。公司并不隐瞒算法所处理的网页到底有多少——2004年,他所公布的最后数字是对80亿个页面做了索引,此后它就决定不再提供更新数字了。但即使在2000年,观察家们就已经极力称赞谷歌的搜索结果与其他的引擎相比具有显著的优势。丹尼·苏里文在《搜索引擎报告》中写道:

当我对一群人说起搜索引擎并提到谷歌时,听众中有些人便会有不正常的反应。他们微笑、点头,就跟你在发现了一个别人不知道的秘密通道时也会有的那种表情一样。每次我说起这些事,都会看到有越来越多的人像这样微笑、点头,为发现了谷歌而惊喜。

谷歌研发了一种更加复杂的算法,它可以根据一个给定的搜索词语来选择哪类广告在它的搜索结果上出现,从此,它与竞争对手的距离就更加拉大了。谷歌采用拍卖机制,让赞助商竞标,从而确定他们愿意为每一个点击支付的最高金额。这种方式是谷歌的任何竞争者都可以仿效的。但谷歌还有一个令人意想不到的手段,保持它网站上的广告带来的利润远远超过其他任何网站发布的广告,即采用算法对赞助商在历史上的表现进行评估,看看他的广告对点击率的吸引力空间有多大,出价最高的竞标者不一定就能得到最好的广告位置,还要分析他历年的统计数据,看他是否最有可能为谷歌带来最高的回报,既要考虑到预期的点击数,又要考虑平均每一次点击创造的价值。谷歌受命履行的搜索越多,关于广告效益的历史数据收集得也就越多,它的评估体系就越精确。多亏谷歌公司拥有了同行业无人能够复制的算法,谷歌引擎的每一次搜索才能带来其他任何人都难以企及的收益。

微软一直囿于软件设计方面没有人能出其右,所以未能及时注意到谷歌软件的威力。要让人们承认像谷歌这样的相对缺乏经验的公司能够研发出比微软的产品更加复杂的软件,似乎不太容易。2004年,有一篇博客提到了谷歌的搜索结果比微软的好得多,这引起了一阵不安。在谷歌搜索栏中键入“微软博客”,就可以直接链接到微软雇员的博客。但同样的搜索词放在微软自己的MSN服务器中,却会导向西雅图一家日报的一名记者的博客,因为它凑巧包含了频繁提到“微软”字样的段落,并且拒绝搜索引擎的算法。这件事令人非常窘迫,因为将谷歌的搜索结果优于微软的事实公开出来的是微软雇员罗伯特·斯科博(Robert Scoble)在微软博客上写的一篇博文。书包 网 。 想看书来

独步天下的谷歌算法(5)

微软的管理层并未制止斯科博的言论,但谷歌誓在Web搜索中获得更多份额的雄心却受到了鞭策。微软的研发人员叛逃到谷歌的现?

所罗门的刺青  老猫  网游之修罗传说  57 废妾惹桃花 妖娆小桃  忠狗修神记  与幸福擦肩  极限梦想之王者归来  嫡女心计 完结+番外  超神铠甲大师  [HP、暮光]坦言  帝国政界往事  给高富帅当保镖  剑邑天人  全能佣兵  霸气小厨娘:想吃就挠墙-霸气小厨娘:世子不吃素  逆旅千秋  粉黛未央  西藏的天堂时光  疯子、傻子、色情狂  时空理论  

热门小说推荐
极道天魔

极道天魔

妖魔横行,世人苦难。神兵魔刃,遮耀天下。手机上的一款游戏修改器,意外成了路胜脑海里的异能。也成了他在这个黑暗乱世唯一的依靠。...

世界第一宠:财迷萌宝,超难哄

世界第一宠:财迷萌宝,超难哄

世界第一宠财迷萌宝,超难哄由作者浮屠妖创作全本作品该小说情节跌宕起伏扣人心弦是一本难得的情节与文笔俱佳的好书919言情小说免费提供世界第一宠财迷萌宝,超难哄全文无弹窗的纯文字在线阅读。...

兵王传说

兵王传说

一场人质救援行动中,因为救援失败而一蹶不振的龙牙队员张正选择退役归隐,此后国家神秘的龙牙小组真正意义上失去了最尖锐的兵器。几年后的张正再次出现势必要将这世界搅动得天翻地覆。...

六零俏佳人

六零俏佳人

前世,盛夏怨恨家人的无情抛弃,为贺家人那群白眼狼付出所有,最后却落了个草席一裹,抛尸荒山的下场!重生回到悲剧尚未开始,盛夏誓今生不会再将真心错付!哪怕吃树皮啃草根,她也要留在家人身边,同甘共苦!改写命运!一家人同心协力,走上致富的康庄大道!携手冷面军官,共创幸福人生!...

宇宙级大反派

宇宙级大反派

王皓穿越了,得到了系统。hy?大反派系统?需要坑人做坏事遭人唾弃才能使用?这节操是要,还是不要?n年后,全宇宙人民每天起来的第一件事,就是对着王皓的画像吐口口水,然后骂句禽兽,这才有心情去上班。王皓一脸无辜这能怪我吗?我本纯洁少年,都是系统的错。系统一脸鄙视人贱不能怪系统。群号56449o593...

色间道

色间道

穷小子楚帅,先赚了一个极品级二奶,却原来是间谍精英,然后,一个大陆女警官凌小杰好有暗恋他,可是,穷小子还有一个比鸟齐飞的原配初恋,还有一个女朋友的死党小魔女蓝菲,还有几乎是后宫佳丽如云,不过,一个个美眉都有好神秘的身份,你中有我,我中有你...

每日热搜小说推荐