友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
热门书库 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

搜索引擎优化魔法书-第8章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!




    味了。打开 Google,试试看本地搜索。搜索“南京川菜”,一下子出来几百个结果, 

    好多都是没有听说过的餐馆。本地搜索还有地图,把查找范围缩小到家附近,这样 

    吃完饭回家就方便了。  



        小李是个旅游爱好者,每年五一长假都要和朋友们一起出游。可是随着黄金周 

    旅游越来越火爆,一般景点五一期间简直是人头碰人头,根本不能去。春节一过, 

    小李就开始琢磨今年的五一计划了,一定要着一个风景不错,又不是那么商业化的 

    地方。往边远地区找吧。搜索“贵州户外旅游”,找到当地一家不错的户外俱乐部 

    网站,上他们的论坛泡泡,再咨询咨询,很快,小李就确定了一条位于黔东南的背 

    包游线路。在制定具体计划的过程中,一些交通衔接的问题有点麻烦。小李又在百 

    度知道和新浪爱问提了一些问题,很快就得到了满意的回答。  



        老吴是个摄影爱好者,最近一直想买一个新的数码单反相机。那天咖啡馆取阅 

    的杂志上看到一款佳能新型号相机的广告,漂亮的外观和看上去不错的功能参数让 

    老吴有点心动了。老吴用记下了这款产品的型号,回家直接用百度搜索一下,再阅 

    读了几百篇关于这款相机的使用心得和测评文章后,老吴终于决定出手了。不过老 

    吴可没有直奔商店,而是通过比价搜索引擎找到了最便宜的网上商店购买,比商场 

    卖了便宜了将近 1000元。  



        小王今年高考,填报志愿的事情让父母犯了愁。小王平时成绩算是中等,而且 

    他一定要去北京读大学。虽然清华北大大家都很熟悉,却不是小王的成绩能达到的, 

    而其他学校大家就都不熟悉了。父母想知道北京其它高校的教学水平、学习风气以 

    及生活条件,说要专门去趟北京考察考察。小王劝住了父母,打开电脑,搜索“北 



                                                                         第2 页 


… Page 11…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



    京 大学”,一下子北京各大高校的网站出现在面前。小王和父母把这些网站的内容 

    仔仔细细的看了一遍,还分析了一些感兴趣的学校往年的考分情况,基本上心中有 

    数了。  



        小赵所在的公司原来提供某个配件的供应商出了一些问题,不能继续提供配件 

    了,老板急得团团转。小赵通过搜索引擎找到了十多家具有生产这种配件能力厂家, 

    很快就落实了新的供应商。  



    搜索引擎已经成为广大网民日常生活中不可缺少的重要部分。中国互联网信息中心 

 (CNNIC)2007 年第二十次调查报告显示:搜索引擎以74。8%的比率已经成为中国网民最常 

使用的网络服务之一。详细数据见下表:  



                   表 1…1…1  网民使用网络的功能及其所占比例  



                     互联网功能                   使用者占网民的比例  



                      浏览新闻                          77。3%  



                      获取信息                          76。3%  



                      搜索引擎                          74。8%  



                      即时通信                          69。8%  



                       网络音乐                         68。5%  



                       网络影视                         61。1% 



                      收发邮件                          55。4% 



                       网络游戏                         47。0% 



                       网络购物                         25。5% 



                       网络教育                         24。0% 



                       网上银行                         20。9% 



                        博客                          19。1% 



                       网络求职                         15。2% 



                       网上炒股                         14。1% 



                       网络销售                         4。3% 



                     网上旅行预订                         3。9% 



  



                                                                         第3 页 


… Page 12…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



二、搜索引擎的定义  



    给搜索引擎下一个定义是非常困难的。一千个人就有一千个搜索引擎:有人认为搜索引 

擎就是百度,有人认为搜索引擎就是Google,有人认为搜索引擎就是Yahoo 。  

    如果非要给个定义,就让我们来看看微软大百科全书(MSN Encarta)是怎么定义搜索 

引擎的吧:  



    Search Engine; software program that helps users find information stored on a personal 

    computer; or a network of computers; such as the Internet。 A user enters search terms; 

    typically by typing a keyword or phrase; and the search engine retrieves a list of World 

    Wide Web  (WWW )  sites; personal computer files; or documents; either by scanning 

    the content stored on the computers or computer networks being searched or by parsing 

     (analyzing)  an index of their stored data。  



        搜索引擎是帮助用户查找存储在个人电脑、计算机网络如互联网上的信息的软 

    件程序。用户输入搜索项目,通常是通过录入一个关键词或短语,搜索引擎通过扫 

    描被搜索的计算机和计算机网络,或者分解(分析)它们数据的索引,返回万维网 

    站点、个人电脑文件或文档的列表。  



    这个定义可能越看越模糊,那么以下章节的内容将会让你清晰地认识搜索引擎。  



                 第二节 搜索引擎的基本工作原理  



    现在互联网上存在的网页数量是数以百亿千亿计的,这些网站存储在不同的服务器上, 

分布在世界各地的数据中心和机房。  

    对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来 

看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。一方面原因是抓 

取技术存在瓶颈,无法遍历所有网页,有许多网页无法从其它网页的链接中找到;另一个原 

因是存储技术和处理技术的问题,如果按照每个页面平均大小 20K  计算(包含图片),100 

亿网页的容量是 100×2000G 字节,即使能够存储,下载也存在问题(按照一台机器每秒下 

载20K 计算,需要 340 台机器不停的下载一年时间,才能把所有网页下载完毕)。同时,由 

于数据量太大,在提供搜索时也会有效率方面的影响。因此,许多搜索引擎的网络蜘蛛只是 

抓取那些重要的网页,而评价重要性的主要依据是某个网页的链接深度。  

    有人会认为搜索引擎在接收到搜索请求时,会实时地从全球所有的服务器上查询信息, 

并把查询结果展示在用户面前,这其实是一种误解。如果搜索引擎是这样工作的,那么查询 

一条信息可能要等上好几年才能得到搜索结果,这还不包括期间网页发生的变化。  

    实际上,搜索引擎会预先去拜访大量的网站,并把这些网页的部分信息预先存储在自己 

的服务器上,这样,当用户搜索的时候,其实是在搜索引擎自己的服务器中进行查询,就像 

我们在自己的电脑中查询文件一样。  

    搜索引擎是非常复杂的技术,但是其基本原理并不复杂,其基本技术包括抓取、索引、 

排序。  



                                                                        第4 页 


… Page 13…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



                                                                             



                          图1…2…1   搜索引擎工作原理  



一、抓取  



    搜索引擎首先会派出一种被称作“蜘蛛”或者是“机器人”的软件,根据一定规则扫描 

存在于互联网上的网站,并沿着网页上的链接从一个网页到另一个网页,从一个网站到另一 

个网站。为保证采集的资料最新,它还会回访已抓取过的网页。  



二、索引  



    由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在 

URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页 

的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字 

中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。  


返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!