xiaoma 2008-6-3 21:43
Google自订搜寻引擎 - 打造个人资讯检索系统
「[b]Google自订搜寻引擎[/b]([b]Google Co-op Custom Search Engine[/b],简称[b]Google CSE[/b])」有两个主要的功能。第一大功能就是[b]让网站、部落格打造自己的站内搜索[/b]:撇开「Google自订搜寻引擎」强大的功能性不说,即使就是[u]最简单的添加单一网站然后进行搜索[/u],[u][b]Google CSE也比最近推出的「Yahoo!奇摩站长工具」更适合国内部落格平台的使用者[/b][/u];因为[u]有点搞笑的是[/u],Yahoo站长工具裡的 「搜寻工具」并无法很準确的使用在国内BSP平台的部落格身上,它并不支援设定第二层的网址名称当作搜寻条件,但是偏偏像无名小站、Pixnet、天空、Xuite和[u]奇摩自己的部落格[/u]全部都是[u]把部落格名称放在第二层以后的网址[/u],例如:「[url]www.wretch.cc/blog/XXX[/url]」这是无名小站的部落格网址,当你设定这样的条件到Yahoo站长搜寻工具中时,你会发现到时候真正搜索的是整个无名小站([url]www.wretch.cc[/url])。而Google的自订搜寻引擎则不会有这种问题出现。
但是我今天要推荐的是Google CSE另外一种非常实用的使用方式(或者说[u]这才是它真正设计的目的[/u]):就是[b]利用「联合搜索」和「条件过滤」,来快速打造出你的个人资讯检索系统[/b];这个检索系统不需要你一条一条的把资料拷贝、剪贴进去,而是直接透过「搜寻」来取用整个网路,只要设定好条件,轻轻鬆鬆就可以[b]拥有各式各样不同使用需求的资料库[/b],而且设定过程中可以[b]完全不需要懂任何程式码或网页语法[/b],任何人都可以完成自己的自订搜寻引擎系统。
[list][*][b]Google Custom Search Engine:[/b][url=http://www.google.com/coop/cse/][b][color=#184675]http://www.google.com/coop/cse/[/color][/b][/url][*][b]相关介绍:[/b][url=http://playpcesor.blogspot.com/2007/05/google-co-op.html][b][color=#184675]利用 Google Co-op 製作电脑资讯部落格搜索引擎[/color][/b][/url][*][b]中文电脑资讯部落格搜索:[/b][url=http://tinyurl.com/5uyo26][b][color=#184675]http://tinyurl.com/5uyo26[/color][/b][/url][/list]
其实我们透过搜索引擎[b]找资料常常是有「针对性」、「范围性」的[/b],这和「漫无目的」搜索是两种不同的需求,与其每次都在「[url=http://playpcesor.blogspot.com/2007/03/search-engine.html][color=#184675]一般性的搜寻引擎[/color][/url]」裡面大海捞针,不如自己设定一些条件来做出一个「专门」的个人化[url=http://playpcesor.blogspot.com/2007/03/google-yahoo.html][color=#184675]替代性搜寻引擎[/color][/url],打造自己的检索系统,让不同的需求找到最好的解决出口。
基础设定:
[b]1.[/b]
使用「Google自订搜寻引擎」并不难,只是有一些小细节可以注意一下,会让你的设计更有效果。首先来到[url=http://www.google.com/coop/cse/][color=#184675]CSE首页[/color][/url],当然你要先登入自己的Google帐户,然后点选﹝建立自订搜寻引擎﹞。
[url=http://www.flickr.com/photos/esorhjy/2535599162/][img=500,298]http://farm4.static.flickr.com/3033/2535599162_cbc61ce399.jpg[/img][/url]
[b]2.[/b]
接下来你会需要输入这个自订搜寻引擎的「名称」和「说明」,这边依照你的设计目的填写即可,这裡的内容和真正的搜索结果不相关,只是给你和访客了解而已。然后接着的「搜寻引擎关键字」就很重要了,我后面会独立解说,这边可以先留白。然后[b]「搜寻引擎语言」则选择你检索的首要语言种类[/b],例如选择【繁体中文】的话,繁中网站的排序会适度的调前。
[url=http://www.flickr.com/photos/esorhjy/2534786893/][img=500,257]http://farm3.static.flickr.com/2014/2534786893_da201b9989.jpg[/img][/url]
[b]3.[/b]
接下来「你想要搜寻什麼?」,你可以让搜寻引擎检索「[b]仅我选取的网站[/b]」;或者你希望让范围扩大则可以选择「[b]整个网路,但将重点放我选取的网站[/b]」,这样你等等加入的网站列表的结果会被排前,但是也可以搜索到整个网路上的内容。
而[b]「选取一些网站」就是重头戏了,你可以在这边加入你想检索的网站网址[/b],设计一个专门查找这些网站的搜索引擎。加入网址的方法很简单,就是[b]「把网址输入」,用「Enter换行」[/b]来区分不同网站即可,如果有疑惑可以按旁边的「格式化URL的秘诀」查看,它会教你如何运用「*」星号来达到更有弹性的设计。
[url=http://www.flickr.com/photos/esorhjy/2534786951/][img=500,239]http://farm3.static.flickr.com/2333/2534786951_28c55c4d59.jpg[/img][/url]
因为[url=http://skyvee.net/2008/05/playpcesor.html][color=#184675]Skyvee说[/color][/url]我写文章很详细,深怕漏了哪个步骤,所以我还是再囉嗦一下好了。例如像电脑玩物的网址「[url]http://playpcesor.blogspot.com/[/url]」,你就可以直接输入「playpcesor.blogspot.com」;如果是像简睿兄的「[url=http://blog.xuite.net/emisjerry/tech][color=#184675]http://blog.xuite.net/emisjerry/tech[/color][/url]」,就输入「blog.xuite.net/emisjerry/tech」;这样都可以直接搜寻到这两个网站的[b]整个站内文章[/b]。
[b]4.[/b]
然后就只剩最后一步了,一般人设计的搜寻引擎都是选择「标準版」,而因为我们应该都不是非营利组织、大学或政府机关,所以不要勾选「取消广告」(虽然取消了还是可以用,但是不知道会不会有惩罚?)。然后一定要勾选「我已经阅读并同意此服务条款」,最后按下﹝下一页﹞。
[url=http://www.flickr.com/photos/esorhjy/2534787003/][img=500,238]http://farm4.static.flickr.com/3189/2534787003_a3dce2b5fd.jpg[/img][/url]
[b]5.[/b]
大功告成!你可以用上方的搜索引擎试试看自己设计的结果,最后按下﹝完成﹞即可。
[url=http://www.flickr.com/photos/esorhjy/2534787161/][img=346,343]http://farm3.static.flickr.com/2367/2534787161_6e36d3b2a0_o.png[/img][/url]
你可以[b]在自己的控制后台看到所有设计好的「Google 自订搜寻引擎」[/b],按下「首页」可以切换到该搜寻引擎的专属页面;按下「控制台」可以对该搜寻引擎作进一步设计;按下「统计资料」则可以查看这个搜寻引擎被使用的情况;你也可以用「删除」来移除已经设定好的检索系统。
[url=http://www.flickr.com/photos/esorhjy/2535599526/][img=436,217]http://farm3.static.flickr.com/2414/2535599526_864cea812a_o.png[/img][/url]
进阶控制台:
[b]1.搜寻引擎关键字[/b]
进入「控制台」,刚刚我们没有设定「搜寻引擎关键字」,这边其实是很重要的一个功能,你可以在这裡[b]加入「特定关键字」来让「符合该关键字」的检索资料在所有查询中都「动态的排前」,[/b]注意喔!这边是会依据Google的运算来[b]「适度的(非绝对的)」[/b]让排名结果提前。例如你这个搜寻引擎是设计来找「化妆品」,那麼你就可以把「化妆品」作为搜寻引擎关键字,这样[u]当你检索「红色」时,同时包含「化妆品」的资料会被自动往前排[/u],让你检索时更方便、更有针对性。
[url=http://www.flickr.com/photos/esorhjy/2534787263/][img=500,255]http://farm3.static.flickr.com/2109/2534787263_e8e5f18853.jpg[/img][/url]
[b]
[/b]
[b]有无设定关键字的结果比较:[/b]例如下面这张图是我原本「没有设定任何关键字」的「[url=http://www.google.com/coop/cse?cx=018174840590779406153%3Alajyuvaxsic][color=#184675]中文电脑资讯部落格搜索[/color][/url]」查询「Google」一词的结果。
[url=http://www.flickr.com/photos/esorhjy/2534787307/][img=500,370]http://farm4.static.flickr.com/3106/2534787307_0fb2bdac2d.jpg[/img][/url]
假设我加入了「电脑玩物」这个关键字,那搜寻的结果就会变成下图。在关键字的设计上,如果你输入多个关键字,可以用「空格」来隔开,不过第一个关键字的比重会最高;你也可以用「" "」来包住某个特定的词组,表示一定要完整符合这个词组的关键字才要排前。(P.S. 我这边只是实验,中文电脑资讯部落格搜索这个引擎,预设我是没有加入任何关键字的)
[url=http://www.flickr.com/photos/esorhjy/2534787369/][img=500,414]http://farm4.static.flickr.com/3038/2534787369_eb2b47dc95.jpg[/img][/url]
[b]
[/b]
[b]2.协同与公开自订搜寻引擎[/b]
同样在「控制台」的第一页,在下方的「偏好设定」中,[b]「谁可以协同作业:」[/b]让你设定要让哪些人可以和你「一起编修」这个搜寻引擎;而[b]「搜寻引擎曝光率:」[/b]这可以让你设定是否要让自订搜寻引擎出现在公开列表中,要注意的是即使设定为「Unlisted」,只要对方知道你的搜寻引擎网址,一样可以看到并使用。不管做任何设定,最后都要记的按下﹝储存变更﹞。
[url=http://www.flickr.com/photos/esorhjy/2535599766/][img=500,207]http://farm4.static.flickr.com/3176/2535599766_687850e2c1.jpg[/img][/url]
加入新检索网站的各种方法
[b]1.在控制台新增、移除检索网站[/b]
你可以随时加入新的网站到检索系统中。在「控制台」上方工具列中切换到「网站」,点选﹝新增网站﹞,同样的输入网址,[b]勾选要加入的内容属性[/b]:
[list][*][b]「加入位址包含此 URL 的所有网页」:[/b]就是[u]搜寻整个网站[/u]的意思。 [*][b]「Include just this specific page」:[/b]就是[u]只搜寻符合这个网址的特定网页(单一网页[/u]),但是这边你也可以运用「*」。例如勾选这一项并在网址栏填写「blog.pixnet.net/Nelson/*」;那麼结果和勾选「加入位址包含此 URL 的所有网页」,并在网址栏填写「blog.pixnet.net/Nelson」道理是一样的。 [*][b]「动态擷取此网页上的连结并将它们新增到我的搜寻引擎」:[/b]这是一个很棒的功能,我们下面特别独立说明。 [*][b]「标籤」:[/b]这个和另外一个[u]「限制条件」的功能[/u]相关,比较复杂一点,所以我们也留待后面说明。 [/list]
[url=http://www.flickr.com/photos/esorhjy/2535599850/][img=500,337]http://farm4.static.flickr.com/3114/2535599850_211efb0ec6.jpg[/img][/url]
最后[b]记得按下﹝储存﹞[/b],就可以在自订搜寻中加入一个新的检索网站了。
[b]
[/b]
[b]2.动态擷取网页裡的连结[/b]
[b]要一个一个把网站加入检索系统是不是有点麻烦?[/b]而前面提到的「动态擷取此网页上的连结并将它们新增到我的搜寻引擎」就是一个省时省力的方法,很多部落格在侧边栏都有友站的连结,如此一来你只要勾选「动态擷取」,就能够把这个网页裡出现的网页连结或网站连结全部都自动加入你的搜寻引擎中,也就是说[b]加入一个网站后可以同时获得十几个网站[/b]进入你的搜寻系统。
[url=http://www.flickr.com/photos/esorhjy/2535599938/][img=500,347]http://farm4.static.flickr.com/3041/2535599938_3599501c2c.jpg[/img][/url]
[url=http://www.flickr.com/photos/esorhjy/2535599972/][img=353,171]http://farm4.static.flickr.com/3203/2535599972_6d7806669d_o.png[/img][/url]
不过[b]我还搞不太懂的是「包含此网页连结的所有部分网站」和「包含此网页连结的所有网站」有什麼区别?[/b]欢迎知道的朋友解惑。
[b]
[/b]
[b]3.设定排除的网站[/b]
或许你的检索系统裡不想看到特定网站或特定网址,那麼你可以在「控制台」→「网站」页面下方的「排除的网站」裡面设定即可。
[url=http://www.flickr.com/photos/esorhjy/2534787673/][img=385,164]http://farm3.static.flickr.com/2269/2534787673_a2e5d5cd64_o.png[/img][/url]
[b]
[/b]
[b]4.用Bookmarklet加入新网站[/b]
我在蒐集「[url=http://www.google.com/coop/cse?cx=018174840590779406153%3Alajyuvaxsic][color=#184675]中文电脑资讯部落格搜索[/color][/url]」的过程中,因为不可能第一次就把快200个部落格的资料都加进去,一定是边逛网路,边看到不错的就把它们加入检索系统中。而这时候就可以利用「[url=http://playpcesor.blogspot.com/2007/10/bookmarklets.html][color=#184675]Bookmarklet[/color][/url]」的方法:[b]来到「[/b][url=http://www.google.com/coop/cse/marker][b][color=#184675]Google标记[/color][/b][/url][b]」网页[/b],把裡面的[b]「Google Maker」用滑鼠按住并拖曳到你的书籤工具列即可[/b]。
[url=http://www.flickr.com/photos/esorhjy/2534787739/][img=500,463]http://farm3.static.flickr.com/2102/2534787739_db8bc5dcf5.jpg[/img][/url]
以后看到什麼网站,按下﹝Google Maker﹞就能够快速的[b]解析该网站的主网址并加入你的「自订搜寻引擎」裡面[/b]了。但是这个方式[b]有个小问题[/b],就是它只有「此网站上的所有内容」和「仅此页」两个项目,遇到那种有好几层网址的网站时,例如国内部落格平台的部落格,这个方法会无法正确的加入特定网站,这时候你必须回到控制台用我之前说的方法来添加。
[url=http://www.flickr.com/photos/esorhjy/2535600162/][img=500,332]http://farm3.static.flickr.com/2197/2535600162_f4baf96846.jpg[/img][/url]
设定限制条件:
「限制条件」的功能是什麼呢?例如你设计的检索系统裡可能会有不同的分类,在「[url=http://www.google.com/coop/cse?cx=018174840590779406153%3Alajyuvaxsic][color=#184675]中文电脑资讯部落格搜索[/color][/url]」中还会有专门专精於「免费软体、绿色软体」或「Web2.0」等[b]不同领域的部落格[/b],这时候我就可以设计一个分类,让[b]想要专门搜索某个分类时可以快速的切换[/b]。
[b]1.呈现的结果[/b]
[b]有无选取限制条件的比较:[/b]我们先看看实际使用出来的结果,例如我搜寻一个内涵很广的「Desktop」关键字,原本的搜寻结果如下图。
[url=http://www.flickr.com/photos/esorhjy/2534787879/][img=500,364]http://farm4.static.flickr.com/3185/2534787879_52913822c7.jpg[/img][/url]
这时候我[b]点选「免费绿色」这个限制条件[/b],於是[b]被我标记[/b]为「免费绿色」的网站,他们的搜寻结果就会被提前,而呈现出入下图的样貌,这样是不是让搜索更具有弹性了呢?
[url=http://www.flickr.com/photos/esorhjy/2535600384/][img=500,391]http://farm3.static.flickr.com/2173/2535600384_198c8e1143.jpg[/img][/url]
[b]2.设定过程[/b]
假设我新增一个称为「免费绿色」的限制条件,我可以选择「如何搜寻已加上标籤的网站:」,这是指当我在搜索引擎中点选该限制条件时,[b]要如何重新排序搜索结果的方式:「单纯的排前」或「只搜索有加上标籤的网站」。[/b]另外也可以设定「要新增到搜寻查询的字词:」,这边是指当点选限制条件时[b]要加入一起检索的关键字[/b],你可以看看「[url=http://www.google.com/help/refinesearch.html][color=#184675]进阶搜寻运算子[/color][/url]」裡面的说明来了解添加新关键字的方法,不过不添加关键字也可以。
[url=http://www.flickr.com/photos/esorhjy/2535600238/][img=500,221]http://farm4.static.flickr.com/3215/2535600238_6e3942f0e2.jpg[/img][/url]
[b]3.帮网站加上标籤[/b]
当前面已经设定好「限制条件」后,新增网站时就会[b]出现「标籤」的项目可以勾选[/b],你可以依据该网站的类型来设定标籤分类,[b]将某个网站归属到某个限制条件(分类)中[/b]。这样一来以后要「专精」搜索时就会更为方便了。
[url=http://www.flickr.com/photos/esorhjy/2535600434/][img=500,293]http://farm3.static.flickr.com/2210/2535600434_80f9f244b0.jpg[/img][/url]
在网站上添加自订搜寻引擎:
1.
设计好的搜索引擎当然可以添加到自己的部落格中和大家一起共享。先在「控制台」的「外观风格」裡面做一些调整,然后[b]到「程式码」裡面获得安装的外掛程式码[/b]即可。
[url=http://www.flickr.com/photos/esorhjy/2535600516/][img=500,388]http://farm3.static.flickr.com/2142/2535600516_936ca3e710.jpg[/img][/url]
2.
另外一种方法是[b]来到你的自订搜寻引擎「首页」[/b],然后透过右下角的「新增到~」来获得外掛程式码,也可以加入[url=http://playpcesor.blogspot.com/2007/07/igoogle.html][b][color=#184675]iGoogle[/color][/b][/url][b]、[/b][url=http://playpcesor.blogspot.com/2008/05/funp-netvibes.html][b][color=#184675]Netvibes[/color][/b][/url]个人首页喔!
[url=http://www.flickr.com/photos/esorhjy/2534786795/][img=500,307]http://farm4.static.flickr.com/3063/2534786795_26dfa97a91.jpg[/img][/url]
「大」结:
我深深觉得[b]「Google自订搜寻引擎」对於有「找资料」需求的人来说,是一定要会用的网路服务之一[/b]。Google Custom Search Engine就好像是一种[b]「另类的书籤」、「另类的剪贴资料库」[/b],它让你去「蒐集」各种网路上的网站,然后快速打造出一个「特别适合你自己」的搜寻引擎,而它的操作方式就是这麼简单又强大。
最后,[b]如果您也早就利用Google CSE来打造有用的搜索系统[/b]的话,[b]非常欢迎在这篇文章的留言裡推荐出来让大家知道[/b],也让有和您有相同需求的读者,或许可以藉此找到更好的搜索管道。