自然搜寻排名第一名的都是维基百科的网页,为什么呢?

另外如果你仔细观察上面的例子,你会发现当搜索引擎给你答案的时候,通常位居答案之后,自然搜寻排名第一名的都是维基百科的网页,为什么呢?因为搜索引擎之所以可以得到答案,都是维基百科的网页内容做了最大的贡献。

所以你的网站如果具有语意网络的特性,而且能够提供搜索引擎进行语意搜寻,搜索引擎就会认为这个网站应该排到前面。

因此Google的蜂鸟算法就是告诉大家,已经启动了语意网络 与语意搜寻,未来如果希望可以具有优秀的自然搜寻排名,就必须赶紧加入语意网络的行列。

搜索引擎能够回答问题,必须具备三个能力

我们来看看上面的搜寻例子 , 可以知道 Wolfram Alpha 不懂中文问题 , 而百度不喜欢英文的问题 , 而 Google 则是中英文问题 都不是问题 ,因为他们的数据库整理了不同的语意网络的数据 。

这些搜索引擎能够回答问题 , 必须具备三个能力 , 第一个是要 了解使用者给的问题 , 第二个必须抓取足够的数据 , 第三个则 是把抓回来的数据进行解析并足以提供语意搜寻 。 这三个条件缺一不可,如果他不了解使用者的问题具有再多的数据都没有用处;如果光有海量的数据 , 但是都兜不出答案,也只是一般的查询;如果有能力可以解析数据 , 但是没有抓到足够的数据,也是巧妇难为无米之炊。

现在搜索引擎碰到的问题就是在第一个与第三个能力还不足够 , 也就是数据虽然已经很多了,但是搜索引擎尚无法从使用 者的关键词完全了解问题 , 再来就是因为抓回来的资料非常凌乱 , 只有部分数据可以支持语意搜寻的结果 。

例如图 7-7′ 以 「 is obama dead乃查询 Wolfram Alpha , 他给的答案是 「 No 」。 图 7-8′ 以 r is bruce lee dead7 」查询 Wolfram Alpha, 他给的答案是 「 Yes 」 。 但是以相同问题去问 Google 、 Bing 跟百度 , 都不能得到答案。

语意搜寻则是要了解使用者到底想要什么

语意搜寻则是要了解使用者到底想要什么,利用各种方式来提高搜寻的准确性。当然语意网只是达成语意搜寻的其中 一个方式,因为不可能先把所有文档都加上meta data’还是会有许多数据是非结构化而且非常凌乱的。只是建构语意网可能是达成 语意搜寻比较省力的方式,并且语意网 除了达成语意搜寻外,还有其他目的,就是让计算机跟人脑 样能够了解数据,让计算机自动去处理 些事情。

所以企业网站就是要尽量做到语意网的要求,就可以让搜索引擎比较容易进行语意搜寻。而让搜索引擎可以进行语意搜寻, 企业网站就可以享受比较优秀的自然搜寻排名。

Google 公司在今年2013年届满15周年,就宣布了个革命性的搜索引擎演算公式l-1ummingbird (蜂鸟算法)个算法更重视语意搜寻,以因应更复杂的搜寻问题。如果你 希望透过这个蜂鸟算法让你的网站出头天,你 就必须把 你的网站变成 语意网的一环。

近几年可以说是语意技术的整合年,搜索引擎 的大厂都纷纷并购了知名的语意搜寻技术的公司,这个代表的是大家都在鸭子划水暗中的较劲,希望可以让搜寻服务更精准的提供信息。微软在2008年吃下了氏werset’Google在2010年并购了Metaweb’Powerset与Metaweb都是语意技术的公司。

Powerset创立最早的初衷,是要透过人类的自然语言来回答问 题,这个出发点跟Wolfram Alpha很类似。 Metaweb则是建立l=reebase的公司,这个Freebase 是一个开放的知识架构,有系统的组织了数量庞大的词汇,这个词菓就是Commontag的依据之一。而l=aviki、Zementa就是根据这些数据来提供有系统性的tagging服务,而这个Commontag也是Yahoo所支持的 结构。所以Google买下了Metaweb’等于是除了W如pedia、DBpedia等之外,Google也将能够主导这个数据源。当然透过这些数据架构,肯定Google在语意搜寻上会逐渐有些不同。

现在我们使用WolframAlphaGoogle跟Bing来问说·「Who 1s Obama ?」出现了如下的结果。WolframAlpha就告诉你Obama是美国第四十四届的总统,Google也在知识图谱上显示 了Obama的生平介绍,但是百度则只出现一般的搜寻。

当我们使用WolframAlpha、Google丶跟Bing来问说.「李安年龄」出现了如下的结果。WolframAlpha不懂中文,并且猜错我 们要查的意思,Google与百度则是告诉你正确的答案。

所以语用学比语意学复杂

所以语用学 (Pragmatics) 比语意学 (Semantics) 复杂 , 因为会因为上下文的差异而有不同的意思 , 也可能会因为说话的音调而有不一样的意义 。 所以语意只要知道其意义 , 而语用还要 知道在什么状况下使用 , 才能了解真正的意义 。

以上可能还不容易清楚知道,因此我们用例子来说明他们的差 异。

如果有人说: 「 不理你了」 , 就语意来说,就是 「 我十不想十理 会十你十了」。「 理会」的意思可以是 「 说话」、「 在意」、「 关心」 等等,也就是我要切断存在跟你中间的 「 连接线」 , 语意是纯粹硏究这句话的意思。

但是如果谈到语用 , 就必须知道这旬话的上下文跟语气 。 这句 话如果是男女朋友间很俏皮的笑说: 「不理你了」 , 还可能是撒娇的意思。而除了上下文跟语气之外 , 还有整个环境都可能影响同样一句话的语用上的意义 。

如有人说「我的肚子好像在叫」 , 并不是要陈述 「 肚子在叫」 这件事,而是希望要去 「 吃饭」。 同样的有人说·「好像蛮热的」 ' 也不是要告诉你 「 热」这件事 , 而是暗示你要 「 开冷气」 。

因此如果真的要知道 一句话的真正意义 , 不能只研究语意 (Semantic)’ 而必须也研究语用 (Pragmatics)’ 但是就网页上 的内容来说,淬取语意 (Semantic) 应该已经足够 。

而语意网 (Semantic Web) 则是为了达成语意搜寻 (Semantic Search) 所做的准备 , 也就是说语意网跟语意搜寻不是相同的 意思。只有语意网并不能够达成语意搜寻的任务,语意搜寻所需要的技术还有很多。

简单来说语意网是跟标记 (Tag) 有关,语意搜寻就必须要知道 用户下某个关键词所指的真正意义,然后从浩瀚的数据中抓出用户想要的数据 。 就 W如 pedia 的解释来看,语意网是在全球信息网上的文档(HTML) 上添加能够被计算机所理解的语 意 (Meta data)’ 从而使整个因特网成为一个通用的信息交换媒介。

如果能够精准的在文档上加上适当的meta data’则可以将没有结构化的文文件数据,变化成具有结构化关系的数据,那么计算机就能够妥善的处理这些资料来让我们搜寻。

什么是语意网与语意搜寻?

语意网(Semantic Web)是指在网页上加上 些特殊的标记,让计算机也可以尽可能的了解网页中的内容。语意搜寻(Semantic Search)则是搜索引擎要能够知道用户搜寻关键词的真正意 思,把符合用户需要的数据呈现出来。也许这还不太容易明白,我们再仔细的解释清楚。首先我们必须先搞清楚到底语意(Semantic)是什么东西?

例如下面的网页资料,用户可以很清楚的知道电影片名叫阿凡达,导演是詹姆士科麦隆,生日是1954年8月16日,电影的类型是科幻片,以及电影预告片的网址。

但是以上这样的网页数据,并无法让搜索引擎知道这些数据是在描述什么内容。如果修改成以下样子的话:

如上的例子,透过特殊的标记,搜索引擎就可以很清楚的知道所有的信息。当然这个例子只是用来解说,比较容易让读者了解,实际上并没有这些标记。

实际上真正要达成上述目的所用的标记,就如下面的样子:

以这样的方式建构起来的网络,比原本的1-lTML网页更能够让搜索引擎了解网页的真正意义,这样的网络就称之为语意网 (Semantic Web)。

语意是要研究符号的意义,现在谈到语意大多指的符号是指人

类的语言,这类语意又称为语言语意学(Linguisticsemantics)’

相对于语意的就是语法(Syntax)跟语用(Pragmatics)。也就是要了解人类使用的语言,就要知道这个语言的语意、语法、语用。

语法最容易了解,就是指研究文法(Grammar)’文法正确就好,不管意思如何。比如「哥哥吃了洒壁」,「哥哥」是主词丶「吃」是动诃、「墙壁」是受词,而「了」可以说是指完成动词这个动作的描述,语法上完全没有问题,但是却听起来很怪。

而语意跟语用两者意思很近似。语意是研究语言表示出来的意 思,而语用是跟上下文有关系的。

登录到ipeen爱评网

你可以参考ipeen爱评网的使用规定,就不再赘。

爱评网使用规定网址:

http://www.ipeen.corn.tw/premium/r:=AO.php

爱评网店家注册网址:

http://www.ipeen.corn.tw/premium/step2.php

不过ipeen爱评网服务需要收100元的手机认证费用,不过算便宜的啦。如果阅读过使用条款后没有问题,就可以开始进行 店家注册程序。爱评网刊登店家信息之后,会有店家的后台可 以进行管理。

登录到Google地方信息

1 先登入到你的Google账号,但是注意这个Google账号可能会需要跟其他人共享,所以不要使用自己私人使用的Google账号,所以最好注册个干净的Google账号。

2登入Google账号后,到http://www.google.com/local/add,可以看到如下图6-35与图6-36进行选择,然后如图6-37填写公司基本数据。

3填写完成送出后,需要选择验证的方式 ,「Google地方信息」提供三种方法,可让您验证新的商家信息 , 或是验证现有商家信息中的电话号码或地址变更,你可以选择电话、简 讯、明信片其中一种方式。当选择电话验证时 , 系统会自动拨打 「Google地方信息」帐户中列出的电话号码给你。请备妥纸笔 , 因为按下送出之后,该电话会立即响起。对方会在通话时,要求你在待验证商家旁边

的方块中,输入专属的验证码。收到验证码后请先等一分钟再

输入到方块内,因为要等待系统先储存该验证码。验证完成后,系统便会将商家信息的内容变更显示在Google地方信息上。

如果你进行验证时无法使用该电话接听来电 , 可以稍后再返回「Google地方信息」, 然后再透过电话进行验证。如果因为电话系统的问题 , 无法使用电话验证时 , 就选择其他方式验证。

使用简讯验证时,会经由当初于 「Google地方信息」输入的手机号码收到专用验证码。完成在「Google地方信息」中输入验证码之后就可以进行验证,并在6周内会整合信息到 「Google地图」中。如果无法使用简讯验证时 , 就选择其他方式验证。

如果选择明信片验证,如图6-38需填上联络人姓名,并确认地址的正确性,Google会于2-3周左右寄给你明信片,内容会有验证码让你上网验证。这个验证方式虽然需要久点的时间,但是只要地址正确的话,应该都不会发生验证的问题。

如何进行实体商店刊登?

如果您的企业有实体位置,毫无疑问地你需要在地的搜索引擎优化。但对于很多企业老板来说,可能搞不清楚在地的搜寻引

擎优化到底是什么?到底需要做什么?为什么需要它?在地的搜索引擎优化的目标,就是让在地的搜寻可以很快地寻找到你的企业,其中有个项目,您可以立即执行,那就是实体店面的信息登录。

许多行动设备在进行搜寻时,有很大的机率是希望找到实体店 面的讯息,我应该如何把实体店面信息登录到网络上呢?

有几个地方可以提供实体店面信息登录:

l.Google地方信息:http://www.google.com/local/add

  1. 1peen爱评网:http://www.ipeen.corn.tw/。
  2. Bing Business P。rtal: http://www.bing.com/businessportal ( 亻旦 是目前只提供美国、英国、加拿大与印度地区使用)。

所以其实只需要登录两个地方,第个是Google地方信息, 第二个是ipeen爱评网。如果你的企业需要美国、英国、加拿大与印度地区的在地搜索引擎优化,才需要刊登到Bing的 Business portal。

Co-citation与Co-occurence是否会开始影响自然搜寻排名?

Co-citation与Co-occurence是否会开始影响自然搜寻排名?也许会,但是不 是所有的Co-citation与Co-occurence都会影响自然搜寻排名,而是自然的 Co citation与Co-occurence才会影响自然搜寻排名。而锚点文字也不一定会 失去效果,也完全看是真正的锚点文字还是造假的锚点文字。

锚点文字将被Co-citation取代吗?

最近国外开始有许多人谈到锚点文字即将被 Co-citation (同时引用) 取代,认为以锚点文字操作的链接巳经将失去效果,取而代之的就是网页被同时引用的讯号。到底什么是 Co-citation呢?

(引用)是指当你的文章连结到文章A,则文章A会因citation为你的引 用而有分数。而 Co-citation 则是指多篇文章同时连结文章A与文章B,如果文章A与文章B会被许多文章同时引用 的机率很高,当然其间的关联性就会很高,如图6-32左侧图形所示。

并且文章被同时引用所放置的位置也会影响关联性,如图6-32右侧图形所示,文件2与文件3同时引用的位置较为接近,所以具备较高的同时引用接近指(Co-CitationProximity Index C仞)。例如许多文章在谈到搜索引擎优化这件事情,都会连结到http://seo.dns.com.tw 与 http://moz.com’ 那么这两个网站就会被认为是相关的。

与Co-citation很类似的就是Co-occurrence(同时谈论),Co occurrence是指当出现字词A时也会同时出现字词B的机率很高,那么字词A与字词B就很可能有相关性。如图6-33’不同 的网页在谈论到「搜索引擎」时,也会出现「blekko」的机率很高,那么「搜索引擎」与「blekko」就会被认为是相关词。

如上图6-34’也是另外一种间接的关联性,虽然网页甲与网页乙没有任何连结,但是网页甲与网页乙同时连结到网页A•如 果网页甲与网页乙同时引用相同网页的讯号很高的话,两者就 会被认为是相关的网页。当然Co-citation与Co-occurrence不是几个网页可以决定的, 如果你制造许多网站,然后都同时连到竞争者与色情网站,如此并不能把竞争对手跟色情网站建立任何关联 。如果你制造许多低俗的网页,然后把竞争对手的名称跟低俗的字词都弄在各 网页中,也无法让竞争对手的名称跟低俗的字词产生任何关 联 。 因为要达成Co-citation与Co-occurrence的效果,是需要 很大的数据集,以人为的方式想要操作是很困难的 。

上面的叙述可能不容易了解,我们举几个例子来说明。

举个实际的例子就是,如果许多文章谈到 「搜索引擎优化」经常也都会有 「 dns.com.tw」同时存在,那么搜索引擎就会 认为 「 搜索引擎优化」与 「 dns.com.tw」是相关的, 这个就 是Co-occurence 。 如果许多网页都会同时连到Moz.com与Searcht:ngineland.com’ 那么Moz.com与Search t:ngineland com就会因为Co-citation而产生关连性。

所以Co-citation不是只透过少数的数据就能决定相关性,必须A与B同时被许多内容同时引用,才能够建立A与B的关系。 因此其操作的困难度比锚点文字高出很多,所以许多专家都认为搜索引擎可能会把Co-citation的重要性拉高,而降低锚点文字的效果 。

其实以前就不是以锚点文字为唯一的判断标准,以后也不会以 Co-citation来取代锚点文字 。 本来锚点文字的效果就不 一定每个都一样,而在Co-citation中同时都会存在(Co-occurrence)的字词,就会具有锚点文字的效果。因此最后的结论就是:

  1. Google认为锚点文字太容易操作,所以会慢慢使用其他方式来评估相关性。

2 并不是每个锚点文字都具有相同的效果 。

3锚点文字的效果会慢慢降低,可能会被Co-citation之类的因素所超越 。

最后我们认为,锚点文字、Co-citation与Co-occurrence等方式,其实不会有谁取代谁的问题,这些评估方式都会继续存在,只是Google会把算法着重在挑出人为的操作,然后降低它的重要性,所以问题在于「人为」与「自然」,而 不是在于锚点文字、Co-citation与Co-occurrence。