分词方法和对SEO的影响

SEO基础知识 杭州seo 1,927 0评论

在我们撰写网站标题和描述时,分词的准确性会对搜索造成很大的影响。

分词又叫做切词,是将联系的字序列按照一定的规范重新组合成词序列的过程。

分词方法图

这里说的分词是中文分词,因为对英文而言,是以词为单位,词与词之间有空格分隔开,而中文是以文字为单位,多个字链接在一起才能构成一个表达具体含义的词,词与词之间没有分割,因此,对于支持自然语言检索的工具,从语句中划分出具有独立意义的词的过程即进行中文分词必不可少。

中文分词分类:基于字符串匹配(机械分词法)、基于理解和基于统计。

机械分词法原理:搜索栏的字符串与一个庞大的机器字典中的词进行匹配
正向最大匹配:比如走路和气质,走路 和气 质
逆向最大匹配:走路 和 气质
最少切分法:使每一句中切出的词数量最少,还可以将上述方法相互结合,比如说双向最大匹配。
其中逆向最大匹配高于正向最大匹配。

基于理解的分词方法:
在分词的同事进行语句、语义分析,利用句法信息和语义信息来处理歧义现象。由于汉语语言的复杂和笼统性,这种方法目前难以实现。

机遇统计的分词方法:
根据汉字共同出现的频率来分词。但是这种分词方法经常会抽出不是常用的字组,比如这一,我的。

百度搜索引擎有一个专有词典,分词时首先查询专有词典(人民,部分地名等),讲专有名词切出,剩下放的部分采取双向分词策略,如果两者相切分结果相同,说明没有歧义,直接输出分词结果,如果不一致,则输出最短路径的那个结果,如果长度相同,则选择单字词少的那一组切分结果,如果单字也相同,则选择正向分词结果。中文分词也是百度核心技术之一,也不会将细节告诉大家,只能通过黑盒的方法来推导,通过输入搜索词来查看检索的情况

在搜索时,百度同时做出多种分词方式,首先不拆分进去查找,然后先识别专有名词和新词,再对其余部分进行查分,采用双向最大匹配方式。

分词对seo的影响:
中文分词的准确性汪汪会影响搜索赢钱排名的相关性;
充分利用中文分词撰写网站标题;
利用中文分词撰写网站描述;

今天就写到这里,欢迎大家来吐糟。

杭州seo>分词方法和对SEO的影响,版权所有,转载请写明出处。

喜欢 0 or分享

发表评论

(5 )个小伙伴在吐槽
  1. 不错的文章

    勾花网 2016-10-14 11:00 回复   
  2. 不错的文章

    安平物流网 2016-10-15 17:57 回复   
  3. 好文章

    格宾网 2016-10-19 04:45 回复   
  4. 不错的文章,内容博学多才

    pvc护栏 2016-10-21 01:15 回复   
  5. 不错的文章

    网格布 2016-11-01 18:36 回复