搜索引擎分词算法SEO

分词算法,在任何的搜索引擎中,都是最基础的应用。

不论是百度还是Google,都是搜索引擎,都需要对抓取内容进行分词处理。

本站使用lucene做搜索,用的是开源搜索引擎,在对一段文字进行处理的时候,也会进行分词处理。

那么,什么是分词?

首先可以明确的说,任何机器和程序,你都可以将其当成智障,好比搜索引擎,他们按照设定好的运算逻辑,对文字进行处理。

就比如“分词算法”,搜索引擎在用“分词算法”进行切分的时候,会按照设定好的词库,进行分词处理,“分词算法”会被切割成“分词”和“算法”两个词。

这就是分词处理。

如果一开始设定的词库里,存在着“分词算”这个词,那么在进行分词处理的时候,还会切分成“分词算”和“法”这两组词。

所谓的分词处理,便是按照人的习惯,将一句话拆分成人能够理解的词语。

打个比方,“我们生物老师长得像女明星一样”,这么一句话,其实就是动词,名词,形容词等等的组合,搜索引擎所做的,就是将这句话按照人的理解习惯,将一句话,拆分成一个个词库里存在的词。

但如果是“锘挎槬鐪犱笉瑙夋檽锛屽澶勯椈鍟奸笩”这一段乱码,因为人类看不懂,而搜索引擎是按照人类的标准设定的理解程序,所以当搜索引擎抓取到这段乱码的时候,搜索引擎也无法做出准确的处理。


分词的运用

上面是搜索引擎在抓取文字的分词处理方式,那么当用户进行搜索的时候,实际上搜索引擎也会进行分词处理。

举个例子。

“笔记本的价格”,当用户输入这个进行搜索的时候,搜索引擎接收到,然后将其进行分词处理,拆分成“笔记本”,“的”以及“价格”这三个词。

在“笔记本”,“的”,“价格”这三个词里,“笔记本”的权重最高,“价格”其次,“的”权重最低。

接着,搜索引擎按照权重顺序,从存储的结果中进行索引。

而在这个过程中,文章标题,又是高于文章内容的。

索引页面标题里,有“笔记本”,“价格”,会在展现结果的排序靠前,接着,当页面内容里,“笔记本”和“价格”的出现屏蔽高的,说明文章内容的相关性高,排名也会靠前。

在优先级上,标题的优先级大于内容,分词的“笔记本”优先级大于“价格”。

所以在做SEO优化的过程中,要注意标题和内容的相关性,也就是你要写关于“笔记本价格”的文章,那标题和内容都要围绕“笔记本价格”来写。

网站为何要做长尾关键词?
。 站长在做SEO的时候,想要获取排名也越来越困难。 如果你想要做特定行业,而特定行业又饱和了,想要进行SEO优化,只能做精细处理,而长尾词,便是精细处理的一环。 如果早在十年前,你按照“搜索引擎分词算法...
如何正确的挑选老域名
为什么要选择老域名呢? 其实对于Google搜索引擎而言,不管是新域名还是老域名,都无所谓,因为Google收录快,如果你愿意去Google网站后台提交下,秒收录也不是什么难事。 但是对于国内的站长...
《流量池》读后感
流派:品牌流和效果流。要追求这两者的合一。 品牌流:品牌带增长的营销方式。 效果流:移动互联网,移动端,数字精准投放,效果为导向。SEM(搜索引擎营销),SEO搜索引擎优化),DSP,feeds...
购买或者交换友情链接需注意,什么样的友情链接才是好的?
一些办法。 比如用爱站工具,爱站有一个功能,叫做历史数据,就是查询一个域名的历史数据,将时间维度设置为半年,查询一个网站的百度SEO历史,如果一个站的域名年龄是5年,而其建站历史也是5年,查询到的...
网站的TKD是什么?
,就是你这篇文章所描述内容的核心。而在搜索引擎抓取索引以及排名的过程中,这三者都是很大的参考值。 三者的重要性,依次为,title > keyword > description...
什么样的友情链接比较好?
风险。 如果跟不正规的网站做友情链接,自己的站也很有可能被搜索引擎惩罚。 4、体验不友好的 这类网站,包括网站有明显的漏洞,甚至搜索引擎已经提示该站有风险的,另外,访问速度慢,网站臃肿,各种弹窗广告...