0921

什么是中文分词?

啥是分词技术呀?通俗的解释就是如何将短语或词组合理的分解并释义出正式解释(郭长老的白话文,不清楚的自己百度一下)。官方是这样说的:中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法

任何文档都可以看做是一些连续的词的集合,但是中文没有明显的分界线。举个例子,学历史学好,人很容易区分怎么分词,学/历史学/好;计算机没有人类这样的智慧,计算机会错分如:学历/史学/好。索引时计算机会根据上面的情形出相关搜索,这样用户搜索历史学就不能准确得到想要的答案。由此可见。分词的技术很大程度影响搜索的结构。

标签: , 作者:郭长老|分类:共同关注|时间:09-09-21

欢迎光临战略·SEO团队官网

点击Q我

战略seo团队认为,中国互联网已经跨过了建站时代。正在大步迈向网站推广、网络营销时代,而基于搜索引擎的优化、营销、推广[SEO/SEM]将成为最重要的应用技能。网站优化、推广、网络营销将成为互联网时代的新动力。战略SEO将与您一同学习、探讨、研究相关问题。