SCWS-PHP扩展的说明及用法

工作学习 2 Comments »

详细请访问:http://www.hightman.cn

[SCWS 简介]

SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词之间用空格分开,所以如何准确快速的分词一直是中文分词的攻关难点。

本分词法并无太多创新成分,采用的是自己采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。首次雏形版本发布于 2005 年底。

本系统支持的汉字编码包括 GBK、UTF-8

Read the rest of this entry »

WordPress 对象缓存

工作学习 No Comments »

WordPress 默认对象缓存:WordPress Object Cache。具体可以查看《使用 WordPress 对象缓存 》这篇文章。

WordPress Object Cache 的目的是提供一个耗时查询或者运算结果存储到一个缓存文件的方法。这样就可以让我们不用老是重复到数据库中或者其他外部网站获取不变的数据。但是需要提出的是,一些服务器环境在使用缓存的时候会有些问题,所以这需要你去监控你的服务器来决定使用缓存能否对你的站点有益。

Read the rest of this entry »

WP Theme & Icons by N.Design Studio
Entries RSS Comments RSS 登录