配置完成了sphinx,也安装成为系统服务,但在dos提示符下服务的时候错误 searchd –-install -–config d:/csft3.1/bin/xxxx.conf 相应的删除服务命令为: searchd –delete 这里有两种办法: 1.直接把配置文件复制到c:/windows/system32目录里一份就可以了. 2.在安装服务的时候指定配置文件的物理路径(–config d:/csft3.1/bin/csft.conf)
Browsing the archives for the Sphinx tag
感谢为中文全文检索做出贡献的所有同学。
1、源码安装LibMMSeg 。 先在这里下载压缩包 http://www.coreseek.com/opensource/mmseg/
# tar zxvf mmseg-0.7.3.tar.gz
# cd mmseg-0.7.3
# vim src/css/SegmentPkg.cpp 修改第27行, 将 #include
# ./configure && make && make install
1、以服务的方式运行sphinx
在开发环境中,只要执行”rake ultrasphinx:daemon:start“,就可以启动一台sphinx服务器。但如果在生产环境还能这么做么?把sphinx安装为服务无疑是个靠谱的办法,这样它可以像mongrel、apache一样随系统启动。sphinx自带了安装为windows服务的命令:
searchd –install –config xxxx.conf
不妨把这个加入到rake命令中,于是我hack了一下ultrasphinx插件的任务列表,加入了一个”rake ultrasphinx:daemon:install“命令。名为ultrasphinx.rake的文件我将稍后提供。
既然把sphinx安装为服务,相应的start和stop命令,也需要改改,改为使用”net start/stop searchd”。
在实际应用中往往有这么一种情况,数据库数据很大,比如我们的歌曲表,如果我们每次都去更新整个表的索引,对系统得开销将非常大,显然这是不合适,这时我 们会发现,每天我们需要更新的数据相比较而言较少,在这种情况下我们就需要使用“主索引+增量索引”的模式来实现实时更新的功能。
这个模式实现的基本原理是设置两个数据源和两个索引,为那些基本不更新的数据建立主索引,而对于那些新增的数据建立增量索引。主索引的更新频率我们可以设置的长一些(可以设置在每天的午夜进行更新),而增量索引的更新频率,我们可以将时间设置的很短(几分钟左右),这样在用户搜索的时候,我们可以同时查询这两个索引的数据。
装了几次没把sphinx集成到mysql中去(SphinxSE),只好放弃,使用其自带的api(sphinx.php)来试试。
官方的sphinx0.98不支持索引GBK的数据,后装了Coreseek提供的版本,几经测试后,终于搞定GBK的数据索引。
然后调用sphinx.php写了个搜索测试程序,终于试出来,也蛮好用的。
主要按照Coreseek整理的Sphinx0.98中文参考手册中的内容,这里记录一下。
目录
1. Sphinx简介
1.1. 什么是全文检索
1.2. 介绍
1.3. Sphinx的特性
2. Sphinx安装(For MySQL)
2.1. Windows下安装
sql_query_pre = SET NAMES GBK charset_type = zh_cn.gbk #sbcs charset_dictpath = D:\csft3.1\data
前一阵子尝试使用了一下Sphinx,一个能够被各种语言(PHP/Python/Ruby/etc)方便调用的全文检索系统。网上的资料大多是在linux环境下的安装使用,当然,作为生产环境很有必要部署在*nix环境下,作为学习测试,还是windows环境比较方便些。
本文旨在提供一种便捷的方式让Sphinx在windows下安装配置以支持中文全文检索,配置部分在linux下通用。
一、关于Sphinx
Sphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入到其他程序中)需要联系作者(Sphinxsearch.com)以获得商业授权。
一、MySQL+Sphinx+SphinxSE安装步骤:
1、安装python支持(以下针对CentOS系统,其他Linux系统请使用相应的方法安装)
yum install -y python python-devel
2、编译安装LibMMSeg(LibMMSeg是为Sphinx全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。LibMMSeg在本文中用来生成中文分词词库。)
考虑到Sphinx全文索引使用的实际需要,主要介绍Sphinx全文索引中文方面的支持。
这里需要感谢李沫南同学对Sphinx全文索引中文支持的贡献!
一,Windows下安装Sphinx
1,开始前的准备工作
来源:http://www.coreseek.cn/products/ft_down/
下载csft3.1:http://www.coreseek.cn/uploads/csft/3.1/win32/csft3.1.bin.zip
下载标准词库:http://www.coreseek.cn/uploads/csft/3.1/data.zip
解压:csft3.1.bin.zip 如下目录,解压在C:\csft3.1目录下
解压:data.zip,解压在C:\csft3.1\data目录下 [分词包]