Browsing the archives for the Sphinx tag

[教程]freebsd8.0下安装coreseek

in 服务器类

一、安装coreseek A、安装环境配置,为安装coreseek做准备 #pkg_add -r autoconf262 automake110 libtool mysql50-client libxml2 expat B、下载整个安装包(内含mmseg,coreseek): #fetch http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.13.tar.gz #tar xzvf coreseek-3.2.13.tar.gz #cd coreseek-3.2.13 ====================================== C、 安装coreseek开发的mmseg,为coreseek提供中文分词功能 #cd mmseg-3.2.13 #./bootstrap #./configure --prefix=/usr/local/mmseg3 #make #make install 至此,mmseg已经安装完成,下面进入csft-3.2.13目录里进行安装coreseek

0 Comments

sphinx在windows下无法启动的解决办法

in 程序开发

配置完成了sphinx,也安装成为系统服务,但在dos提示符下服务的时候错误 searchd –-install -–config d:/csft3.1/bin/xxxx.conf 相应的删除服务命令为: searchd –delete 这里有两种办法: 1.直接把配置文件复制到c:/windows/system32目录里一份就可以了. 2.在安装服务的时候指定配置文件的物理路径(--config d:/csft3.1/bin/csft.conf) 索引或者查询时提示:ERROR: invalid token in 配置文件 line 1 col 1.: 该提示表示当前的配置文件的编码不是UTF-8(无BOM头)格式,无法正确解析,请使用编辑软件打开配置文件,另存为UTF-8(无BOM头)格式; 错误的编码格式包括:Unicode、Unicode BOM、Unicode big endian、Unicode 低位在前、UTF-8 + BOM、UTF-8 Signature、UTF-8 包含签名等; 特别注意:Windows自带的记事本(Notepad)或者写字板(WordPad)无法正确保存为所需格式,请勿使用其编辑配置文件; 推荐编辑器:点击下载Notepad2绿色版;使用Notepad2打开配置文件,依次选择:“文件”菜单--“编码”--“UTF-8”,然后保存文件(快捷键CTRL+S)即可。

0 Comments

[教程]coreseek sphinx在FreeBSD 7.0安装教程

in 搜索优化

感谢为中文全文检索做出贡献的所有同学。

1、源码安装LibMMSeg 。 先在这里下载压缩包 http://www.coreseek.com/opensource/mmseg/
# tar zxvf mmseg-0.7.3.tar.gz
# cd mmseg-0.7.3
# vim src/css/SegmentPkg.cpp 修改第27行, 将 #include 改为 #include
# ./configure && make && make install

0 Comments

在windows生产环境搭建sphinx的注意事项

in 搜索优化

1、以服务的方式运行sphinx

在开发环境中,只要执行”rake ultrasphinx:daemon:start“,就可以启动一台sphinx服务器。但如果在生产环境还能这么做么?把sphinx安装为服务无疑是个靠谱的办法,这样它可以像mongrel、apache一样随系统启动。sphinx自带了安装为windows服务的命令:

searchd –install –config xxxx.conf

不妨把这个加入到rake命令中,于是我hack了一下ultrasphinx插件的任务列表,加入了一个”rake ultrasphinx:daemon:install“命令。名为ultrasphinx.rake的文件我将稍后提供。

既然把sphinx安装为服务,相应的start和stop命令,也需要改改,改为使用”net start/stop searchd”。

0 Comments

Sphinx增量索引实例

in 搜索优化

在实际应用中往往有这么一种情况,数据库数据很大,比如我们的歌曲表,如果我们每次都去更新整个表的索引,对系统得开销将非常大,显然这是不合适,这时我 们会发现,每天我们需要更新的数据相比较而言较少,在这种情况下我们就需要使用“主索引+增量索引”的模式来实现实时更新的功能。

这个模式实现的基本原理是设置两个数据源和两个索引,为那些基本不更新的数据建立主索引,而对于那些新增的数据建立增量索引。主索引的更新频率我们可以设置的长一些(可以设置在每天的午夜进行更新),而增量索引的更新频率,我们可以将时间设置的很短(几分钟左右),这样在用户搜索的时候,我们可以同时查询这两个索引的数据。

0 Comments

sphinx实现主索引+增量索引

in 搜索优化

装了几次没把sphinx集成到mysql中去(SphinxSE),只好放弃,使用其自带的api(sphinx.php)来试试。
官方的sphinx0.98不支持索引GBK的数据,后装了Coreseek提供的版本,几经测试后,终于搞定GBK的数据索引。
然后调用sphinx.php写了个搜索测试程序,终于试出来,也蛮好用的。

主要按照Coreseek整理的Sphinx0.98中文参考手册中的内容,这里记录一下。

0 Comments

Sphinx速成指南

in 搜索优化

目录

1. Sphinx简介

1.1. 什么是全文检索

1.2. 介绍

1.3. Sphinx的特性

2. Sphinx安装(For MySQL)

2.1. Windows下安装

0 Comments

windows平台下gbk编码数据库的sphinx的设置

in 搜索优化

sql_query_pre    = SET NAMES GBK charset_type = zh_cn.gbk    #sbcs charset_dictpath = D:\csft3.1\data

0 Comments

Sphinx在Windows下安装使用[支持中文全文检索]

in 搜索优化

前一阵子尝试使用了一下Sphinx,一个能够被各种语言(PHP/Python/Ruby/etc)方便调用的全文检索系统。网上的资料大多是在linux环境下的安装使用,当然,作为生产环境很有必要部署在*nix环境下,作为学习测试,还是windows环境比较方便些。

本文旨在提供一种便捷的方式让Sphinx在windows下安装配置以支持中文全文检索,配置部分在linux下通用。

一、关于Sphinx

Sphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入到其他程序中)需要联系作者(Sphinxsearch.com)以获得商业授权。

0 Comments

sphinx+MySQL的安装使用(重新整理)

in 搜索优化

一、MySQL+Sphinx+SphinxSE安装步骤:
1、安装python支持(以下针对CentOS系统,其他Linux系统请使用相应的方法安装)
yum install -y python python-devel

2、编译安装LibMMSeg(LibMMSeg是为Sphinx全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。LibMMSeg在本文中用来生成中文分词词库。)

0 Comments