Below you will find pages that utilize the taxonomy term “Sphinx”
March 19, 2013
sphinx分布式索引简介
"\u003cp\u003e\u003cstrong\u003esphinx分布式索引原理:\u003c/strong\u003e\u003c/p\u003e\n\u003cp\u003e当searchd收到一个对分布式索引的查询时,它做如下操作:\u003c/p\u003e\n\u003col\u003e\n\u003cli\u003e\n\u003cp\u003e连接到远程代理\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e执行查询\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e(在远程代理执行搜索的同时)对本地索引进行查询\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e接收来自远程代理的搜索结果\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e将所有结果合并,删除重复项\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e将合并后的结果返回给客户端\u003c/p\u003e\n\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e在应用程序看来,普通索引和分布式索引完全没有区别。\u003c/p\u003e\n\u003cp\u003e任一个searchd实例可以同时做为主控端(master,对搜索结果做聚合)和从属端(只做本地\u003c/p\u003e\n\u003cp\u003e搜索)。这有如下几点好处:\u003c/p\u003e\n\u003col\u003e\n\u003cli\u003e集群中的每台机器都可以做为主控端来搜索整个集群,搜索请求可以在主控端之间获\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e得负载平衡,相当于实现了一种HA(high availability,高可用性),可以应对某个\u003c/p\u003e\n\u003cp\u003e节点失效的情况。\u003c/p\u003e\n\u003col start=\"2\"\u003e\n\u003cli\u003e如果在单台多CPU或多核机器上使用,一个做为代理对本机进行搜索的searchd实例\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e就可以利用到全部的CPU或者核。\u003c/p\u003e\n\u003cp\u003e更好的HA支持已在计划之中,到时将允许指定哪些代理之间互相备份、有效性检查、跟踪\u003c/p\u003e\n\u003cp\u003e运行中的代理、对检索请求进行负载均衡,等等。\u003c/p\u003e\n\u003cp\u003esphinx分布式索引配置:\u003c/p\u003e\n\u003cp\u003eindex dist1\u003c/p\u003e\n\u003cp\u003e{\u003c/p\u003e\n\u003cp\u003elocal index to be …\u003c/p\u003e"
August 28, 2010
[教程]freebsd8.0下安装coreseek
"\u003cp\u003e一**、安装coreseek**\u003c/p\u003e\n\u003cp\u003eA、安装环境配置,为安装coreseek做准备\u003c/p\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#pkg_add -r autoconf262 automake110 libtool mysql50-client libxml2 expat\u003c/p\u003e\u003c/blockquote\u003e\n\u003cp\u003eB、下载整个安装包(内含mmseg,coreseek):\u003c/p\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#fetch \u003ca href=\"http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.13.tar.gz\"\u003ehttp://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.13.tar.gz\u003c/a\u003e\u003c/p\u003e\u003c/blockquote\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#tar xzvf coreseek-3.2.13.tar.gz\u003c/p\u003e\u003c/blockquote\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#cd coreseek-3.2.13\u003c/p\u003e\u003c/blockquote\u003e\n\u003cp\u003e======================================\u003c/p\u003e\n\u003cp\u003eC \u003cstrong\u003e、\u003c/strong\u003e 安装coreseek开发的mmseg,为coreseek提供中文分词功能\u003c/p\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#cd mmseg-3.2.13\u003c/p\u003e\u003c/blockquote\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#./bootstrap\u003c/p\u003e\u003c/blockquote\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#./configure –prefix=/usr/local/mmseg3\u003c/p\u003e\u003c/blockquote\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#make\u003c/p\u003e\u003c/blockquote\u003e\n\u003cblockquote\u003e\n\u003cp\u003e#make install\u003c/p\u003e\u003c/blockquote\u003e\n\u003cp\u003e至此,mmseg已经安装完成,下面进入csft-3.2.13目录里进行安装coreseek …\u003c/p\u003e"
November 17, 2009
sphinx在windows下无法启动的解决办法
"\u003cp\u003e配置完成了sphinx,也安装成为系统服务,但在dos提示符下服务的时候错误\u003c/p\u003e\n\u003cblockquote\u003e\n\u003cp\u003esearchd –-install -–config d:/csft3.1/bin/xxxx.conf\u003c/p\u003e\n\u003cp\u003e相应的删除服务命令为:\u003c/p\u003e\n\u003cp\u003esearchd –delete\u003c/p\u003e\u003c/blockquote\u003e\n\u003cp\u003e[\u003cimg src=\"https://blogstatic.haohtml.com//uploads/2023/09/sphinex-services.jpg\" alt=\"sphinex-services\"\u003e][1]\u003c/p\u003e\n\u003cp\u003e这里有两种办法:\n1.直接把配置文件复制到c:/windows/system32目录里一份就可以了.\n2.在安装服务的时候指定配置文件的物理路径(–config d:/csft3.1/bin/csft.conf)\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e索引或者查询时提示:ERROR: invalid token in 配置文件 line 1 col 1.\u003c/strong\u003e:\u003c/p\u003e\n\u003cp\u003e该提示表示当前的配置文件的编码不是UTF-8(无BOM头)格式,无法正确解析,请使用编辑软件打开配置文件,另存为UTF-8(无BOM头)格式;\u003c/p\u003e\n\u003cp\u003e错误的编码格式包括:Unicode、Unicode BOM、Unicode big endian、Unicode 低位在前、UTF-8 + BOM、UTF-8 Signature、UTF-8 包含签名等;\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e特别注意\u003c/strong\u003e\u003c/p\u003e\n\u003cp\u003eWindows自带的记事本(Notepad)或者写字 …\u003c/p\u003e"
October 22, 2009
[教程]coreseek sphinx在FreeBSD 7.0安装教程
"\u003cp\u003e感谢为中文全文检索做出贡献的所有同学。\u003c/p\u003e\n\u003cp\u003e1、源码安装LibMMSeg 。 先在这里下载压缩包\n\u003cstrong\u003e# fetch \u003ca href=\"http://www.coreseek.com/opensource/mmseg/\"\u003ehttp://www.coreseek.com/opensource/mmseg/\u003c/a\u003e\u003c/strong\u003e\n\u003cstrong\u003e# tar zxvf mmseg-0.7.3.tar.gz\n# cd mmseg-0.7.3\u003c/strong\u003e\n\u003cstrong\u003e# vim src/css/SegmentPkg.cpp\u003c/strong\u003e 修改第27行, 将 #include 改为 \u003cstrong\u003e#include\n# ./configure \u0026amp;\u0026amp; make \u0026amp;\u0026amp; make install\u003c/strong\u003e\u003c/p\u003e\n\u003cp\u003e2、测试 mmseg\n\u003cstrong\u003e# cd mmseg-0.7.3/data\u003c/strong\u003e 你会看到一个准备好的UTF-8编码的字典文件 unigram.txt\n\u003cstrong\u003e# mmseg -u unigram.txt\u003c/strong\u003e 该命令执行后,将会产生一个名为unigram.txt.uni的文件,将该文件改名为uni.lib,完成词典的构造。 你也可以进行分词测试。详见 \u003ca href=\"http://www.coreseek.com/opensource/mmseg/\"\u003ehttp://www.coreseek.com/opensource/mmseg/\u003c/a\u003e\u003c/p\u003e\n\u003cp\u003e3、ports安装 gawk\n\u003cstrong\u003e# cd …\u003c/strong\u003e\u003c/p\u003e"
October 15, 2009
在windows生产环境搭建sphinx的注意事项
"\u003cp\u003e\u003cstrong\u003e1、以服务的方式运行sphinx\u003c/strong\u003e\u003c/p\u003e\n\u003cp\u003e在开发环境中,只要执行”\u003cem\u003erake ultrasphinx:daemon:start\u003c/em\u003e“,就可以启动一台sphinx服务器。但如果在生产环境还能这么做么?把sphinx安装为服务无疑是个靠谱的办法,这样它可以像mongrel、apache一样随系统启动。sphinx自带了安装为windows服务的命令:\u003c/p\u003e\n\u003cblockquote\u003e\n\u003cp\u003esearchd –-install -–config xxxx.conf\u003c/p\u003e\n\u003cp\u003e相应的删除服务命令为:\u003c/p\u003e\n\u003cp\u003esearchd –delete\u003c/p\u003e\u003c/blockquote\u003e\n\u003cp\u003e不妨把这个加入到rake命令中,于是我hack了一下ultrasphinx插件的任务列表,加入了一个”\u003cem\u003erake ultrasphinx:daemon:install\u003c/em\u003e“命令。名为ultrasphinx.rake的文件我将稍后提供。\n如果在启用服务的时候提示”发生系统错误1067″的话,则需要在安装服务的时候指定配置文件的路径,参考:\u003ca href=\"http://blog.haohtml.com/index.php/archives/2593\"\u003esphinx在windows下无法启动的解决办法\u003c/a\u003e 如: d:\\csft3.1\\bin\u0026gt;searchd –install –config d:\\csft3.1\\bin\\www.conf\u003c/p\u003e\n\u003cp\u003e既然 …\u003c/p\u003e"
October 15, 2009
Sphinx增量索引实例
"\u003cp\u003e在实际应用中往往有这么一种情况,数据库数据很大,比如我们的歌曲表,如果我们每次都去更新整个表的索引,对系统得开销将非常大,显然这是不合适,这时我 们会发现,每天我们需要更新的数据相比较而言较少,在这种情况下我们就需要使用“主索引+增量索引”的模式来实现实时更新的功能。\u003c/p\u003e\n\u003cp\u003e这个模式实现的基本原理是设置两个数据源和两个索引,为那些基本不更新的数据建立主索引,而对于那些新增的数据建立增量索引。主索引的更新频率我们 可以设置的长一些(可以设置在每天的午夜进行更新),而增量索引的更新频率,我们可以将时间设置的很短(几分钟左右),这样在用户搜索的时候,我们可以同 时查询这两个索引的数据。\u003c/p\u003e\n\u003cp\u003e下面,我们通过一个简单的例子来描述一下怎样实现这种模式\u003c/p\u003e\n\u003cp\u003e以sphinx.conf中默认的数据为例:\u003c/p\u003e\n\u003cp\u003e1.先在mysql中插入一个计数表和两个索引表\u003c/p\u003e\n\u003col\u003e\n\u003cli\u003eCREATETABLEsph_counter(\u003c/li\u003e\n\u003cli\u003ecounter_idINTEGERPRIMARYKEYNOTNULL,\u003c/li\u003e\n\u003cli\u003emax_doc_idINTEGERNOTNULL\u003c/li\u003e\n\u003cli\u003e);\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e//主索引使用(确认之前是否已经建立过该表,如果已经建立,这里就不需要重新建了) …\u003c/p\u003e"
October 15, 2009
sphinx实现主索引+增量索引
"\u003cp\u003e装了几次没把sphinx集成到mysql中去(SphinxSE),只好放弃,使用其自带的api(sphinx.php)来试试。\n官方的sphinx0.98不支持索引GBK的数据,后装了Coreseek提供的版本,几经测试后,终于搞定GBK的数据索引。\n然后调用sphinx.php写了个搜索测试程序,终于试出来,也蛮好用的。\u003c/p\u003e\n\u003cp\u003e主要按照Coreseek整理的 \u003ca href=\"http://down.itlearner.com/soft/2420.shtml\"\u003eSphinx0.98中文参考手册\u003c/a\u003e 中的内容,这里记录一下。\u003c/p\u003e\n\u003cp\u003e创建主索引:\u003c/p\u003e\n\u003cblockquote\u003e\n\u003cp\u003ebin/indexer –config etc/sphinx.conf hx_9enjoy –rotate\u003c/p\u003e\u003c/blockquote\u003e\n\u003cp\u003e创建增量索引:\u003c/p\u003e\n\u003cblockquote\u003e\n\u003cp\u003ebin/indexer –config etc/sphinx.conf delta –rotate\u003c/p\u003e\u003c/blockquote\u003e\n\u003cp\u003e合并主索引和增量索引:\u003c/p\u003e\n\u003cblockquote\u003e\n\u003cp\u003ebin/indexer –config etc/sphinx.conf –merge hx_9enjoy delta –merge-dst-range deleted 0 0 –rotate\u003c/p\u003e\u003c/blockquote\u003e\n\u003cp\u003e–rotate参数可以在不停searchd的情况下索引,不然的话会有类似如下的提示:\nFATAL: failed to …\u003c/p\u003e"
October 15, 2009
Sphinx速成指南
"\u003cp\u003e版权 ? 2008 Dony,,版权所有,转载请声明来源与作者\u003c/p\u003e\n\u003cp\u003e2008-01-17\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e目录\u003c/strong\u003e\u003c/p\u003e\n\u003col\u003e\n\u003cli\u003eSphinx简介\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e1.1. 什么是全文检索\u003c/p\u003e\n\u003cp\u003e1.2. 介绍\u003c/p\u003e\n\u003cp\u003e1.3. Sphinx的特性\u003c/p\u003e\n\u003col start=\"2\"\u003e\n\u003cli\u003eSphinx安装(For MySQL)\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e2.1. Windows下安装\u003c/p\u003e\n\u003cp\u003e2.2. Linux下安装 3. 实例说明\u003c/p\u003e\n\u003col start=\"4\"\u003e\n\u003cli\u003e\n\u003cp\u003eSphinx配置\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e运行Sphinx\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e搜索(翻译)\u003c/p\u003e\n\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e6.1. 匹配模式\u003c/p\u003e\n\u003cp\u003e6.2. 布尔查询语法(Boolean query syntax)\u003c/p\u003e\n\u003cp\u003e6.3. 扩展查询语法(Extended query syntax)\u003c/p\u003e\n\u003cp\u003e6.4. 权重(匹配度,Weight)\u003c/p\u003e\n\u003col start=\"7\"\u003e\n\u003cli\u003e\n\u003cp\u003e如何调用Sphinx\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003eSphinxSE的SQL查询例子演练\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e如何自动重建索引\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e相关资源\u003c/p\u003e\n\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e\u003cstrong\u003e1. Sphinx简介\u003c/strong\u003e\u003c/p\u003e\n\u003cp\u003e1.1. 什么是全文检索\u003c/p\u003e\n\u003cp\u003e全文检索是指以文档的全部文本信息作为检索对象的一种信息检索技术。检索的对象有可能是文章的标题,也有可能是文章的作者,也有可能是文章摘要或内容。\u003c/p\u003e\n\u003cp\u003e1.2. 介绍\u003c/p\u003e\n\u003cp\u003eSphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据 …\u003c/p\u003e"
October 14, 2009
windows平台下gbk编码数据库的sphinx的设置
"\u003cp\u003esql_query_pre = SET NAMES GBK\u003c/p\u003e\n\u003cp\u003echarset_type = zh_cn.gbk #sbcs\u003c/p\u003e\n\u003cp\u003echarset_dictpath = D:\\csft3.1\\data\u003c/p\u003e"
October 14, 2009
Sphinx在Windows下安装使用[支持中文全文检索]
"\u003cp\u003e前一阵子尝试使用 了一下Sphinx,一个能够被各种语言(PHP/Python/Ruby/etc)方便调用的全文检索系统。网上的资料大多是在linux环境下的安装 使用,当然,作为生产环境很有必要部署在*nix环境下,作为学习测试,还是windows环境比较方便些。\u003c/p\u003e\n\u003cp\u003e本文旨在提供一种便捷的方式让Sphinx在windows下安装配置以支持中文全文检索,配置部分在linux下通用。\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e一、关于Sphinx\u003c/strong\u003e\u003c/p\u003e\n\u003cp\u003eSphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入到其他程序中)需要联系作者(Sphinxsearch.com)以获得商业授权。\u003c/p\u003e\n\u003cp\u003e一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。\u003c/p\u003e\n\u003cp\u003e当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)。\u003c/p\u003e\n\u003cp\u003e搜索API支持PHP、Python、Perl、Rudy和Java,并且也可 …\u003c/p\u003e"
October 14, 2009
sphinx+MySQL的安装使用(重新整理)
"\u003cp\u003e一、MySQL+Sphinx+SphinxSE安装步骤:\n1、安装python支持(以下针对CentOS系统,其他Linux系统请使用相应的方法安装)\nyum install -y python python-devel\u003c/p\u003e\n\u003cp\u003e2、编译安装LibMMSeg(LibMMSeg是为Sphinx全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。LibMMSeg在本文中用来生成中文分词词库。)\u003c/p\u003e\n\u003cp\u003e以下压缩包“sphinx-0.9.8-rc2-chinese.zip”中包含mmseg-0.7.3.tar.gz、sphinx-0.9.8-rc2.tar.gz以及中文分词补丁。\u003c/p\u003e\n\u003cp\u003ewget \u003ca href=\"http://www.coreseek.com/uploads/sources/csft3_0b2.tar.gz\"\u003ehttp://www.coreseek.com/uploads/sources/csft3_0b2.tar.gz\u003c/a\u003e\nwget \u003ca href=\"http://www.coreseek.com/uploads/sources/mmseg3_0b2.tar.gz\"\u003ehttp://www.coreseek.com/uploads/sources/mmseg3_0b2.tar.gz\u003c/a\u003e\nunzip sphinx-0.9.8-rc2-chinese.zip\ntar zxvf …\u003c/p\u003e"
October 3, 2009
Sphinx全文索引安装教程
"\u003cp\u003e首先了解一下sphinx全文索引的相关知识\u003c/p\u003e\n\u003cp\u003e官方网站: \u003ca href=\"http://www.sphinxsearch.com/\"\u003ehttp://www.sphinxsearch.com/\u003c/a\u003e\u003c/p\u003e\n\u003cp\u003e官方文档: \u003ca href=\"http://www.sphinxsearch.com/docs/\"\u003ehttp://www.sphinxsearch.com/docs/\u003c/a\u003e\u003c/p\u003e\n\u003cp\u003e中文支持: \u003ca href=\"http://www.coreseek.cn/\"\u003ehttp://www.coreseek.cn/\u003c/a\u003e\u003c/p\u003e\n\u003cp\u003e中文使用手册下载: \u003ca href=\"http://www.coreseek.cn/uploads/pdf/sphinx_doc_zhcn_0.9.pdf\"\u003ehttp://www.coreseek.cn/uploads/pdf/sphinx_doc_zhcn_0.9.pdf\u003c/a\u003e\u003c/p\u003e\n\u003cp\u003e基本上看看上面的官方教程和中文使用手册,你应该会安装和使用Sphix全文索引,当然,还有一些细节,需要不断的google和baidu,那为了节省大家的时间,就出一个完整的Sphinx安装教程和结合PHPWIND程序的使用教程(PHPWIND7.5版本支持)。\u003c/p\u003e\n\u003cp\u003e接下来开始Sphinx的技术之旅吧!\u003c/p\u003e\n\u003cp\u003e考虑到Sphinx全文索引使用的实际需要,主要介绍Sphinx全文索引中文方面的支持。\n这里需要感谢\u003cstrong\u003e李沫南\u003c/strong\u003e同学对Sphinx全文索引中文支持的贡献!\n**\n一,Windows下安装Sphinx**\n1,开始前的准备工作\n来源: \u003ca href=\"http://www.coreseek.cn/products/ft_down/\"\u003ehttp://www.coreseek.cn/products/ft_down/\u003c/a\u003e\n …\u003c/p\u003e"