前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >利用 Xunsearch 搭建搜索引擎、内容搜索实战

利用 Xunsearch 搭建搜索引擎、内容搜索实战

作者头像
痴者工良
发布2021-04-26 09:42:02
1.2K0
发布2021-04-26 09:42:02
举报
文章被收录于专栏:痴者工良痴者工良

Xunsearch 是开源免费、高性能、多功能,简单易用的专业全文检索技术方案,是目前非常知名的开源搜索引擎。

安装完Xunserach,还需要安装PHP SDK,才能进行搜索。

-----

本人已在腾讯云实验室建立了实验,可以直接上机操作。当然,你也可以用自己的服务器进行测试。

实验室地址    https://cloud.tencent.com/developer/labs/lab/10424

-----

软件环境: Centos 7

目录

1.安装 GCC 依赖

2.安装xunsearch

3.安装环境、配置、运行 php sdk

4.导入数据和搜索数据

-------

1,安装 GCC 依赖

任务时间:10min ~ 20min

部分用户在安装时,后面的步骤会出错,是因为安装依赖时没注意到GCC,GCC++,很多教程只给出了一种依赖的安装,结果导致后面出现错误。这里笔者建议,把GCC和GCC++都安装。

安装 GCC 依赖

输入以下命令安装 gcc

代码语言:javascript
复制
yum -y install gcc

安装 GCC++ 依赖

输入以下命令安装 gcc++ (可能耗时很久)

代码语言:javascript
复制
yum -y install gcc-c++

安装 zlib 模块

输入以下命令进行安装,可能需要等待很久

代码语言:javascript
复制
yum -y install zlib-devel

2,安装 xunsearch

任务时间:1min ~ 2min

下载、解压安装包

运行以下指令,下载安装包

代码语言:javascript
复制
wget http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2

运行以下指令,解压安装包

代码语言:javascript
复制
tar -xjf xunsearch-full-latest.tar.bz2

执行安装

使用以下命令查看目录内容

代码语言:javascript
复制
ls

找到 xunsearch-full 开头的目录 ,复制目录名称。样例:xunsearch-full-1.4.11 。

进行安装

打开解压包目录(版本不一样,目录名称不一样,以本机解压名称为准)

代码语言:javascript
复制
cd xunsearch-full-1.4.11

执行安装

代码语言:javascript
复制
sh setup.sh
输入安装目录
  • 如无意外,终端将出现安装目录提示。(这一步耗时较多,请耐心等候)
  • 请输入
代码语言:javascript
复制
/user/local/xunsearch
  • 这里要求目录为 /user/local/xunsearch
  • 默认目录可能为 [/usr/local/xunsearch]
  • 注意是这里要求为 user 而不是 usr
  • 设置名称不是强制,是为了方便
  • 稍等片刻输入 y 再次确认。

如无错误,将出现以下内容

image
image

进行配置、启动

打开目录

代码语言:javascript
复制
cd /user/local/xunsearch

记下你的ip <您的 CVM IP 地址> 后面会用到。

启动xunsearch的方法有四种,现在按我的方法进行启动,其它方法在后面补全。 复制以下命令到终端上运行。

代码语言:javascript
复制
bin/xs-ctl.sh -b local start // 监听在本地回环地址 127.0.0.1 上

出现以下内容表示成功

image
image

其它启动 xunsearch 的方式(替换成你的ip) -- 这里可以不管

代码语言:javascript
复制
bin/xs-ctl.sh -b local start // 监听在本地回环地址 127.0.0.1 上 
bin/xs-ctl.sh -b inet start // 监听在所有本地 IP 地址上 
bin/xs-ctl.sh -b <您的 CVM IP 地址> start // 监听在服务器 IP 上 
bin/xs-ctl.sh -b unix start // 分别监听在 tmp/indexd.sock tmp/searchd.sock

3,安装环境、配置、运行 php sdk

任务时间:10min ~ 20min

xunsearch 已经安装完毕,但是还需要安装环境,然后在 mysql 中新建一个表。 这一步比较麻烦。 所以我们利用控制面板完成。

安装控制面板

耗时较长,可能需要 10-20 分钟。

代码语言:javascript
复制
yum install -y wget && wget -O install.sh http://download.bt.cn/install/install.sh && sh install.sh

等待一段时间后,会出现控制面板地址和账号密码 样例如下 Bt-Panel: http://<您的 CVM IP 地址>:8888 username: qbqdkra5 password: eeedd1e8 记下你的账号密码

然后执行以下命令

代码语言:javascript
复制
service bt restart

:8888>

然后就可以访问控制面板

安装环境和配置数据库

打开 :8888> 在登陆窗口输入账号密码进行登陆。

在弹出的窗口中,选择 一键安装 (安装环境耗时较长,可能需要 10-20 分钟)

image
image

4,导入数据和搜索数据

任务时间:10min ~ 20min

打开目录

打开 php 目录

代码语言:javascript
复制
cd /user/local/xunsearch/sdk/php

显示数据

执行以下命令

代码语言:javascript
复制
util/Indexer.php --source=csv --clean demo

命令表示 清除旧数据然后导入新数据

导入数据

复制以下内容,在终端窗口粘贴,然后按下 回车键 ,在按 Ctrl + D 就会结束输入

代码语言:javascript
复制
1,关于 xunsearch 的 DEMO 项目测试,项目测试是一个很有意思的行为!,1314336158
2,测试第二篇,这里是第二篇文章的内容,1314336160
3,项目测试第三篇,俗话说,无三不成礼,所以就有了第三篇,1314336168
4,李白:床前明月光,疑是地上霜,举头望明月,低头思故乡,13016542681
5,李白:君不见黄河之水天上来,奔流到海不复回,16816477956

测试搜索

恭喜你!已经搭建好搜索引擎了! 现在让我们进行搜索吧!!! 复制以下命令进行搜索

代码语言:javascript
复制
util//Quest.php demo 项目  //关键词为 项目

看看搜索结果,是不是很震撼~ 现在让我们再试试别的关键词吧

代码语言:javascript
复制
util//Quest.php demo 李白  //关键词为 李白

只需在上面的显示数据这一步重复,就可以反复测试搜索了。 注意:要在关键词后面加上 一个空格 !才能正常搜索! 如

代码语言:javascript
复制
util//Quest.php demo 三 //三的后面加了空格!

这里不是绝对,貌似时偶发情况,有时不加空格是不行的

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-09-05 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 软件环境: Centos 7
  • 目录
  • 1,安装 GCC 依赖
    • 部分用户在安装时,后面的步骤会出错,是因为安装依赖时没注意到GCC,GCC++,很多教程只给出了一种依赖的安装,结果导致后面出现错误。这里笔者建议,把GCC和GCC++都安装。
      • 安装 GCC 依赖
        • 安装 GCC++ 依赖
          • 安装 zlib 模块
          • 2,安装 xunsearch
            • 下载、解压安装包
              • 执行安装
                • 进行安装
                  • 输入安装目录
                • 进行配置、启动
                • 3,安装环境、配置、运行 php sdk
                  • 安装控制面板
                    • 安装环境和配置数据库
                    • 4,导入数据和搜索数据
                      • 打开目录
                        • 显示数据
                          • 导入数据
                            • 测试搜索
                            领券
                            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档