SQLServer对文件内容全文检索查询

2016-01-29 16:06 6 1 收藏

SQLServer对文件内容全文检索查询,SQLServer对文件内容全文检索查询

【 tulaoshi.com - SQLServer 】

因为项目需要,需要对上传的文件内容进行查询。通过MSDN了解到Windows索引服务可以实现对文件的全文检索,并可以通过SQL Server进行查询。项目将这两者结合,实现对上传文件的全文检索的解决方案。

方案概要:

1. 改变文件存储时的文件名

2. 配置索引服务器,并将索引服务器与MS SQL Server关联。

3. 修改SQL语句,将进行全文查询语句的内容加入查询条件中

文件的存储方式:

为了方便存储以及方便索引,我们将上传的文件存储到一个目录里面,为了保证上传的文件名不重复,采用GUID作为文件名,并且通过这个GUID于数据库记录相关联。同时,文件的后缀还保持原始文件的后缀,让索引服务能够识别该文档。

配置索引服务

进入计算机管理(Computer Management)程序(右键”我的电脑”-”管理”),并找到索引服务(Index Service)

配置索引服务的功能

(1)右键选择索引服务弹出一个菜单

(2)选择New-Catalog(新建一个编录)

设置新增加的编录

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/sqlserver/)

(1)输入编录的名字(这个名字需要与数据库进行关联,要注意命名,这里假设DCSII

(2)点Browse进入选择索引服务运行目录窗体

(3)选择前面创建的索引运行目录(任意地方)

(4)点确定完成本次操作

在编录创建号以后,需要给编录增加目录

(1)右键选择刚刚创建的编录

(2)选择New-Directory(新建目录)

新建索引目录

(1)点击Browse进入目录选择页面

(2)选择要进行全文检索文件的目录

(3)确定完成本次操作

完成创建后启动索引服务

(1)启动索引服务

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/sqlserver/)

(2)索引服务启动成功后索引编录的信息,可以看到编录信息就表示服务已经启动成功。

将索引服务和SQL数据库关联:

在SQL 查询分析器(SQL Query Analyer)里执行下面的存储过程

EXEC sp_addlinkedserver Dcs, -- 连接服务器的名字,到后面查询的时候要用到

'Index Server',

'MSIDXS',

'DCSII' -- 索引服务里新建的编录名字

s.p.

索引服务的性能调整方法1

(1)右键选择索引服务

(2)选择 All Tasks- Tune Perrformance

(3)选择用户自定义

(4)点击Customize进入性能调整窗体

(5)将Index和Querying的属性移动到最右边

(6)点确定完成操作

性能调整方法2

如果服务器不需要对整个系统的文件进行索引,可以停止或者删除System编录。

MS SQL对索引服务器的调用

1. 通过sql语句查询连接服务器的内容

SELECT Q.*

FROM OpenQuery(dcs, --连接服务器名字

'SELECT FileName, Size, DocAuthor, path --在连接服务器里的sql语句

FROM SCOPE()

WHERE CONTAINS(''番号 and abc'') '

) AS Q

2. 因为SQL语句不支持动态输入的字符串,因此查询字符串只好在C#代码里进行拼接

s.p.

实不用将文件保存到数据库外面也能实现在数据库里实现全文搜索。具体方案是

来源:https://www.tulaoshi.com/n/20160129/1497473.html

延伸阅读
标签: SQLServer
  基本知识 1. SQL Server7 的 DeskTop 版中没有全文本检索。 2. 一个表只能有一个全文本检索。 3. 被检索的表必须有单列的唯一索引。 4. 全文本的索引存储在文件系统中,而非数据库中。 5. 更新全文本索引的过程比常规索引要耗时,而且也不象常规索引那样可以由数据库系统立即更新。 6. 全文本索引包含在全文本目录( Full-Text Catalog )...
标签: SQLServer
  CONTAINS 语法 我们通常在 WHERE 子句中使用 CONTAINS ,就象这样:SELECT * FROM table_name WHERE CONTAINS(fullText_column,'search contents')。 我们通过例子来学习,假设有表 students,其中的 address 是全文本检索的列。 1. 查询住址在北京的学生 SELECT student_id,student_name FROM students WHERE CONTAINS( address, 'bei...
标签: SQLServer
  CONTAINSTABLE 语法 我们通常在 FROM 子句中使用 CONTAINSTABLE ,就象这样:SELECT * FROM table_name,CONTAINTABLE(fulltext_table,fullText_column,'search condition') WHERE ......。 CONTAINSTABLE 在查询方式上与 CONTAINS 几乎一样,所以就不用赘述了。CONTAINSTABLE 返回的是符合查询条件的表,在 SQL 语句中我们可以把它当作...
全文信息检索介绍及算法分析 作者:杨老师 一、摘要 本文主要介绍了全文信息检索的概念、应用领域、算法分类、技术难点和算法比较。及一款实现全文检索的数据结构和算法。 二 、什么是全文数据库和全文信息检索 保存在数据库中的记录数据,从类型上可以分为两种。其一是结构化数...
1 Oracle Text的体系架构 下图是Oracle Text的体系架构。 图1 Oracle Text的体系架构 以上面的体系架构图为基础,Oracle Text 索引文档时所使用的主要逻辑步骤如下: (1)数据存储逻辑搜索表的所有行,并读取列中的数据。通常,这只是列数据,但有些数据存储使用列数据作为文档数据的指针。例如,URL_DATASTORE 将列数...

经验教程

100

收藏

63
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部