什么是垂直搜索?

2016-02-19 13:26 2 1 收藏

下面是个什么是垂直搜索?教程,撑握了其技术要点,学起来就简单多了。赶紧跟着图老师小编一起来看看吧!

【 tulaoshi.com - Web开发 】

垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。

垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。

整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。

垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。

举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。

垂直搜索引擎大体上需要以下技术

1.Spider

2.网页结构化信息抽取技术或元数据采集技术

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/webkaifa/)

3.分词、索引

4.其他信息处理技术

垂直搜索引擎的技术评估应从以下几点来判断

1.全面性

2.更新性

3.准确性

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/webkaifa/)

4.功能性

垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。

来源:https://www.tulaoshi.com/n/20160219/1604270.html

延伸阅读
阿里旺旺搜索信息有什么功能   1,如何利用旺旺查找与搜索信息 您可以点阿里旺旺页面最下面的搜字按钮(如下图中1所示) 阿里旺旺页面-1 进入我的搜索页面,这里您通过搜索查询,或者通过类目可以选择自己感兴趣的信息。(如下图中2所示)。 阿里旺旺页面-2 点击设置,进入设置页面,你选择自己感兴趣的信...
酷狗音乐搜索歌曲超时是怎么回事?   方法一、首先查看是不是网络的原因。如果网络都连接不上的话或者不稳定的话。那么搜索超时就很正常了。当然这个情况也好解决,只需要等网络连接好稳定之后即可恢复故障了。 方法二、然后就是用户开启了防火墙大门将酷狗拒之门外了。即使网络正常,这种情况使用酷狗搜索歌曲就连接不上网络。...
标签: 电脑入门
Windows的搜索功能大家都用过,有时候实在想不起某个文件放哪儿了,就交给搜索功能来帮忙。只不过,基本上我们对搜索功能的使用也就仅限于偶尔找个文件,XP时代是这样,Win7也是这样。但是在即将到来的Win8时代,这种现象有可能会改变,因为Windows 8中的搜索功能增加了很多新用途,不再限于搜索文件。 不止是找文件 Win 8搜索能做更多 电...
利用IN BOOLEAN MODE修改程序, MySQL 也可以执行布尔全文搜索: mysql SELECT * FROM articles WHERE MATCH (title,body) - AGAINST ('+MySQL -YourSQL' IN BOOLEAN MODE); +----+-----------------------+-------------------------------------+ | id | title | body ...
什么是?       什么是胎位不正?      胎位,通俗地来说就是胎儿在子宫内的位置。胎儿出生前在于宫里的姿势非常重要,它关系到孕妇是顺产还是难产。子宫内的胎儿是浸泡在羊水中的,由于胎儿头部比胎体重,所以胎儿多是头下臀上的姿势。 通常,医学上称枕前位为正常胎位,胎儿背朝前胸向后,两...

经验教程

612

收藏

93
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部