繁體
|
簡體
Sclub交友聊天~加入聊天室當版主
(檢舉)
分享
新浪微博
QQ空间
人人网
腾讯微博
Facebook
Google+
Plurk
Twitter
Line
標題:
[建站經驗]
搜索意图识别的3大方法及其优缺点分析
[打印本頁]
作者:
superman1024
時間:
2013-10-7 14:53
標題:
搜索意图识别的3大方法及其优缺点分析
1、词表穷举法:
最简单直接的方法,通过词表癿直接匹配来获取查询意图,也可加入适用于较为简单且查询较为集中的类别,比如电视台节目查询,节假日查询,餐馆查询等。
优缺点:
简单易实现,能很好癿解决高频词,但召回比较低,人工比例较高,且无法解决长尾查询词。
2、规则解析法:
适用于一些查询虽然不集中但非常符合规则的类别,通过规则解析查询来做意图识别和关键信息提取癿,比如汇率查询,计算器,度量衡等。
优缺点:
信息提取准确,配合简单类别识别模型可以得到较不错的识别精度,只适用规则性较强的类别。
3、统计模型分类法:
查询词分类:基于查询词本身的分类,也就是建立基于字面意思的统计分类模型。
查询词扩展分类:基于查询词的扩展信息的分类,也就是基于真是社会知识的分离,通常是搜索结果扩展。
优缺点:
实现较为复杂,数据获取困难,数据更新困难,但效果较好,稳定性好,通用性好,在持续更新语料的条件下,可以通过流程自动更新
歡迎光臨 SCLUB免費論壇申請-使用者論壇 (http://orzweb.net/discuz/)
Powered by Discuz! 7.2