类化搜索结果

2011-05-11 21:53

对于搜索引擎而言,产品设计方案的关键因素是什么?个人以为,是最快最优地满足用户指定关键词的用户需求。

缘起

以“团购”为例,这样的关键词,内容性较强,用户想搜索的可能是:

  1. 一个具体团购网站
  2. 介绍“团购”这个活动,从最原始的线下团购到如今的线上团购
  3. 对“团购”这个现象的评价

等等。

像这样的关键词还有:

– 近视 近视是什么;怎么预防近视;近视手术的风险;哪些行业不能近视;近视的数据(青少年比例,国家比例)

– 世界杯 世界杯是什么;往届世界杯结果;未来的世界杯介绍;如果正在进行世界杯活动的话,还包括目前的进度、得分;某一场比赛的评价

– 苹果 一种水果的营养、食用建议;水果的价格浮动;一个公司的上市指数、文化;一款产品的价格、评价,比如Mac/iPad

思路

用户

从用户的角度来看,通过向搜索引擎提交关键词,来满足自己的信息需求。但是,用户成千上万,需求大相径庭,即便使用了较为恰当的关键词,也可能因为新闻、新词、转载等因素,造成结果歧义、重复。百度开放平台是解决这个问题的一大创新,但应用的规模有限;于是我琢磨,如何全局应用。

使用维基百科,尤其是在体验Quora后,我发现对索引的内容进行“话题识别”,进行类化和标签化,有助于对全局(而不仅仅是指定)搜索结果的精确定位。

产品

从产品的角度,用户打开百度,输入关键词,得到结果集的整个过程都应该尽可能理想的,而不仅仅针对结果集。用户能感受的“理想”主要来自网站的用户体验。

不要用户“等想烦”,要“快准狠”。

–  快速出现结果集,无需等待

–  精准类化、标签化,直击目标,无需用户多想结果集到底是指“四袋苹果”还是“苹果四代”

–  减少重复冗余网页,将最给力的内容最快推送到用户眼前(比如百度开放平台的应用,以及分类算法)

方案

类化方向

概念 提供网址导航。(比如“下载”提供主要下载站的网址)

内容 提供标签化指引的内容。(比如:“苹果”分为“一种水果”,“一个公司”等)

– 评论 针对关键词的评论内容(好差评)

评价办法

进行A/B测试,用数据分析用户对结果的满意度。A为旧版本,B为新版本,B结果出现后,可参考的数据有:

  • 点击第一个结果的时间。分析类化和标签化后,是否更有助于消除歧义,精确定位
  • 点击第二、三、四个结果的时间。分析第一个结果的精确度,以待优化排序和分类
  • 翻页数。分析第一页结果集的精确度
  • 版本切换量。分析新版本的接受程度
  • 搜集网友评价
  • 用户自主反馈
  • 调查问卷等线上线下调研

草稿-示意图

类化搜索结果示意图

类化搜索结果示意图

产品-示意图

duckduckgo.com已经实现了本功能,截图如下。

duckduckgo示意图

duckduckgo示意图

最后更新:2011年05月13日

8 条评论 / 引用:

  1. 匿名:

    感觉您现在演示的像是百度搜索框上的搜索分类。真做到对每个搜索词的精细化分类还是很难很难的吧。

  2. 小轰同学:

    @匿名
    嗯,自然语言处理还没有智能到这个地步。百度有“搜索分类”?是指网页、视频、文库吗?

  3. 匿名:

    呵呵 我是这个意思 表述的不太清楚 仅个人意见

  4. 草根网:

    好文,收藏至20ju.com

  5. 之由:

    这是一个技术活儿

  6. 互联网的一些事:

    好文章,转载到互联网的一些事(yixieshi.com)

  7. 类化搜索结果 « 太阳照常升起:

    […] View full post on 时光立方 […]

  8. a:

    a

评论

《对话守则》第一条:对话的目的是寻求真理。

以下选填: