浅谈搜索引擎对用户行为的获取过程

用户在搜索引擎中的行为主要包括搜索具体表现就是点击。搜索是用户获取信息的过程,而点击是用户得到需要信息后的表现。用户的搜索及点击行为中蕴含着非常丰富,重要的信息,具体包括提交时间,关键字,和IP地址等等,搜索引擎通过对用户行为进行分析能进一步发掘用户的需求,提高搜索结果的精准度。

搜索时用户获取信息的途径,是搜索引擎最基本的功能。搜索引擎可以在用户的搜索行为中得知某一关键字被搜索的次数,从而发现新词汇及进一步了解用户的搜索习惯。由于语言是不断发展的,随着时间的推移会产生更多的新词汇。特别是在互联网环境中,某个热点的时间或新闻也有可能成为一个新的词语,像返利网站。

对搜索引擎而言,新生词主要是指搜索引擎词典里还没有的词汇,而且被频繁搜索。如果某一个关键字在搜索引擎词典里没有,就不会产生关键字。相应的,用户所查询的信息就得不到反馈。因此搜索引擎对新词汇的学习能力从一定程度上反映了搜索引擎对语言的理解能力,是衡量搜索引擎好坏的重要标准之一。搜索引擎会对用户查询日志进行分析,筛选出最为频繁的字或词汇。如果这个词不存在词典中,就将这个关键字将部分页面进行匹配,如果命中,则将其加入词典中。否则对下一个查询频繁的词进行匹配。

点击是用户得到信息后的表现。某一页面被频繁点击,说明该页面备受关注,所以这也是衡量页面相关性的一个重要补充。在同一关键字列表中,不同的用户会有不同选择,如果某个结果排在靠后却点击频率明显高于其它时,更能反应其相关性。搜索列表的排列被建立补偿机制,因为列表中的结果同样重要,为了公平起见,往往会对排名靠后的页面进行对应靠前页面的补偿值。