0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Markov的各种预测模型的原理与优缺点介绍

电子设计 作者:电子设计 2018-11-06 08:47 次阅读

建立有效的用户浏览预测模型,对用户的浏览做出准确的预测,是导航工具实现对用户浏览提供有效帮助的关键。

在浏览预测模型方面,很多学者都进行了卓有成效的研究。AZER提出了基于概率模型的预取方法,根据网页被连续访问的概率来预测用户的访问请求。SARUKKAI运用马尔可夫链进行访问路径分析和链接预测,在此模型中,将用户访问的网页集作为状态集,根据用户访问记录,计算出网页间的转移概率,作为预测依据。SCHECHTER构造用户访问路径树,采用最长匹配方法,寻找与当前用户访问路径匹配的历史路径,预测用户的访问请求。XU Cheng Zhong等引入神经网络实现基于语义的网页预取。徐宝文等利用客户端浏览器缓冲区数据,挖掘其中蕴含的兴趣关联规则,预测用户可能选择的链接。朱培栋等人按语义对用户会话进行分类,根据会话所属类别的共同特征,预测用户可能访问的文档。

在众多的浏览模型中,Markov模型是一种简单而有效的模型。Markov模型最早是ZUKERMAN等人于1999年提出的一种用途十分广泛的统计模型,它将用户的浏览过程抽象为一个特殊的随机过程——齐次离散Markov模型,用转移概率矩阵描述用户的浏览特征,并基于此对用户的浏览进行预测。之后,BOERGES等采用了多阶转移矩阵,进一步提高了模型的预测准确率。在此基础上,SARUKKAI建立了一个实验系统[9],实验表明,Markov预测模型很适合作为一个预测模型来预测用户在Web站点上的访问模式。

1 Markov模型

1.1 Markov模型

Markov预测模型对用户在Web上的浏览过程作了如下的假设。

假设1(用户浏览过程假设):假设所有用户在Web上的浏览过程是一个特殊的随机过程——齐次的离散Markov模型。即设离散随机变量的值域为Web空间中的所有网页构成的集合,则一个用户在Web中的浏览过程就构成一个随机变量的取值序列,并且该序列满足Markov性。

一个离散的Markov预测模型可以被描述成三元组,S代表状态空间;A是转换矩阵,表示从一个状态转换到另一个状态的概率;B是S中状态的初始概率分布。其中S是一个离散随机变量,值域为{x1,x2,…xn},其中每个xi对应一个网页,称为模型的一个状态。

Markov预测模型是一个典型的无后效性随机过程,也就是说模型在时刻t的状态只与它的前一个时刻t-1的状态条件相关,与以前的状态独立。即:

Markov的各种预测模型的原理与优缺点介绍

王实等提出一种新的基于隐马尔可夫模型的兴趣迁移模式发现方法,并利用用户迁移模式间的关联规则来发现兴趣迁移模式。而借助隐马尔可夫模型, 挖掘蕴涵在用户访问路径中的信息需求概念, 以此进行预取页面的评价, 也可以实现基于语义的网页预取。

隐Markov模型尽管考虑了用户兴趣,但和简单的Markov模型一样,存在一定的不足:用户访问序列串长是动态时变的,采用固定阶数的传统Markov链模型并不能准确地对用户的访问行为建模。

2.2 多Markov模型

虽然用户在Web空间的浏览过程是一个受浏览目的、文化背景、兴趣爱好等多种因素影响的复杂过程,有很多差异,然而观察大量用户的浏览过程可以发现,某些用户的浏览过程表现出相同或相近的特点,如他们浏览的网页基本相同,浏览各个网页的顺序相似等,这一现象引发了对Web用户分类的研究。通过对用户分类,同一类别的用户用同一个模型来描述它,而不同类别的用户其浏览过程差别较大,用不同的模型来描述他们的特征则更为合理。

假设2(用户分类假设):假设根据用户在Web空间的浏览特点,可以将所有用户分为K类。如果用C={c1, c2,…,ck}表示用户的类别,则任意一个用户属于类别ck的概率为P(C=ck),而且有:

Markov的各种预测模型的原理与优缺点介绍

上述模型称为二步Markov模型,它的核心任务是建立一个与一阶Markov模型的转移概率矩阵同规模的转移概率矩阵。矩阵的行元素代表用户浏览的上一个网页,列元素代表用户下一步可能浏览的网页。通过该矩阵可以根据用户上一步浏览的网页来预测下一步要浏览的网页。

Markov的各种预测模型的原理与优缺点介绍

在多Markov模型方面,刘业政等提出可变多阶Markov链模型VMOMC。VMOMC将用推荐目标网页概率值度量的可变多阶Markov链并行组合,组合模型中采用遗传算法确定各单阶Markov链模型的最优权重。陈佳提出了基于混合模型的一种挖掘用户群在页面上兴趣分布程度的模式发现,计算用户群从一个页面到另外一个页面的导航路径模式的概率大小,可得到大量的用户对所访问Web的兴趣及导航模式,从而预测用户的浏览路径。

2.4 结构相关性模型

有研究表明,用户在进行Web浏览的绝大部分时间里都是从当前页面中挑选一个链接继续浏览;在用户将来访问的网页中,46%能在最近3个网页的链接中找到,75%能在所有历史网页的链接中找到 。因此,可以认为用户将来的可能请求大部分存在于由当前页面上所有链接组成的集合中。基于结构相关性的一阶Markov模型包括以下三部分:

Markov的各种预测模型的原理与优缺点介绍

通过遍历用户访问序列的节点,可以得到用户的状态空间和转移情况,并最终建立上述模型。

结合页面内容及站点结构来调整状态转移矩阵,以获得更精确的预取结果,提高Web 服务的质量。而利用频繁访问模式树存储Markov链,能够大幅减小存储空间。

3 进一步研究的问题

尽管现有的Markov 浏览预测模型在预测准确率、覆盖率方面已取得较满意的成果,但浏览预测问题的实际应用背景中的一些特殊要求使得这一领域仍存在一些需要进一步研究的问题。这些问题包括:

(1)Markov转移概率矩阵的处理。该模型的存储空间主要用于保存状态转移概率矩阵,所以其存储空间的复杂度是网页数目n的平方,即为0(n)。由于n的值一般都比较大,存储复杂率较高。同时为了提高Web预取的命中率,常常联合多个Markov链模型,即用到了多阶状态转移矩阵,使得存储复杂率成倍提高。因此如何存储及处理Markov模型的概率矩阵、降低复杂度是急需解决的问题。此外,在很多情况下状态转移矩阵是稀疏矩阵,采用什么样的数据结构来存储这样的矩阵也是需要研究的课题。

(2)混合Markov模型的求解问题。混合Markov模型在预测用户的浏览行为方面越来越受到学者的重视。有效的模型求解方法,能大大提高模型的效率。虽有学者进行了有益的探索,但这方面的工作仍需要更多学者的参与。

(3)在实际浏览预测问题中,Markov的随机统计方法与其他方法,如神经网络、贝叶斯网络、聚类、关联规则、遗传算法等相结合能获得较高的预测准确率。

(4)用户在Web空间的浏览过程是一个受浏览目的、

文化背景、兴趣爱好等多种因素影响的复杂动态过程,如能有效地度量用户的浏览兴趣,并及时发现用户的兴趣迁移,对于提高预测准确率非常重要。此外,随着无线网络的普及,怎样预测无线网络环境下用户的浏览行为,是研究人员面临的又一个课题。

全文概述了基于Markov的各种预测模型,分析了各个模型的原理及优缺点,指出了今后的研究方向。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4769

    浏览量

    100685
  • 浏览器
    +关注

    关注

    1

    文章

    1022

    浏览量

    35322
  • 网页
    +关注

    关注

    0

    文章

    73

    浏览量

    19311
收藏 人收藏

    评论

    相关推荐

    天线各种材质的优缺点

    目前的工作需要接触到天线,但是对于天线基本上不了解。这些天从网上了解到天线的材质大概分为:弹片、PCB、FPC、陶瓷和LDS这几类,不知道这几种材质的优缺点都有哪些呢?
    发表于 01-28 16:18

    SPI协议的优缺点

    SPI协议介绍SPI协议的优缺点
    发表于 12-24 06:29

    LED技术的优缺点

    LED技术的优缺点介绍
    发表于 01-01 06:05

    SPICE模型有什么优缺点?如何合理的使用SPICE模型

    请问SPICE模型有什么优缺点?如何合理的使用SPICE模型
    发表于 04-13 06:59

    模型预测控制介绍

    这篇主要讲一下模型预测控制,如果对PID控制了解的同学,那效果更好。如果不了解PID控制,还是熟悉下比较好。模型预测控制,顾名思义,基于模型
    发表于 08-18 06:21

    基于Markov与MMTS的移动对象位置预测算法

    针对低阶Markov模型预测精度较差,以及多阶Markov模型预测稀疏率高的问题,提出一种基于
    发表于 12-25 15:00 0次下载

    卫星信道三状态Markov模型设计

    分布模型,引入三状态Markov过程实现因天气变化造成的信道状态的转换,构成卫星信道三状态Markov模型并对该模型的统计特性进行分析。最后
    发表于 12-25 15:25 1次下载
    卫星信道三状态<b class='flag-5'>Markov</b><b class='flag-5'>模型</b>设计

    各种电容的优缺点及应用场合和制作及温度系数免费下载

    本文档的主要内容详细介绍的是各种电容的优缺点及应用场合和制作及温度系数免费下载。
    发表于 10-09 08:00 36次下载
    <b class='flag-5'>各种</b>电容的<b class='flag-5'>优缺点</b>及应用场合和制作及温度系数免费下载

    西门子伺服电机各种型号的介绍优缺点有利于维修

    本文档的主要内容详细介绍的是西门子伺服电机各种型号的介绍优缺点有利于维修详细资料免费下载。
    发表于 11-09 08:00 12次下载

    如何使用Adaboost Markov模型进行移动用户位置预测方法的详细资料说明

    针对Markov模型在位置预测中存在预测精度不高及匹配稀疏等问题,提出了一种基于Adaboost-Markov
    发表于 03-28 11:29 12次下载
    如何使用Adaboost <b class='flag-5'>Markov</b><b class='flag-5'>模型</b>进行移动用户位置<b class='flag-5'>预测</b>方法的详细资料说明

    各种类型的混频器及优缺点

    在RF和微波设计中,混频是信号链最关键的部分之一。今天我们就讲讲各种类型的混频器以及各自的优缺点
    的头像 发表于 10-19 10:26 6574次阅读

    卷积神经网络模型优缺点

    卷积神经网络模型优缺点  卷积神经网络(Convolutional Neural Network,CNN)是一种从图像、视频、声音和一系列多维信号中进行学习的深度学习模型。它在计算机视觉、语音识别
    的头像 发表于 08-21 17:15 4389次阅读

    igbt的优缺点介绍

    igbt的优缺点介绍 IGBT的优缺点介绍 IGBT是一种晶体管,是MOSFET和BJT集成而成的开关,具有高速开关能力和较低的导通电阻,用于高效率的功率调节。IGBT具有一些优点和
    的头像 发表于 08-25 15:03 8310次阅读

    数学建模神经网络模型优缺点有哪些

    预测分析等。然而,神经网络模型也存在一些优缺点。本文将详细分析神经网络模型优缺点。 一、优点 强大的非线性拟合能力 神经网络
    的头像 发表于 07-02 11:36 887次阅读

    AI大模型与小模型优缺点

    在人工智能(AI)的广阔领域中,模型作为算法与数据之间的桥梁,扮演着至关重要的角色。根据模型的大小和复杂度,我们可以将其大致分为AI大模型和小模型。这两种
    的头像 发表于 07-10 10:39 2604次阅读