本文的数据来自于一个软件认证培训中心网站, 研究的目的是通过 点击流认识到对站点最可能的浏览路径, 从而预测出用户将要浏览的网页, 并据此改善网站的设计和结构。本网站共有 个网页, 所有的数据都已经过预处理, 下面考虑用马尔可夫链模型建立事件序列的全局模型。中山网站建设

这种想法需要引进特定时间变量间的依赖。在每个会话中, 每个对应于第 次点击的时间点 , 对应有一个离散的随机变量, 这个随机变量的取值数量和网页数量一致, 这些称为链状态。在会话中观察的第 个网页, 可以在实现的马尔可夫链中在会话的时间 点处观测到。时间从变到 , 是极限值。一个会话可在 之前结束; 在这个案例中, 最后的网页是固定位置 。中山网站建设

马尔可夫链模型建立了在时间 之前浏览网页和在时刻 浏览的网页之间的随机依赖。可以通过一个网页单步到其他网页的概率矩阵的转化解决内存的不足。对于个网页, 这里就有 个这种概率。转换矩阵中的条件概率可以从已有的条件频率中计算得到。通过假设转换矩阵在时间上不变 (同质马尔可夫链) , 可以用任何两个邻近的时序点击的频率去估计条件概率。为了建立马尔可夫链模型 (第一阶并且同质的) , 需要重新组织数据, 建立一个称为 的新数据集合。中山网站建设

本文原创来自:http://www.bafangcn.com   所有标签 网站地图 内容订阅