广西大学
硕士学位论文
基于博弈论的P2P服务质量差异激励模型的研究
姓名:
陈志琦
申请学位级别:
硕士
专业:
计算机应用技术
指导教师:
苏德富
P2P网络是一种自组织、没有中央职权和基础设施的分布式系统,因为其参与的自发性和自治性,使P2P网络中资源的可用性有着极高的变数和不可预知性。且实际应用中,由于大多数自主的参与者因缺乏激励而不共享资源,传统的P2P系统(比如Napster, Gnutella等)广泛地出现Free-Riding问题,严重阻碍了P2P技术和应用的发展。由此引发了许多关于P2P激励机制方面的理论研究课题和商业计划。本文在对近年来使用经济学模型分配分布式系统资源的相关研究进行分析比较的基础上,借用经济学中的博弈均衡理论,提出一种基于服务质量差异的激励模型来提高P2P系统性能和效率。
本课题研究的主要内容包括以下几个方面:
一、 研究P2P网络底层架构,以Gnutella为原型,引入对等网专用
设备(Peer Server),为激励模型提供良好的底层网络平台。
二、 构建对等网文件共享系统的激励机制。这一部分首先分析了P2P网络中参与者之间对网络资源的竞争关系,并在非合作博弈Nash均衡理论框架下构造一个基于服务质量(QoS)差异的P2P激励模型。然后在改进后对等网络底层模型上,通过仿真实验分析激励机制下不同性质的用户采取不同策略时的均衡状态。
三、 借用分布式微观经济理论,将网络资源系统看成是一个价格随供求关系浮动的竞争市场,网络用户需要购买网络资源以满足个人的服务质量(QoS)。利用Flow Control技术模拟网络资源的分配优化过程,给出其仿真试验的测试结果及评价。
关键词:对等网 描述符 博弈论 纳什均衡 服务质量
P2P网络资源的特性:
l 异构性
l 动态性
l 自治性
Free-Riding问题
指用户只下载而不愿意上传文件的问题。Free-Riding定义为一个自私的个体有意识地拒绝为某个群体的共同利益自愿地贡献。
由此引 发 了许多关于P2P激励机制方面的理论研究课题和商业计划,提出P2P激励模型,向系统贡献资源的用户能从网络中得到相应的回报,激励用户共享资源以消除Free-Riding现象。目前比较普遍应用的两种激励模式是支付虚拟/真实的货币(Micro Currency)和提供差异服务质量(QoS)。
而在服务质量模式下运用经济学中的市场经济理论来解决P2P的分配问题己成为众多研究者所探讨的一个重要方向。在经济学模型中,资源代理被分为生产者和消费者两类。生产者的目标是获取最大的利益,而消费者的目标则是在自己的一些约束条件下(例如完成时间、预算等)获取尽可能多且好的资源来满足自己的需求。这两者之间的动态关系就可以使用己经充分研究、具有高度可扩展性的经济学模型来进行描述。对于将一些基本的经济学理论引入到分布式系统的资源管理中主要着重于将具体的资源管理场景抽象成数学模型,然后依据基本的经济学理论,例如一般均衡理论、Nash均衡、边际效用、用户偏好等,进行分析和模拟。
网络服务质量(Quality Of Service,简称QoS)定义为网络于用户之间以及网络上互相通信的用户之间关于信息传输与共享的质的约定。即指能够提供持续的、可预测的数据递交服务,满足用户需求。QOS要求应用、主机、网关等互相协调,网络各层自上而下以及从发送方到接收方沿途每个网络要素都有质量保证机制。
P2P网络对服务质量的要求
带宽
延时
延时抖动
包丢失率
n 访问和下载优先级
在P2P网络中提高QoS需要考虑以下方面:
QoS的分类和定义
准入控制和协商
资源预约
资源调度与管理
使用博弈论优化资源分配的策略
引入经济学:市场机制非常适合解决分布式资源配置问题。
引入博弈论:博弈是对战略相互作用的描述,它包括对参与人所能采取的行动的约束和参与人的兴趣,但不强调参与人实际采取的行动。解是对结果的系统描述,这种结果可能产生于一组博弈。博弈论给出各种博弈的合理解释并且考察他们的性质。
博弈论中一个代理被视为一个单体的、稳定的或者比较复杂的组织。博弈的重点在于参与者的竞价策略。参与者可以自行制定竞价策略,也可以参照其他参与者的价格来制定灵活多变的策略。换言之,博弈就是为了分析什么才是参与者的最佳选择。
博弈论的元素有参与者(players)、行动(action)、信,LA(information),策略(strategies),支付(payofs)、结果(outcome)和平衡(equilibria)。在给定参与者、行动和结果的前提下,各参与者根据可用信息选择自己的策略,该策略产生一个支付。
在博弈中,一个对策有以下几种基本要素:
(1 ) 参与者(players):参与者是博弈的决策主体行为。
(2) 策略(strategies):指每个参与者在对策中可以选择采用的行动方案,这个方案必须是一个完整的行动,而不是行动的某一步。每个参与者均有可供选择的多种策略。
(3) 支付或收益(payoffs):指一局博弈的得失。或者说是局中人从各种策略组合
中获得的效用,它是策略组合的函数。如果局中人得失的总和为零,则称这种对策为零和对策;否则,称为非零和博弈。
博弈和竞争均衡的区别在于:博弈论主要考虑决策主体在做出决策前企图获得其他参与人的行为信息,而竞争均衡假定每个参与任职对某些环境参数感兴趣(例如价格),即使这些参数是被全体参与人的行为所决定的。
纳什均衡是指博弈中的博弈方在策略选取时达到的这么一种状态:假设每一个博弈方都是理性人,已经选取了某策略的任一博弈方都不愿单独改变其策略,否则都只能是使得他的当前得益减少。
定义 1 :给定其它参与者的策略S,参与者i的最优反应记为,是指能给他带
来最大收益的策略,即(,)>=(,), != ;当每个参与者都选择了自己的最优反应策略,并且这些最优反应形成一个策略组合,便形成了纳什均衡。
定义 2 :一个策略组合=(,,?,)被称为纳什均衡是指:对于所有的i,有(,)>=(,), != 。
纳什均衡的思想就是,博弈的理性结局是这样一种策略组合,其中每个参与者选择的策略都已是对其它参与者所选策略的最优反应,所以,谁也没有积极性去选择其它策略。因为每一个参与者均不能因为单方面改变自己的策略而获利,于是谁也没有兴趣主动打破这种均衡。
P2P网络中的博弈论: 每个参与者都希望最大限度地从系统中获益,博弈双方对系统资源的竞争结果是稳定的,即Nash均衡。
Nash贡献:定义每个用户贡献的资源量。
价值矩阵:表示节点i的贡献对于节点j的价值。
差异服务概率函数:每个节点都根据其
他节点贡献了多少来回报它们。因此有一个服务概率函数。
效用函数:刻画用户对所得的服务质量的满意程度。