马尔可夫决策过程模型

3。马尔可夫决策过程模型

本节介绍了MDP模型来确定相互制约的服务商到客户系统调度策略,分配区分服务器优先级的客户。医药科学的 MDP模型作为一个线性规划模型,以至于考虑与约束不可以添加扩展马尔可夫状态空间,从而允许有效的线性规划算法标识最佳相互制约政策。消费者要求达到的服务(病人),都有一个关联的位置和分为高优先级(H)或低优先级(L)。服务器救护车所分化他们的答复和服务时间。我们可以捕捉时间从一个服务器是派去当它到达现场,捕捉的总时间和服务时间为客户服务,包括响应客户时间,对待客户现场,运输一个客户去医院,并返回到服务。目标是确定哪些服务器调度到达客户最大化平均水平.总奖励每阶段给予最低标准股本。回复一个电话的奖励是解释作为高优先级客户的可能性是对一个固定的时间内一个RTT目标函数已经成为最好的效率的性能的措施,在EMS系统(McLay和马约加2010)。在模型中,客户根据到达泊松过程的速度。当一个客户到达时,其位置和优先级评估,和一家派往它可用的服务器。的模型使得几个假设:

1.如果客户和服务器可用,到达服务器必须派遣。

2。只有服务器-服务器位于他们家庭基站可以被派往客户。

3。一个服务器分配给每个客户。

4。然后服务器返回本站服务客户。

5。服务时间不依赖于客户优先权和指数分布。

6。有一个零长度队列为客户。

我们将讨论如何修改模型

电梯的假设和假设一个强大的影响产生的政策。需要服务器被派往客户如果服务器是可用非理想的政策合理,因为这里的模型是出于EMS体系中,为所有客户提供服务是一个主要的公共服务系统的目标。此外,由于担忧的责任,而不是保留是一种能力,嵌入在EMS调度和政策实践,约束的服务提供者。为了简单起见,所有服务器维修后返回本国驻地客户,当他们说为其他客户服务可用,服务器不能动态改航。在实践中,服务器可以从以外的地点派遣他们家电台,当服务器完整的服务。以允许救护车被派遣本国驻地以外的位置,可以扩大到包括状态空间辅助服务器的位置相对应服务器完成服务(见§3.1的讨论状态空间)。同样地,可以将状态空间扩大到包括辅助客户地点,对应一个服务器是谁前往客户允许服务器动态改航,直到它到达服务客户和位置,相对应的服务器正在接近尾声与另一个客户的服务。关于第五假设,尽管它将琐碎包含服务时间依赖于客户优先级,指数提升,因为我们假设是更难了必须扩大状态方程考虑non-Markov模型。我们承认这是一个强烈的假设。

队列长度为零的假设需要更深一层的讨论。请注意,客户只是失去当所有的服务器很忙,因此每种类型的客户丢失的速度相同进入系统。从温顺的角度看来,顾客队列的状态模型变得难以管理和调度,政策可能取决于客户的设置队列中。我们认为,长度为零的假设


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn