一种景区游玩路径规划方法及系统

阅读: 评论:0



1.本发明属于景区管理技术领域,尤其涉及一种景区游玩路径规划方法及系统。


背景技术:



2.近年来,随着我国综合实力的不断增强带动着各大领域都在不断的提高,可以看见在旅游业出现的极大需求。在全国各地的动物园区、植物园区、名人故里、博物馆、各大展览等等景区,都涌现了巨大的人流量。然而,随着游客需求的不断增加,前来的游客不知道如何制定游玩路线,更好的体验到自己想要体验到的特,甚至容易迷路。
3.在这样的情景之下,游客对景区游玩规划的需求不断增大。基于此,本技术提出了一种景区游玩路径规划方法及系统。


技术实现要素:



4.本发明实施例的目的在于提供一种景区游玩路径规划方法及系统,旨在解决背景技术中确定的现有技术存在的技术问题。
5.本发明实施例是这样实现的,一种景区游玩路径规划方法,所述方法包括以下步骤:获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;获取游客特征数据,所述游客特征数据用于表征游客画像信息;将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据;将所述游客兴趣地特征数据输入至预设的lstm神经网络模型中,输出预测兴趣地poi值;根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划。
6.本发明实施例的另一目的在于提供一种景区游玩路径规划系统,所述系统包括:景区环境特征数据获取模块,用于获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;游客特征数据获取模块,用于获取游客特征数据,所述游客特征数据用于表征游客画像信息;游客兴趣地特征数据获取模块,用于将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据;预测兴趣地poi值输出模块,用于将所述游客兴趣地特征数据输入至预设的lstm神经网络模型中,输出预测兴趣地poi值;以及游玩路径规划模块,用于根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划。
7.本发明实施例的有益效果是:在执行强化学习策略时,考虑了游客的各项特征(游
客画像),实现目标多样化,可完成个性化的路径规划,使用户整体体验最大化。
附图说明
8.图1为本发明实施例提供的一种景区游玩路径规划方法的流程图;图2为本发明实施例提供的获取游客特征数据的流程图;图3为本发明实施例提供的反向优化bp神经网络模型的示意图;图4为本发明实施例提供的完成游玩路径规划的示意图;图5为本发明实施例提供的反向优化bp神经网络模型的流程图;图6为本发明实施例提供的一种景区游玩路径规划方法的结构示意图;图7为本发明实施例提供的游客特征数据获取模块的结构示意图;图8为本发明实施例提供的预测兴趣地poi值输出模块的结构示意图;图9为本发明实施例提供的游玩路径规划模块的结构示意图;图10为一个实施例中计算机设备的内部结构框图。
具体实施方式
9.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
10.如图1所示,在一个实施例中,提出了一种景区游玩路径规划方法,具体可以包括以下步骤:步骤s100,获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息。
11.本发明实施例中,确定景区环境特征数据的目的,在于方便后续的路径规划,含有景点属性的地图信息,可以基于现有的电子地图生成,当然电子地图中需要包含有各个景点的位置标记、游玩项目、人文类别等属性信息。
12.步骤s200,获取游客特征数据,所述游客特征数据用于表征游客画像信息。
13.本发明实施例中,游客画像信息是根据游客社会属性、生活习惯和消费行为等主要信息数据而抽象出的一个标签化的游客模型,其可以在一定程度上表征游客的兴趣爱好,与景区环境特征数据存在一个相互吸引的关系。
14.步骤s300,将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据。
15.本发明实施例中将景区环境特征数据和游客特征数据作为模型的输入,通过bp算法输出的游客兴趣地特征数据,此处bp神经网络模型在训练时,会通过误差反向传播不断迭代调整权值,使输出值与期望值贴合。由于景区环境特征数据和游客特征数据存在一个相互吸引的关系,通过bp神经网络模型,可以得到更真实的游客兴趣地特征数据。
16.具体的来说,景区环境特征数据和游客特征数据作为模型的输入,确定网络输入层节点数为n,设输入数据为;在训练时,设置bp神经网络模型的隐藏层节点个数为l,输出层节点个数为m,输入
层到输出层两层节点互相连接,权值初始化为[-0.1,0.1]之间的一个随机小数。隐藏层与输出层每个节点均有一个阈值和一个激励函数g(x),阈值用表示,其中激励函数g(x)取sigmoid函数,表示为:设隐藏层输出为,输入层到隐含层的偏置为,则隐藏层输出表示为:设输出层输出为,隐含层到输出层的偏置为,则输出层输出表示为:权值的更新公式为:偏置的更新公式为:其中,表示学习效率,表示误差,通过正向传播和反向传播,利用梯度下降法,得到最优的权值和阈值,其中反向传播通过误差,不断逐层修改权值和阈值,使误差平方和减小。
[0017]
确定算法是否符合迭代结束条件,如果符合则完成bp神经网络模型的训练,此时输入景区环境特征数据和游客特征数据,即可得到游客兴趣地特征数据。
[0018]
步骤s400,将所述游客兴趣地特征数据输入至预设的lstm神经网络模型中,输出预测兴趣地poi值。
[0019]
本发明实施例中,对于lstm神经网络模型,其通过前向计算和反向计算,计算遗忘门、输入门、输出门,通过反向计算每个神经元的误差项值,计算每个权重的梯度,解决梯度消失的问题。
[0020]
具体的,设输入门为,接受当前输入,根据上一时刻输出,输入门表示
为:式中,为偏置项,为sigmoid函数,为权重矩阵;得到的结果中,0表示当前输入的任何信息都不会进入单位状态,反之,1表示当前输入的所有信息都将进入单位状态。
[0021]
然后,计算当前单元状态,生成候选值,则候选值表示为:式中,为该函数中的偏置项;设遗忘门为,的表达式为:式中,为权重矩阵,为该函数中的偏置项;遗忘门为1表示着所有的信息都传播给,其中,和分别表示前一时刻和当前时刻的状态信息。
[0022]
结合上述步骤,就可以丢掉不需要的信息,然后添加新信息:最后,进行lstm神经网络模型的最后状态的计算:的计算:其中,为输出门,为权重矩阵,为偏置。
[0023]
步骤s500,根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划。
[0024]
本发明实施例中,在执行强化学习策略时,考虑了游客的各项特征(游客画像),实现目标多样化,完成个性化的路径规划,使用户整体体验最大化。
[0025]
在一个实施例中,如图2所示,步骤s200具体可以包括以下步骤:步骤s201,向设定范围内的移动设备发送特征问询请求,所述特征问询请求中包含有年龄、人关系、收入和喜好指标的一种或多种。
[0026]
本发明实施例中,向设定范围内的移动设备发送特征问询请求的实现方式有多
种,例如可以在售票点位置或景区入口向该处游客推送特征问询请求。也可以通过向已经网络购票的游客推送特征问询请求,具体不做限定。游客推送特征问询请求或游客特征数据如下表所示:本发明实施例中,对于游客画像信息,存在不同指标,也不可能将全部指标均纳入游客人的特征指标。本发明采取的游客人的特征指标针对性更强,根据来景区的游客明显的特征和需求作为指标标准;主客观相结合,既反映游客的主观感受,同时考虑景区的客观满意度;可操作性强,评价指标具有实用和可推广的特点。
[0027]
步骤s202,接收移动设备反馈的特征问询响应。
[0028]
本发明实施例中,所述的移动设备可以为用户的手机、ipad等移动终端,具体不做限定。
[0029]
步骤s203,根据所述特征问询响应生成游客特征数据。
[0030]
在一个实施例中,如图3和图5所示,步骤s400之后,还执行以下步骤:步骤a,根据所述lstm神经网络模型的输出结果,确定所述输出结果与真实兴趣地的误差方程。
[0031]
本发明实施例中,生成误差方程的目的在于根据lstm神经网络模型的预测值与实际值之间的差异,去反向优化bp神经网络模型。设误差为e,lstm神经网络模型的预测值为,实际值为,记,则误差方程可以表示为。
[0032]
步骤b,对所述误差方程执行梯度下降策略。
[0033]
步骤c,根据所述误差方程梯度下降结果反向优化bp神经网络模型。
[0034]
本发明实施例中,误差方程越小,模型的鲁棒性就越好。本发明实施例就是通过不断的迭代计算,使用梯度下降的优化算法,使得误差方程越来越小,实现反向优化bp神经网络模型。
[0035]
在一个实施例中,如图4所示,步骤s500具体可以包括以下步骤:步骤s501,初始化环境状态和q函数各参数、游客初始位置和游客特征数据。
[0036]
本发明实施例中,所述环境状态包括执行动作、观测量和环境反馈,观测量由预测兴趣地poi值和游客当前体力值组成,预测兴趣地poi值、游客当前体力值分别为和。
[0037]
步骤s502,根据q函数执行动作并更新游客体力值,动作空间包括去往下一个兴趣景点、原地休息和结束。
[0038]
本发明实施例中,所述游客体力值可以根据游客画像信息来获取或者定义,由于本发明实施例中的游客画像信息中包含有游客年龄等指标,根据其可以判定游客体力值。
[0039]
步骤s503,获取游客对当前所述动作的满意度,得到真实的poi值。
[0040]
本发明实施例中,游客对当前所述动作的满意度的获取方式,可以通过接收用户评价的方式来获取,进一步的,优选可以通过前述发送问询请求的方式来获取,本发明实施例在此不进行多余限定。
[0041]
步骤s504,根据真实的poi值返回即时奖励。
[0042]
步骤s505,更新景点poi值与游客特征数据,根据神经网络再次输出预测兴趣地poi值。
[0043]
由于前述的真实的poi值会对之前输入的景点poi值与游客特征数据造成影响,此处根据真实的poi值对景点poi值与游客特征数据进行更新,以使得神经网络再次输出预测兴趣地poi值,此处的神经网络即为bp神经网络模型和lstm神经网络模型。
[0044]
步骤s506,重复执行动作并计算累计奖励。
[0045]
步骤s507,判定是否满足结束条件,所述结束条件为游客体力值低于设定阈值或步数超过设定阈值或到达闭馆时间。
[0046]
本发明实施例中,游客体力值低于设定阈值即游客体力耗尽,步数超过设定阈值事实上与游客体力值是相关的,即游客当天已行走超过设定步数,而到达闭馆时间是指景区达到关闭时间。
[0047]
步骤s508,更新q函数,输出游玩路径。
[0048]
本发明实施例中,q函数的更新采用贝尔曼迭代公式的方式来实现,如下式所示:。
[0049]
其中,为当前状态,为执行动作,为下一个状态,为下一个执行动作,为在当前状态上执行动作后转移到下一个状态得到的数值奖励。
[0050]
本发明实施例中,还提供了强化学习策略的训练过程,其具体如下:步骤s1,初始化环境状态和q函数各参数、游客初始位置和游客特征数据。
[0051]
步骤s2,根据q函数执行动作,其中,动作空间包括下一个兴趣点、原地休息、结束。
[0052]
步骤s3,更新游客体力值。
[0053]
步骤s4,返回即时奖励。
[0054]
步骤s5,计算累计奖励,作为游客整体体验。
[0055]
步骤s6,判断是否达到当前回合结束条件,所述结束条件为游客体力值低于设定阈值或步数超过设定阈值或到达闭馆时间。
[0056]
步骤s7,更新q函数。
[0057]
步骤s8,判断是否达到最大训练回合数。
[0058]
步骤s9,完成训练。
[0059]
在训练阶段,将预测兴趣地poi值当作为百分之百真实的poi值,即将预测兴趣地poi值作为真实的poi值。
[0060]
在一个实施例中,所述步骤s502具体可以包括以下步骤:定义奖励函数,所述奖励函数为游客去往下一个预测兴趣地时,奖励,其他动作奖励为0。
[0061]
奖励函数r的表达式为:定义游客体力恢复时间为,参数为,其中所述为0-1之间的随机数,则游客恢复的体力为为:。
[0062]
设单位距离的体力消耗为0.1,游客执行动作行走距离为,则游客当前体力值为:。当然在实际应用时,单位距离的体力消耗可以自行设定,本实施例在此不进行具体限定。
[0063]
如图6所示,在一个实施例中,提供了一种景区游玩路径规划系统,具体可以包括景区环境特征数据获取模块100、游客特征数据获取模块200、游客兴趣地特征数据获取模块300、预测兴趣地poi值输出模块400和游玩路径规划模块500。其中:所述景区环境特征数据获取模块100,用于获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;所述游客特征数据获取模块200,用于获取游客特征数据,所述游客特征数据用于表征游客画像信息;所述游客兴趣地特征数据获取模块300,用于将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据;所述预测兴趣地poi值输出模块400,用于将所述游客兴趣地特征数据输入至预设的lstm神经网络模型中,输出预测兴趣地poi值;以及
所述游玩路径规划模块500,用于根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划。
[0064]
如图7所示,在一个实施例中,所述游客特征数据获取模块200具体包括:特征问询请求发送单元201、特征问询响应接收单元202和游客特征数据生成单元203。其中:所述特征问询请求发送单元201,用于向设定范围内的移动设备发送特征问询请求,所述特征问询请求中包含有年龄、人关系、收入和喜好指标的一种或多种;所述特征问询响应接收单元202,用于接收移动设备反馈的特征问询响应;以及所述游客特征数据生成单元203,用于根据所述特征问询响应生成游客特征数据。
[0065]
如图8所示,在一个实施例中,所述系统还包括误差确定单元401、策略执行单元402和反向优化单元403。其中:所述误差确定单元401,用于根据所述lstm神经网络模型的输出结果,确定所述输出结果与真实兴趣地的误差方程;所述策略执行单元402,用于对所述误差方程执行梯度下降策略;所述反向优化单元403,用于根据所述误差方程梯度下降结果反向优化bp神经网络模型。
[0066]
如图9所示,在一个实施例中,所述游玩路径规划模块500具体可以包括初始单元501、动作执行单元502、真实poi值获取单元503、即时奖励计算单元504、数据更新单元505、迭代单元506、判定单元507和结果输出单元508。其中:初始单元501,用于初始化环境状态和q函数各参数、游客初始位置和游客特征数据。
[0067]
动作执行单元502,用于根据q函数执行动作并更新游客体力值,动作空间包括去往下一个兴趣景点、原地休息和结束。
[0068]
真实poi值获取单元503,用于获取游客对当前所述动作的满意度,得到真实的poi值。
[0069]
即时奖励计算单元504,用于根据真实的poi值返回即时奖励。
[0070]
数据更新单元505,用于更新景点poi值与游客特征数据,根据神经网络再次输出预测兴趣地poi值。
[0071]
迭代单元506,用于重复执行动作并计算累计奖励。
[0072]
判定单元507,用于判定是否满足结束条件,所述结束条件为游客体力值低于设定阈值或步数超过设定阈值或到达闭馆时间。
[0073]
结果输出单元508,用于更新q函数,输出游玩路径。
[0074]
图10示出了一个实施例中计算机设备的内部结构图。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现景区游玩路径规划方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行景区游玩路径规划方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0075]
本领域技术人员可以理解,图10中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0076]
在一个实施例中,本技术提供的景区游玩路径规划系统可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该景区游玩路径规划系统的各个程序模块,比如,图6所示的景区环境特征数据获取模块100、游客特征数据获取模块200、游客兴趣地特征数据获取模块300、预测兴趣地poi值输出模块400和游玩路径规划模块500。 各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本技术各个实施例的景区游玩路径规划方法中的步骤。
[0077]
例如,图10所示的计算机设备可以通过如图6所示的景区游玩路径规划系统中的景区环境特征数据获取模块100执行步骤s100。计算机设备可通过游客特征数据获取模块200执行步骤s200。计算机设备可通过游客兴趣地特征数据获取模块300执行步骤s300。
[0078]
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:步骤s100,获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;步骤s200,获取游客特征数据,所述游客特征数据用于表征游客画像信息;步骤s300,将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据;步骤s400,将所述游客兴趣地特征数据输入至预设的lstm神经网络模型中,输出预测兴趣地poi值;步骤s500,根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划。
[0079]
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:步骤s100,获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;步骤s200,获取游客特征数据,所述游客特征数据用于表征游客画像信息;步骤s300,将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据;步骤s400,将所述游客兴趣地特征数据输入至预设的lstm神经网络模型中,输出预测兴趣地poi值;步骤s500,根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划。
[0080]
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流
或者交替地执行。
[0081]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink) dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0082]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0083]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
[0084]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术特征:


1.一种景区游玩路径规划方法,其特征在于,所述方法包括以下步骤:获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;获取游客特征数据,所述游客特征数据用于表征游客画像信息;将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据;将所述游客兴趣地特征数据输入至预设的lstm神经网络模型中,输出预测兴趣地poi值;根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划。2.根据权利要求1所述的方法,其特征在于,所述获取游客特征数据,所述游客特征数据用于表征游客画像信息的步骤,具体包括:向设定范围内的移动设备发送特征问询请求,所述特征问询请求中包含有年龄、人关系、收入和喜好指标的一种或多种;接收移动设备反馈的特征问询响应;根据所述特征问询响应生成游客特征数据。3.根据权利要求1所述的方法,其特征在于,所述根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划的步骤,具体包括:初始化环境状态和q函数各参数、游客初始位置和游客特征数据;根据q函数执行动作并更新游客体力值,动作空间包括去往下一个兴趣景点、原地休息和结束;获取游客对当前所述动作的满意度,得到真实的poi值;根据真实的poi值返回即时奖励;更新景点poi值与游客特征数据,根据神经网络再次输出预测兴趣地poi值;重复执行动作并计算累计奖励;判定是否满足结束条件,所述结束条件为游客体力值低于设定阈值或步数超过设定阈值或到达闭馆时间;更新q函数,输出游玩路径。4.根据权利要求1所述的方法,其特征在于,将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据的步骤之后,还执行:根据所述lstm神经网络模型的输出结果,确定所述输出结果与真实兴趣地的误差方程;对所述误差方程执行梯度下降策略;根据所述误差方程梯度下降结果反向优化bp神经网络模型。5.根据权利要求3所述的方法,其特征在于,所述根据q函数执行动作并更新游客体力值,动作空间包括去往下一个兴趣景点、原地休息和结束的步骤,具体包括:定义奖励函数,所述奖励函数为游客去往下一个预测兴趣地时,奖励,其他动作奖励为0;定义游客体力恢复时间为,参数为,其中所述为0-1之间的随机数,则游
客恢复的体力为为:;设单位距离的体力消耗为0.1,游客执行动作行走距离为,则游客当前体力值为:。6.一种景区游玩路径规划系统,其特征在于,所述系统包括:景区环境特征数据获取模块,用于获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;游客特征数据获取模块,用于获取游客特征数据,所述游客特征数据用于表征游客画像信息;游客兴趣地特征数据获取模块,用于将所述景区环境特征数据和游客特征数据输入至预设的bp神经网络模型中,得到游客兴趣地特征数据;预测兴趣地poi值输出模块,用于将所述游客兴趣地特征数据输入至预设的lstm神经网络模型中,输出预测兴趣地poi值;以及游玩路径规划模块,用于根据所述预测兴趣地poi值执行强化学习策略,完成游玩路径规划。7.根据权利要求6所述的景区游玩路径规划系统,其特征在于,所述游客特征数据获取模块包括:特征问询请求发送单元,用于向设定范围内的移动设备发送特征问询请求,所述特征问询请求中包含有年龄、人关系、收入和喜好指标的一种或多种;特征问询响应接收单元,用于接收移动设备反馈的特征问询响应;以及游客特征数据生成单元,用于根据所述特征问询响应生成游客特征数据。8.根据权利要求6所述的景区游玩路径规划系统,其特征在于,还包括:误差确定单元,用于根据所述lstm神经网络模型的输出结果,确定所述输出结果与真实兴趣地的误差方程;策略执行单元,用于对所述误差方程执行梯度下降策略;反向优化单元,用于根据所述误差方程梯度下降结果反向优化bp神经网络模型。9.根据权利要求6所述的景区游玩路径规划系统,其特征在于,所述游玩路径规划模块包括:初始单元,用于初始化环境状态和q函数各参数、游客初始位置和游客特征数据;动作执行单元,用于根据q函数执行动作并更新游客体力值,动作空间包括去往下一个兴趣景点、原地休息和结束;真实poi值获取单元,用于获取游客对当前所述动作的满意度,得到真实的poi值;即时奖励计算单元,用于根据真实的poi值返回即时奖励;数据更新单元,用于更新景点poi值与游客特征数据,根据神经网络再次输出预测兴趣地poi值;迭代单元,用于重复执行动作并计算累计奖励;判定单元,用于判定是否满足结束条件,所述结束条件为游客体力值低于设定阈值或步数超过设定阈值或到达闭馆时间;
结果输出单元,用于更新q函数,输出游玩路径。10.根据权利要求9所述的景区游玩路径规划系统,其特征在于,所述动作执行单元包括:奖励函数定义子单元,用于定义奖励函数,所述奖励函数为游客去往下一个预测兴趣地时,奖励,其他动作奖励为0;游客体力恢复计算子单元,用于计算游客恢复的体力;游客当前体力值计算子单元,用于计算游客当前体力值。

技术总结


本发明适用于景区管理技术领域,提供了一种景区游玩路径规划方法及系统,所述方法包括以下步骤:获取景区环境特征数据;获取游客特征数据,所述游客特征数据用于表征游客画像信息;将所述景区环境特征数据和游客特征数据输入至预设的BP神经网络模型中,得到游客兴趣地特征数据;将所述游客兴趣地特征数据输入至预设的LSTM神经网络模型中,输出预测兴趣地POI值;根据所述预测兴趣地POI值执行强化学习策略,完成游玩路径规划,本发明实施例在执行强化学习策略时,考虑了游客的各项特征(游客画像),实现目标多样化,可完成个性化的路径规划,使用户整体体验最大化。使用户整体体验最大化。使用户整体体验最大化。


技术研发人员:

朱月欣 苏菡 张红杰

受保护的技术使用者:

四川师范大学

技术研发日:

2022.10.24

技术公布日:

2022/11/22

本文发布于:2022-11-27 09:22:33,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/2/7313.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   所述   游客   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图