1.本技术属于通信技术领域,具体涉及一种切换方法、装置、通信设备及可读存储介质。
背景技术:
2.随着通信技术的发展,人工智能(artificial intelligence,ai)
模型逐渐成为网络架构不可缺少的一部分。在无线网络中,可以进行针对终端的业务模型的训练或者使用。在此模型训练或者使用的过程中,如果终端移动且连接的发生切换,则由于切换后的目标没有终端的模型信息,需要重新进行模型训练。但由于模型训练需要花费一定的时间,将会造成目标无法高效地利用模型进行业务处理。
技术实现要素:
3.本技术实施例的目的是提供一种切换方法、装置、通信设备及可读存储介质,以解决现有因终端移动而切换后的目标无法高效地利用模型进行终端业务处理的问题。
4.为了解决上述技术问题,本技术是这样实现的:
5.第一方面,提供了一种切换方法,应用于源,包括:
6.向目标发送第一切换消息;
7.其中,
所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型,所述目标根据所述第一模型的模型配置参数构建第二模型。
8.第二方面,提供了一种切换方法,应用于目标,包括:
9.从源接收第一切换消息;其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型;
10.根据所述模型配置参数,构建与所述第一模型相应的第二模型。
11.第三方面,提供了一种切换装置,应用于源,包括:
12.第一发送模块,用于向目标发送第一切换消息;
13.其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型,所述目标根据所述第一模型的模型配置参数构建第二模型。
14.第四方面,提供了一种切换装置,应用于目标,包括:
15.第二接收模块,用于从源接收第一切换消息;其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型;
16.构建模块,用于根据所述模型配置参数,构建与所述第一模型相应的第二模型。
17.第五方面,本技术实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤,或者如第二方面所述的方法的步骤。
18.第六方面,本技术实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤,或者如第二方面所述的方法的步骤。
19.在本技术实施例中,在终端发生间的切换时,通过源向目标发送第一切换消息,该第一切换消息中包括第一模型的模型配置参数,第一模型为源中训练的终端业务模型,可以使得目标根据接收到的模型配置参数,构建与第一模型相应的第二模型,并根据构建的第二模型进行相应的处理操作或者继续进行模型训练,而不是重新训练模型,减少模型训练时间和计算量,从而实现高效地进行终端业务处理。
附图说明
20.图1是本技术实施例提供的一种切换方法的流程图;
21.图2是本技术实施例中模型迁移的示意图;
22.图3是本技术实施例提供的另一种切换方法的流程图;
23.图4是本技术具体实施例中的切换过程的流程图;
24.图5是本技术实施例提供的一种切换装置的结构示意图;
25.图6是本技术实施例提供的另一种切换装置的结构示意图;
26.图7是本技术实施例提供的一种通信设备的结构示意图。
具体实施方式
27.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
28.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。
29.为了便于理解本技术实施例,首先说明以下内容。
30.迁移学习是将一任务开发的模型作为初始点,重新使用在为另一任务开发模型的过程中。针对迁移学习,具有两个基本概念:一个概念叫域(domain),另一个概念叫任务(task)。迁移学习可以定义为:给定了源域(source domain)、源任务(source task)、目标域(target domain)和目标任务(target task),利用源域在解决源任务时获得的一些知识来解决目标任务的一种算法。
31.模型迁移是迁移学习的一种方式,是利用模型之间存在的相似性关系,将模型参数迁移到新的模型来帮助新模型训练,从而加速模型的学习和优化。由此,将数据量
样本丰富的中训练出的模型,迁移到其他的中使用或再进行训练,可以充分利用迁移学习的优势,将学习的知识用来解决其它问题,提升模型训练的性能。
32.为了解决现有因终端移动而切换后的目标无法高效地利用模型进行终端业
务处理的问题,本技术实施例中引入了迁移学习,在源正在进行针对终端业务模型的训练或者使用的过程中,如果发送切换,则在源向目标发送的切换消息(比如切换请求消息)中携带第一模型的模型配置参数,第一模型为源中训练的终端业务模型,从而使得目标根据接收到的模型配置参数,构建与第一模型相应的第二模型,并根据构建的第二模型进行相应的处理操作或者继续进行模型训练,从而高效地进行终端业务处理。
33.可选的,本技术实施例适用的场景包括但不限于第5代(5
th generation,5g)通信系统,也可以用于其他通信系统,比如第6代(6
th generation,6g)通信系统等。
34.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的切换方法、装置、通信设备及可读存储介质进行详细地说明。
35.请参见图1,图1是本技术实施例提供的一种切换方法的流程图,该方法应用于源,如图1所示,该方法包括如下步骤:
36.步骤11:向目标发送第一切换消息。
37.本实施例中,第一切换消息中包括第一模型的模型配置参数。第一模型为源中训练的终端业务模型。模型配置参数用于目标构建与第一模型相应的第二模型,即,目标根据第一模型的模型配置参数构建相应的第二模型。
38.一些实施例中,第一切换消息为切换请求(如handover request)消息。
39.可理解的,第一模型和第二模型为不同的模型,分别位于源和目标。源即为迁移学习里面的源域,即提供模型参数的。目标即为迁移学习里面的目标域,即接受模型参数的。
40.一些实施例中,第一模型可选为针对终端业务数据的ai模型,比如流量预测模型、行动轨迹预测模型等。
41.一些实施例中,第一切换消息可以通过源和目标之间的xn接口传输。
42.一些实施例中,如图2所示,当用户设备(user equipment,ue)因位置移动从源切换到目标时,源可以通过切换请求将其训练模型的模型配置参数发送给目标,以使目标构建相应模型供使用。
43.本技术实施例的切换方法,在终端发生间的切换时,通过源向目标发送第一切换消息,该第一切换消息中包括第一模型的模型配置参数,第一模型为源中训练的终端业务模型,可以使得目标根据接收到的模型配置参数,构建与第一模型相应的第二模型,并根据构建的第二模型进行相应的处理操作或者继续进行模型训练,而不是重新训练模型,减少模型训练时间和计算量,从而实现高效地进行终端业务处理。
44.一具体应用场景中,当进行针对ue业务数据的ai模型训练或推理时,会将相关决策结果或者参数传输给ue,以此来提升ue的通信性能。在ue发生移动时,为了保证目标高效地利用模型进行业务处理,需要源将其训练的模型迁移到目标。比如,通过训练流量预测模型实现流量预测,以满足用户的多样化需求的ai能力。若ue发生移动,即ue从一个切换到相邻,则ue位置的改变会使源中正在进行的模型训练或推理中断,而目标由于没有所需要的模型参数,需要重新训练模型,从而影响了预测流量的效率。此时,源可以将其训练模型的模型配置参数传输给目标,以使目标基于收到的模型配置参数构建相应的流量预测模型并使用,从而提高流量的预测效率。
45.本技术实施例中,源发送的第一切换消息中包括的模型配置参数可以包括但不限于第一模型的以下至少一项:
46.(1)模型结构配置信息(model structure configuration);比如,模型结构配置信息可以包括当前结构所处神经网络的层数n、每种网络结构的计算规则以及自定义每种网络结构类别的配置参数等。
47.(2)模型训练参数(model parameter),即源中训练模型的参数。
48.(3)输入样本类别(input sample dimension);比如,输入样本类别可以包括几种类型的样本和每种类型样本的类型定义。
49.比如,以流量预测模型为例,输入样本类别可以包括数据流量矩阵序列、ue历史流量和业务包的大小等。
50.(4)训练任务(training mask);其中,训练任务用于区分当前的模型是哪种任务场景中训练完成的。比如,训练任务为流量预测,则当前训练出的模型和参数适用于流量预测中。
51.(5)损失函数(loss function),用来估量模型的预测值与真实值的不一致程度。
52.比如,损失函数可选为均方差损失函数、交叉熵损失函数和/或平滑smooth l1损失函数等。
53.(6)超参数(hyper parameters),在开始模型训练过程之前设置值的参数。
54.可选的,上述超参数(hyper parameters)可以包括但不限于以下参数至少一项:
55.1)最大训练轮数(epoch)n:将对全部训练样本训练一次的过程记为单次训练,当训练次数达到n时,即可以停止训练。如,流量预测模型训练到epoch的轮数时就停止训练。
56.2)当前训练轮数(current training epoch)n:训练到目前为止的轮数,比如,ue切换之前流量预测模型训练的轮数。
57.3)每批次训练的样本个数(batchsize):每次训练时会选取batchsize个样本进行训练,每batchsize个样本更新一次模型的权值。
58.4)梯度阈值(gradient threshold):当梯度大于阈值时可以将其变成到阈值进行参数更新计算。
59.5)学习率(learning rat):控制模型学习快慢的参数。
60.6)损失函数的参数(loss function parameter):损失函数上的可调参数。
61.7)优化器(optimizer):用来更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化(或最大化)损失函数,比如为sgd、adagrad、rmsprop等。
62.8)正则化(regularization):用于对学习算法的修改,旨在减少泛化误差而不是训练误差,比如l1范数、l2范数等。
63.本技术实施例中,上述的第一模型可以是源中已训练好的模型,也可以是源中正在训练的模型。由此,为了方便目标获知第一模型的状态,源发送的第一切换消息中还可以包括第一指示位,第一指示位用于指示第一模型处于使用状态,比如推理状态/预测状态等,或者,第一指示位用于指示第一模型处于训练状态。比如,当第一指示位标记为0时,可以指示相应模型处于使用状态;或者,当第一指示位标记为1时,可以指示相应模型处于训练状态。
64.这样,当第一指示位指示第一模型处于使用状态时,目标在构建与第一模型
相应的第二模型之后,可以直接利用第二模型进行相应的处理操作;或者,当第一指示位指示第一模型处于训练状态时,目标在构建与第一模型相应的第二模型之后,需要继续对第二模型进行训练。
65.可选的,当第一指示位指示第一模型处于训练状态或使用状态,且目标中不具有所需的样本数据时,目标可以请求获得所需的样本数据。此情况下,源在向目标发送第一切换消息之后,可以从目标接收第二切换消息该第二切换消息中包括:对模型配置参数的确认信息以及目标所需的样本类别;然后,向终端发送目标所需的样本类别,由终端将与所需的样本类别对应的样本数据发送给目标。这样,目标在接收到样本数据之后,即可对构建的第二模型进行训练,或者根据第二模型对样本数据进行处理操作。
66.一些实施例中,第二切换消息可选为切换请求确认(如handover request ack)消息。
67.一些实施例中,无论第一模型即源中训练的模型是处于使用状态还是处于训练状态,第一模型的模型配置参数可以增加至切换请求(如handover request)消息的ie信息中进行传输,用于实现ue移动时间的模型迁移。更具体的,可以在切换请求(如handover request)消息中新增迁移管理ai模型(mobile management ai model)信息,并将模型配置参数包含在mobile management ai model信息中传输。
68.一些实施例中,对接收到的模型配置参数的确认反馈信息以及目标所需的样本类别可以增加至切换请求确认(如handover request ack)消息的ie信息中进行传输。
69.一些实施例中,源发送给终端的目标所需的样本类别(required sample category)可以增加至无线资源控制rrc重配置消息的ie信息中进行传输。
70.请参见图3,图3是本技术实施例提供的一种切换方法的流程图,该方法应用于目标,如图3所示,该方法包括如下步骤:
71.步骤31:从源接收第一切换消息。
72.本实施例中,第一切换消息中包括第一模型的模型配置参数。第一模型为源中训练的终端业务模型。模型配置参数用于目标构建与第一模型相应的第二模型。比如,第一切换消息为切换请求(如handover request)消息。
73.步骤32:根据模型配置参数,构建与第一模型相应的第二模型。
74.可理解的,第一模型和第二模型为不同的模型,分别位于源和目标。源即为迁移学习里面的源域,即提供模型参数的。目标即为迁移学习里面的目标域,即接受模型参数的。
75.本技术实施例的切换方法,在终端发生间的切换时,通过从源接收第一切换消息,该第一切换消息中包括第一模型的模型配置参数,第一模型为源中训练的终端业务模型,并根据模型配置参数,构建与第一模型相应的第二模型,可以使得目标根据构建的第二模型进行相应的处理操作或者继续进行模型训练,而不是重新训练模型,减少模型训练时间和计算量,从而实现高效地进行终端业务处理。
76.可选的,上述的第一模型可以是源中已训练好的模型,也可以是源中正在训练的模型。由此,源发送的第一切换消息中还可以包括第一指示位,第一指示位用于指示第一模型处于使用状态,比如推理状态/预测状态等,或者,第一指示位用于指示第
一模型处于训练状态。比如,当第一指示位标记为0时,可以指示相应模型处于使用状态;或者,当第一指示位标记为1时,可以指示相应模型处于训练状态。
77.可选的,当第一指示位指示第一模型处于训练状态或使用状态,且目标中不具有所需的样本数据时,目标在接收第一切换消息之后,可以向源发送第二切换消息,该第二切换消息中包括对模型配置参数的确认信息以及目标所需的样本类别,由源将该样本类别发送给终端,然后,从终端接收与样本类别对应的样本数据,并利用样本数据训练第二模型,或者根据第二模型对样本数据进行处理操作。比如,第二切换消息为切换请求确认消息。
78.可选的,在构建与第一模型相应的第二模型之后,目标可以利用第二模型进行相应的处理操作,或者,可以将第二模型作为预训练模型继续进行模型训练,从而使得目标缩短训练时间,加快收敛速度,训练出更精准的模型参数。
79.可选的,上述模型配置参数可以包括但不限于第一模型的以下至少一项:
80.模型结构配置信息;
81.模型训练参数;
82.输入样本类别;
83.训练任务;
84.损失函数;
85.超参数。
86.需指出的,本实施例中模型配置参数所包括的具体内容可以参见上述实施例中所述,为避免重复限定,在此不再赘述。
87.下面结合图4对本技术具体实例中的切换过程进行说明。
88.本技术具体实例中,以训练任务为流量预测为例,如图4所示,切换过程包括如下步骤:
89.步骤41:在源gnb进行流量预测模型的训练或者使用的过程中,终端位置发生移动,源gnb发起切换并通过xn接口向目标gnb发出切换请求(如handover request)消息。其中,源gnb在request消息中除了携带目标gnb准备切换所需的信息外,还需携带流量预测模型的模型配置参数。
90.步骤42:目标gnb根据接收到的模型配置参数,构建相应的流量预测模型,以进行流量预测或者继续模型训练。
91.可选的,根据源中流量预测模型所处的状态,即为使用/推理状态或者训练状态,上述request消息中还可以包括第一指示位(或称为训练/推理指示位),用于指示流量预测模型处于推理状态或者训练状态。其中,当第一指示位指示流量预测模型处于推理状态时,模型配置参数可以包括但不限于以下参数中的至少一项:模型结构配置信息、模型训练参数、输入样本类别和训练任务等,以完成模型的参数传递。
92.或者,当第一指示位指示流量预测模型处于训练状态时,模型配置参数可以包括但不限于以下参数中的至少一项:模型结构配置信息、模型训练参数、输入样本类别、训练任务、损失函数和超参数等,以完成迁移模型的继续训练。超参数可以包括但不限于以下至少一项:学习率,梯度阈值,每次训练的样本个数,最大训练轮数、优化器、当前的训练轮数、损失函数的参数、正则化等。
93.可选的,若需要对构建的流量预测模型进行训练,则目标gnb会判断其是否具有所需要的样本数据,若不具有所需要的样本数据,则可以通过如下步骤43和步骤44传输需要采集ue历史流量数据,并通过步骤45传输ue历史流量数据,完成后续的训练或推理。若具有所需要的样本数据,则直接将样本数据输入到模型中,进行模型训练或推理。
94.步骤43:目标gnb执行准切入控制,通过切换请求确认(如handover request acknowledge)消息对源gnb传输的信息进行确认,并携带目标gnb必要的rrc配置参数。若目标不具有所要求的样本数据,则还需携带目标需要收集ue的样本类别。
95.步骤44:源gnb通过rrc信令(如rrc重配置reconfiguration)向ue发送非接入层(non-access stratum,nas)的切换命令(如handover command),其中包含目标gnb的rrc配置和目标需要收集的样本类别(如目标不具有所要求的样本数据)。
96.步骤45:ue切换到新小区,通过rrc重配置完成(如rrc reconfiguration complete)消息通知目标gnb rrc连接完成。其中,若目标不具有所要求的样本数据,则ue将根据接收到的样本类别传输样本数据给目标gnb,以使目标gnb将接收到的样本数据输入到已构建的模型中,继续模型训练或进行推理。
97.可选的,若第一指示位指示流量预测模型处于推理状态,则目标gnb在构建模型之后,可以将样本数据输入模型之中进行推理,预测ue的流量使用情况。输出预测结果后,目标gnb可以依据预测出的结果修改网络配置,可能包括带宽分配等,提高用户使用性能。若预测出数据并不准确,则可以对模块进行迭代更新,直到达到预期效果或者收敛门限。
98.可选的,若第一指示位指示流量预测模型处于训练状态,则目标gnb在构建模型之后,可以将样本数据输入模型之中进行训练,通过不断的前向传播与反向传播,进行模型优化更新。比如若模型进行第n次训练,目标gnb会进行第n次前向传播,根据损失函数计算梯度的下降方向,进行反向传播,计算神经网络每层新的权重,然后进行n+1次的前向推理。不断的重复上述流程,直到当前的训练轮数达到最大训练轮数或者收敛的门限时,停止训练,完成模型的优化。
99.需要说明的是,本技术实施例提供的切换方法,执行主体可以为切换装置,或者该切换装置中的用于执行切换方法的控制模块。本技术实施例中以切换装置执行切换方法为例,说明本技术实施例提供的切换装置。
100.请参见图5,图5是本技术实施例提供的一种切换装置的结构示意图,该装置应用于源,如图5所示,切换装置50包括:
101.第一发送模块51,用于向目标发送第一切换消息;
102.其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型,所述目标根据第一模型中的模型配置参数构建相应的第二模型。
103.可选的,所述第一切换消息中还包括第一指示位,所述第一指示位用于指示所述第一模型处于使用状态,或者,所述第一指示位用于指示所述第一模型处于训练状态。
104.可选的,切换装置50还包括:
105.第一接收模块,用于当所述第一指示位指示所述第一模型处于训练状态或使用状态,且所述目标中不具有所需的样本数据时,从所述目标接收第二切换消息;其中,所述第二切换消息中包括:所述目标所需的样本类别;
106.第二发送模块,用于向终端发送所述目标所需的样本类别,由所述终端将与所述样本类别对应的样本数据发送给所述目标。
107.可选的,所述模型配置参数包括所述第一模型的以下至少一项:
108.模型结构配置信息;模型训练参数;输入样本类别;训练任务;损失函数;超参数。
109.本技术实施例的切换装置50,可以实现上述图1所示的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
110.请参见图6,图6是本技术实施例提供的一种切换装置的结构示意图,该装置应用于目标,如图6所示,切换装置60包括:
111.第二接收模块61,用于从源接收第一切换消息;其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型;
112.构建模块62,用于根据所述模型配置参数,构建与所述第一模型相应的第二模型。
113.可选的,所述第一切换消息中还包括第一指示位,所述第一指示位用于指示所述第一模型处于使用状态,或者,所述第一指示位用于指示所述第一模型处于训练状态。
114.可选的,切换装置60还包括:
115.第三发送模块,用于当所述第一指示位指示所述第一模型处于训练状态或使用状态,且所述目标中不具有所需的样本数据时,向所述源发送第二切换消息;其中,所述第二切换消息中包括所述目标所需的样本类别,由所述源将所述样本类别发送给终端;
116.第三接收模块,用于从所述终端接收与所述样本类别对应的样本数据;
117.处理模块,用于利用所述样本数据训练所述第二模型,或者基于所述第二模型对所述样本数据进行处理操作。
118.可选的,切换装置60还包括:
119.执行模块,用于执行以下至少一项:
120.利用所述第二模型进行相应的处理操作;
121.将所述第二模型作为预训练模型继续进行模型训练。
122.可选的,所述模型配置参数包括所述第一模型的以下至少一项:
123.模型结构配置信息;模型训练参数;输入样本类别;训练任务;损失函数;超参数。
124.本技术实施例的切换装置60,可以实现上述图3所示的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
125.此外,如图7所示,本技术实施例还提供一种通信设备70,包括处理器71,存储器72,存储在存储器72上并可在处理器71上运行的程序或指令,例如,该通信设备70为源时,该程序或指令被处理器71执行时实现上述图1所示的切换方法实施例的各个过程;或者,该通信设备70为目标时,该程序或指令被处理器71执行时实现上述图3所示的切换方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
126.本技术实施例还提供了一种可读存储介质,其上存储有程序或指令,所述程序或指令被处理器执行时可实现上述图1所示的切换方法实施例的各个过程,或者实现上述图3所示的切换方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
127.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方
法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
128.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
129.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
130.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台服务分类设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。
131.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
技术特征:
1.一种切换方法,应用于源,其特征在于,包括:向目标发送第一切换消息;其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型,所述目标根据所述第一模型的模型配置参数构建第二模型。2.根据权利要求1所述的方法,其特征在于,所述第一切换消息中还包括第一指示位,所述第一指示位用于指示所述第一模型处于使用状态,或者,所述第一指示位用于指示所述第一模型处于训练状态。3.根据权利要求2所述的方法,其特征在于,当所述第一指示位指示所述第一模型处于训练状态或使用状态,且所述目标中不具有所需的样本数据时,所述方法还包括:从所述目标接收第二切换消息;其中,所述第二切换消息中包括:所述目标所需的样本类别;向终端发送所述目标所需的样本类别,由所述终端将与所述样本类别对应的样本数据发送给所述目标。4.根据权利要求1至3任一项所述的方法,其特征在于,所述模型配置参数包括所述第一模型的以下至少一项:模型结构配置信息;模型训练参数;输入样本类别;训练任务;损失函数;超参数。5.一种切换方法,应用于目标,其特征在于,包括:从源接收第一切换消息;其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型;根据所述模型配置参数,构建与所述第一模型相应的第二模型。6.根据权利要求5所述的方法,其特征在于,所述第一切换消息中还包括第一指示位,所述第一指示位用于指示所述第一模型处于使用状态,或者,所述第一指示位用于指示所述第一模型处于训练状态。7.根据权利要求6所述的方法,其特征在于,当所述第一指示位指示所述第一模型处于训练状态或使用状态,且所述目标中不具有所需的样本数据时,所述方法还包括:向所述源发送第二切换消息;其中,所述第二切换消息中包括所述目标所需的样本类别,由所述源将所述样本类别发送给终端;从所述终端接收与所述样本类别对应的样本数据,并利用所述样本数据训练所述第二模型,或者基于所述第二模型对所述样本数据进行处理操作。8.根据权利要求5所述的方法,其特征在于,所述构建与所述第一模型相应的第二模型之后,所述方法还包括以下至少一项:利用所述第二模型进行相应的处理操作;将所述第二模型作为预训练模型继续进行模型训练。
9.根据权利要求5至8任一项所述的方法,其特征在于,所述模型配置参数包括所述第一模型的以下至少一项:模型结构配置信息;模型训练参数;输入样本类别;训练任务;损失函数;超参数。10.一种切换装置,应用于源,其特征在于,包括:第一发送模块,用于向目标发送第一切换消息;其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型,所述目标根据所述第一模型的模型配置参数构建第二模型。11.根据权利要求10所述的装置,其特征在于,所述第一切换消息中还包括第一指示位,所述第一指示位用于指示所述第一模型处于使用状态,或者,所述第一指示位用于指示所述第一模型处于训练状态。12.根据权利要求11所述的装置,其特征在于,所述装置还包括:第一接收模块,用于当所述第一指示位指示所述第一模型处于训练状态或使用状态,且所述目标中不具有所需的样本数据时,从所述目标接收第二切换消息;其中,所述第二切换消息中包括:所述目标所需的样本类别;第二发送模块,用于向终端发送所述目标所需的样本类别,由所述终端将与所述样本类别对应的样本数据发送给所述目标。13.根据权利要求10至12任一项所述的装置,其特征在于,所述模型配置参数包括所述第一模型的以下至少一项:模型结构配置信息;模型训练参数;输入样本类别;训练任务;损失函数;超参数。14.一种切换装置,应用于目标,其特征在于,包括:第二接收模块,用于从源接收第一切换消息;其中,所述第一切换消息中包括第一模型的模型配置参数,所述第一模型为所述源中训练的终端业务模型;构建模块,用于根据所述模型配置参数,构建与所述第一模型相应的第二模型。15.根据权利要求14所述的装置,其特征在于,所述第一切换消息中还包括第一指示位,所述第一指示位用于指示所述第一模型处于使用状态,或者,所述第一指示位用于指示所述第一模型处于训练状态。16.根据权利要求15所述的装置,其特征在于,所述装置还包括:第三发送模块,用于当所述第一指示位指示所述第一模型处于训练状态或使用状态,
且所述目标中不具有所需的样本数据时,向所述源发送第二切换消息;其中,所述第二切换消息中包括所述目标所需的样本类别,由所述源将所述样本类别发送给终端;第三接收模块,用于从所述终端接收与所述样本类别对应的样本数据;处理模块,用于利用所述样本数据训练所述第二模型,或者基于所述第二模型对所述样本数据进行处理操作。17.根据权利要求14所述的装置,其特征在于,所述装置还包括:执行模块,用于执行以下至少一项:利用所述第二模型进行相应的处理操作;将所述第二模型作为预训练模型继续进行模型训练。18.根据权利要求14至17任一项所述的装置,其特征在于,所述模型配置参数包括所述第一模型的以下至少一项:模型结构配置信息;模型训练参数;输入样本类别;训练任务;损失函数;超参数。19.一种通信设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-4任一项所述的切换方法的步骤,或者如权利要求5-9任一项所述的切换方法的步骤。20.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-4任一项所述的切换方法的步骤,或者如权利要求5-9任一项所述的切换方法的步骤。
技术总结
本申请公开了一种切换方法、装置、通信设备及可读存储介质,属于通信技术领域。具体实现方案包括:源向目标发送第一切换消息;该第一切换消息中包括第一模型的模型配置参数,第一模型为源中训练的终端业务模型,目标根据第一模型的模型配置参数构建第二模型。由此,可以使得目标借助构建的第二模型高效地进行终端业务处理。第二模型高效地进行终端业务处理。第二模型高效地进行终端业务处理。
技术研发人员:
孙欣 王莹莹 李娜 赵芸 张慧敏 孙军帅 刘光毅
受保护的技术使用者:
中国移动通信集团有限公司
技术研发日:
2021.08.27
技术公布日:
2023/3/2