多资源调度方法和装置

阅读：评论：0

著录项

申请号 CN201810145714.X
申请日 20180212
公开（公告）号 CN110166507A
公开日 20190823
申请（专利权）人北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
发明人鲁楠;王永亮;王科;何云龙;张志强
主分类号 H04L29/08
分类号
H04L29/08 G06F9/50
地址北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层
国省代码北京(11)
代理机构中原信达知识产权代理有限责任公司
代理人张一军;杨晓伟

摘要

本发明实施例公开了一种多资源调度方法和装置，涉及计算机技术领域。其中，该方法包括：接收任务请求：所述任务请求包括：网络申请参数、资源申请参数；根据所述网络申请参数、所述资源申请参数和当前集可用资源监控信息为任务分配资源和运行服务器；在以主机网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。通过以上步骤，能够为任务动态分配资源，支持多网卡的调度，实现了不同网卡间的自由切换。

权利要求



1.一种多资源调度方法，其特征在于，所述方法包括：

接收任务请求：所述任务请求包括：网络申请参数、资源申请参数；

根据所述网络申请参数、所述资源申请参数和当前集可用资源监控信息为任务分配资源和运行服务器；

在以主机网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。



2.根据权利要求1所述的方法，其特征在于，所述任务请求还包括：任务类型；所述方法还包括：在所述任务类型属于端口依赖类型的情况下，为所述任务分配端口号。

3.根据权利要求2所述的方法，其特征在于，所述为任务分配端口号的步骤包括：

根据初始端口号查询分布式存储系统；若查询结果为所述初始端口号未处于租约中，则将所述初始端口号分配给所述任务；若查询结果为所述初始端口号处于租约中，则对所述初始端口号进行更新，并根据更新后的端口号查询分布式存储系统；若查询结果为所述更新后的端口号未处于租约中，则将所述更新后的端口号分配给所述任务。



4.根据权利要求1所述的方法，其特征在于，所述资源申请参数包括申请的资源类型；所述申请的资源类型包括以下至少一项：GPU、CPU、内存。



5.根据权利要求4所述的方法，其特征在于，所述根据所述任务请求和当前集可用资源监控信息为任务分配资源和运行服务器的步骤包括：

根据最大最小公平原则为任务分配资源；然后，根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器。



6.根据权利要求5所述的方法，其特征在于，所述根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器的步骤包括：

根据所述网络申请参数从集中筛选出第一候选服务器集合；若所述为任务分配的资源包括GPU资源，则根据为任务分配的GPU资源从第一候选服务器集合中筛选出GPU服务器集合；然后，根据为任务分配的其他资源从所述GPU服务器集合中筛选出所述任务的运行服务器。

7.根据权利要求6所述的方法，其特征在于，所述根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器的步骤还包括：

若所述为任务分配的资源包括CPU资源且不包括GPU资源，则根据为任务分配的CPU资源从第一候选服务器集合中筛选出CPU服务器集合；然后，根据为任务分配的其他资源从所述CPU服务器中筛选出所述任务的运行服务器；若筛选出的所述CPU服务器集合为空，则根据为任务分配的CPU资源从第一候选服务器集合中筛选出GPU服务器集合，然后，根据为任务分配的其他资源从所述GPU服务器中筛选出所述任务的运行服务器。



8.一种多资源调度装置，其特征在于，包括：

接收模块，用于接收任务请求：所述任务请求包括：网络申请参数、资源申请参数；

分配模块，用于根据所述网络申请参数、所述资源申请参数和当前集可用资源监控信息为任务分配资源和运行服务器；

设置模块，用于在以主机网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。



9.根据权利要求8所述的装置，其特征在于，所述任务请求还包括：任务类型；

所述分配模块，还用于在所述任务类型属于端口依赖类型的情况下，为所述任务分配端口号。

10.根据权利要求9所述的装置，其特征在于，所述分配模块为所述任务分配端口号包括：

所述分配模块根据初始端口号查询分布式存储系统；若查询结果为所述初始端口号未处于租约中，则所述分配模块将所述初始端口号分配给所述任务；若查询结果为所述初始端口号处于租约中，则所述分配模块对所述初始端口号进行更新，并根据更新后的端口号查询分布式存储系统；若查询结果为所述更新后的端口号未处于租约中，则所述分配模块将所述更新后的端口号分配给所述任务。



11.根据权利要求8所述的装置，其特征在于，所述资源申请参数包括申请的资源类型；所述申请的资源类型包括以下至少一项：GPU、CPU、内存。



12.根据权利要求11所述的装置，其特征在于，所述分配模块根据所述任务请求和当前集可用资源监控信息为任务分配资源和运行服务器包括：

所述分配模块根据最大最小公平原则为任务分配资源；然后，所述分配模块根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器。



13.根据权利要求12所述的装置，其特征在于，所述分配模块根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器包括：

所述分配模块根据所述网络申请参数从集中筛选出第一候选服务器集合；若所述为任务分配的资源包括GPU资源，则所述分配模块根据为任务分配的GPU资源从第一候选服务器集合中筛选出GPU服务器集合；然后，所述分配模块根据为任务分配的其他资源从所述GPU服务器集合中筛选出所述任务的运行服务器。

14.根据权利要求13所述的装置，其特征在于，所述分配模块根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器还包括：

若所述为任务分配的资源包括CPU资源且不包括GPU资源，则所述分配模块根据为任务分配的CPU资源从第一候选服务器集合中筛选出CPU服务器集合；然后，所述分配模块根据为任务分配的其他资源从所述CPU服务器中筛选出所述任务的运行服务器；若筛选出的所述CPU服务器集合为空，则所述分配模块根据为任务分配的CPU资源从第一候选服务器集合中筛选出GPU服务器集合，然后，所述分配模块根据为任务分配的其他资源从所述GPU服务器中筛选出所述任务的运行服务器。

15.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1至7中任一所述的方法。

16.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1至7中任一所述的方法。

说明书

技术领域

本发明涉及计算机技术领域，尤其涉及一种多资源调度方法和装置。

随着人工智能的发展，TensorFlow、Caffe等深度学习工具的应用越来越广泛。这些深度学习工具的使用性能受网络、内存、CPU、GPU等多种资源的制约。

现有机器学习平台主要依靠yarn(一种Hadoop资源管理器)或kubernetes(一种容器集管理系统)进行资源调度，主要支持CPU和内存资源的调度。在实现本发明过程中，发明人发现现有技术中至少存在如下问题：

第一、不支持多网卡的调度。现有大部分机器学习平台都是基于一个网络。当存在多种网卡时，现有调度方法并不能很好的进行网络适配和自由切换。

第二、不支持GPU资源的调度。或者，即便支持GPU资源的调度，但是GPU与CPU混合调度的效果较差，导致GPU、CPU资源利用率难以实现最大化。

有鉴于此，本发明提供一种多资源调度方法和装置，能够为任务动态分配资源，支持多网卡的调度，实现了不同网卡间的自由切换。进一步，本发明支持GPU资源的调度，提高了GPU与CPU资源混合调度的资源利用率。

为实现上述目的，根据本发明的一个方面，提供了一种多资源调度方法。

本发明的多资源调度方法包括：接收任务请求：所述任务请求包括：网络申请参数、资源申请参数；根据所述网络申请参数、所述资源申请参数和当前集可用资源监控信息为任务分配资源和运行服务器；在以主机网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。

可选地，所述任务请求还包括：任务类型；所述方法还包括：在所述任务类型属于端口依赖类型的情况下，为所述任务分配端口号。

可选地，所述为任务分配端口号的步骤包括：根据初始端口号查询分布式存储系统；若查询结果为所述初始端口号未处于租约中，则将所述初始端口号分配给所述任务；若查询结果为所述初始端口号处于租约中，则对所述初始端口号进行更新，并根据更新后的端口号查询分布式存储系统；若查询结果为所述更新后的端口号未处于租约中，则将所述更新后的端口号分配给所述任务。

可选地，所述资源申请参数包括申请的资源类型；所述申请的资源类型包括以下至少一项：GPU、CPU、内存。

可选地，所述根据所述任务请求和当前集可用资源监控信息为任务分配资源和运行服务器的步骤包括：根据最大最小公平原则为任务分配资源；然后，根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器。

可选地，所述根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器的步骤包括：根据所述网络申请参数从集中筛选出第一候选服务器集合；若所述为任务分配的资源包括GPU资源，则根据为任务分配的GPU资源从第一候选服务器集合中筛选出GPU服务器集合；然后，根据为任务分配的其他资源从所述GPU服务器集合中筛选出所述任务的运行服务器。

可选地，所述根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器的步骤还包括：若所述为任务分配的资源包括CPU资源且不包括GPU资源，则根据为任务分配的CPU资源从第一候选服务器集合中筛选出CPU服务器集合；然后，根据为任务分配的其他资源从所述CPU服务器中筛选出所述任务的运行服务器；若筛选出的所述CPU服务器集合为空，则根据为任务分配的CPU资源从第一候选服务器集合中筛选出GPU服务器集合，然后，根据为任务分配的其他资源从所述GPU服务器中筛选出所述任务的运行服务器。

为实现上述目的，根据本发明的另一方面，提供了一种多资源调度装置。

本发明的多资源调度装置包括：接收模块，用于接收任务请求：所述任务请求包括：网络申请参数、资源申请参数；分配模块，用于根据所述网络申请参数、所述资源申请参数和当前集可用资源监控信息为任务分配资源和运行服务器；设置模块，用于在以主机网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。

可选地，所述任务请求还包括：任务类型；所述分配模块，还用于在所述任务类型属于端口依赖类型的情况下，为所述任务分配端口号。

可选地，所述分配模块为所述任务分配端口号包括：所述分配模块根据初始端口号查询分布式存储系统；若查询结果为所述初始端口号未处于租约中，则所述分配模块将所述初始端口号分配给所述任务；若查询结果为所述初始端口号处于租约中，则所述分配模块对所述初始端口号进行更新，并根据更新后的端口号查询分布式存储系统；若查询结果为所述更新后的端口号未处于租约中，则所述分配模块将所述更新后的端口号分配给所述任务。

可选地，所述资源申请参数包括申请的资源类型；所述申请的资源类型包括以下至少一项：GPU、CPU、内存。

可选地，所述分配模块根据所述任务请求和当前集可用资源监控信息为任务分配资源和运行服务器包括：所述分配模块根据最大最小公平原则为任务分配资源；然后，所述分配模块根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器。

可选地，所述分配模块根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器包括：所述分配模块根据所述网络申请参数从集中筛选出第一候选服务器集合；若所述为任务分配的资源包括GPU资源，则所述分配模块根据为任务分配的GPU资源从第一候选服务器集合中筛选出GPU服务器集合；然后，所述分配模块根据为任务分配的其他资源从所述GPU服务器集合中筛选出所述任务的运行服务器。

可选地，所述分配模块根据所述网络申请参数和为任务分配的资源确定所述任务的运行服务器还包括：若所述为任务分配的资源包括CPU资源且不包括GPU资源，则所述分配模块根据为任务分配的CPU资源从第一候选服务器集合中筛选出CPU服务器集合；然后，所述分配模块根据为任务分配的其他资源从所述CPU服务器中筛选出所述任务的运行服务器；若筛选出的所述CPU服务器集合为空，则所述分配模块根据为任务分配的CPU资源从第一候选服务器集合中筛选出GPU服务器集合，然后，所述分配模块根据为任务分配的其他资源从所述GPU服务器中筛选出所述任务的运行服务器。

为实现上述目的，根据本发明的再一个方面，提供了一种电子设备。

本发明的电子设备，包括：一个或多个处理器；以及，存储装置，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明的多资源调度方法。

为实现上述目的，根据本发明的又一个方面，提供了一种计算机可读介质。

本发明的计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明的多资源调度方法。

上述发明中的一个实施例具有如下优点或有益效果：在本发明实施例中，通过根据接收的任务请求和当前集可用资源监控信息为任务分配资源和运行服务器；以及，在以主机网络模式启动所述运行服务器上的容器时，根据任务请求中的网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源，能够支持多网卡的调度，实现了不同网卡间的自由切换。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是根据本发明一个实施例的多资源调度方法的主要流程的示意图；

图2是根据本发明另一个实施例的多资源调度方法的主要流程的示意图；

图3是根据本发明实施例的多资源调度装置的主要模块的示意图；

图4是根据本发明实施例的容器的网络架构图；

图5是本发明实施例可以应用于其中的示例性系统架构图；

图6是适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

需要指出的是，在不冲突的情况下，本发明中的实施例以及实施例中的特征可以相互组合。

在详细介绍本发明实施例之前，首先对本发明实施例涉及的部分技术术语进行说明。

Docker：一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的容器中，然后发布到任何流行的Linux机器上，也可以实现虚拟化。容器完全使用沙箱机制，相互之间不会有任何接口。

Host网络模式：是Docker容器的一种网络模式。在该网络模式下，Docker容器和宿主机共用一个网络命名空间(Network Namespace)。Docker容器不会虚拟出自己的网卡和IP，而是使用宿主机的网卡和IP。

TensorFlow：是谷歌研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor(张量)意味着N维数组，Flow(流)意味着基于数据流图的计算，TensorFlow为张量从图像的一端流动到另一端的计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理的系统。

Caffe：是一种计算CNN相关算法的深度学习框架。

Etcd：是一种用于共享配置和服务发现的分布式、一致性的KV(键值对)存储系统。

图1是根据本发明一个实施例的多资源调度方法的主要流程的示意图。如图1所示，本发明实施例的多资源调度方法包括：

步骤S101、接收任务请求：所述任务请求包括：网络申请参数、资源申请参数。

其中，所述任务请求可以为各种任务的资源请求，比如机器学习任务的资源请求。其中，所述资源申请参数包括申请的资源类型；所述申请的资源类型包括以下至少一项：GPU、CPU、内存。例如，某一任务请求包括如下信息“net＝ib，cpu core＝2，gpu core＝1”，其表示：任务申请的网络为IB(InfiniBand)网络，任务申请两个CPU核，任务申请一个GPU核。

步骤S102、根据所述网络申请参数、所述资源申请参数和当前集可用资源监控信息为任务分配资源和运行服务器。

例如，为任务分配的资源为“两个CPU核，两个GPU核”，运行服务器为编号为“worker-0”的服务器。

步骤S103、在以主机(host)网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。

例如，当网络申请参数为“net＝ib”时，将宿主机上的IB网卡作为容器的网络资源，并将宿主机在IB网卡下的IP(比如192.18.177.12)作为容器的IP。当网络申请参数为“net＝eth”时，将宿主机上的以太网卡作为容器的网络资源，并将宿主机在以太网卡下的IP(比如192.17.155.13)作为容器的IP。

在本发明实施例中，通过以上步骤能够为任务动态地分配资源，以及支持多网卡的调度，实现了不同网卡间的自由切换。进而，使得任务既可以在以太网下运行，也可以在IB网下运行。

图2是根据本发明另一个实施例的多资源调度方法的主要流程的示意图。如图2所示，本发明实施例的多资源调度方法包括：

步骤S201、接收任务请求；所述任务请求包括：任务类型、网络申请参数、资源申请参数。

其中，所述任务类型可分为端口依赖型、非端口依赖型。比如，当任务类型这一参数的值为“true”时，表示端口依赖型；当任务类型这一参数的值为“false”时，表示非端口依赖型。具体实施时，可将TensorFlow的任务类型划分为端口依赖型，将Caffe的任务类型划分为非端口依赖型。

其中，所述资源申请参数包括申请的资源类型；所述申请的资源类型包括以下至少一项：GPU、CPU、内存。例如，某一任务请求包括如下信息“type＝true，net＝ib，cpu core＝2，gpu core＝1”，其表示：任务类型为端口依赖型，任务申请的网络为IB(InfiniBand)网络，任务申请两个CPU核，任务申请一个GPU核。

步骤S202、根据任务请求判断任务类型是否为端口依赖型。在任务类型为端口依赖型的情况下，执行步骤S203；在任务类型为非端口依赖型的情况下，执行步骤S204。

步骤S203、为任务分配端口号。

在一可选实施方式中，步骤S203可包括：步骤a至步骤d。

步骤a、根据初始端口号查询分布式存储系统。

其中，所述分布式存储系统可以为Etcd。在该步骤中，若查询结果为所述初始端口号未处于租约中，则执行步骤b；若查询结果为所述初始端口号处于租约中，则执行步骤c。

步骤b、将所述初始端口号分配给所述任务。

步骤c、对端口号进行更新，并根据更新后的端口号查询分布式存储系统。

在该步骤中，若查询结果为所述更新后的端口号未处于租约中，则执行步骤d；若查询结果为所述更新后的端口号处于租约中，则再次执行步骤c，直至到未处于租约中的端口号。其中，当端口号处于租约中时，表示该端口号已被其他任务占用，无法释放锁；当端口号未处于租约中时，表示该端口号未被其他任务占用，即该端口号是一个空闲的端口号。通过引入租约机制管理端口号资源，能够实现：在任务运行过程中，自行更新TTL时间(TimeTo Live，即任务的运行时间)，保证端口资源的占有周期与任务运行周期一致；在任务运行结束后，TTL时间结束，端口资源得到释放。

示例性的，可以通过每次对端口号增加一个固定步长值的方式进行端口号的更新。比如，初始端口号为6060，固定步长值为1，则第一次更新得到的端口号为6061。根据端口号“6061”查询分布式存储系统，若端口号“6061”未处于租约中，则执行步骤d，即将端口号“6061”分配给所述任务；若端口号“6061”处于租约中，则执行步骤c，即将端口号更新为“6062”，并根据端口号“6062”查询分布式存储系统。

步骤d、将更新后的端口号分配给所述任务。

在本发明实施例中，通过步骤S203能够为任务动态地分配端口号资源，保证任务对端口号资源的独占性，以及端口号资源生命周期与任务生命周期同步。

步骤S204、根据资源申请参数和当前集可用资源监控信息为任务分配资源。

示例性的，在获得资源申请参数和当前集可用资源监控信息之后，可按照预设的分配原则为任务分配资源。比如，所述预设的分配原则可以是最大最小公平原则。其中，所述最大最小公平原则是指在多资源环境下，应该优先对任务的主导资源进行分配，然后再对非主导资源进行分配。

具体实施时，当任务请求中的资源申请参数包括GPU时，则可直接将GPU作为主导资源；当任务请求中的资源申请参数不包括GPU，但包括CPU和内存时，可以先根据申请的资源量在集可用资源量中的占比选出主导资源，再进行资源分配。

例如，当前集可用资源包括：9个CPU核、18GB的内存，任务A的请求包括：1个CPU核、4GB的内存，任务B的请求包括：3个CPU核、4GB的内存，则在任务A的请求中：CPU占比为11％，内存占比为22％，在任务B的请求中：CPU占比为33％，内存占比为22％。进而，对于任务A的请求来说，主导资源为内存；对于任务B的请求来说，主导资源为CPU。进而，对于任务A的请求，优先分配内存资源，再分配CPU资源；对于任务B的请求，优先分配CPU资源，再分配内存资源。

步骤S205、根据网络申请参数和为任务分配的所有资源确定该任务的运行服务器。

在一可选实施方式中，步骤S205包括：

步骤A、根据所述网络申请参数从集中筛选出第一候选服务器集合。

例如，假设某一集中包括两种服务器，一种服务器只配置有以太网卡，另一种服务器配置有以太网卡和IB网卡，则步骤A可包括：若网络申请参数为“net＝ib”，则将配置有两种网卡的服务器筛选出来，即基于配置有两种网卡的服务器构建第一候选服务器集合；若网络申请参数为“net＝eth”，则基于集中的所有服务器构建第一候选服务器集合。

步骤B、若所述为任务分配的资源包括GPU资源，则根据为任务分配的GPU资源从第一候选服务器集合中筛选出GPU服务器集合；然后，根据为任务分配的其他资源从所述GPU服务器集合中筛选出所述任务的运行服务器。一般来说，GPU服务器上配置有GPU和CPU，CPU服务器上配置有CPU、但没有GPU。

进一步，步骤S205还可包括：

步骤C、若所述为任务分配的资源包括CPU资源且不包括GPU资源，则根据为任务分配的CPU资源从第一候选服务器集合中筛选出CPU服务器集合；然后，根据为任务分配的其他资源从所述CPU服务器中筛选出所述任务的运行服务器；若筛选出的所述CPU服务器集合为空，则根据为任务分配的CPU资源从第一候选服务器集合中筛选出GPU服务器集合，然后，根据为任务分配的其他资源从所述GPU服务器中筛选出所述任务的运行服务器。

在本发明实施例中，通过步骤B能够在分配的资源包括GPU资源时，优先寻能够满足GPU资源需求的服务器；通过步骤C能够尽量避免“申请CPU资源的任务运行在GPU机器上，在一定程度上增加了GPU机器的负载”的问题，尽量提高申请了CPU资源但未申请GPU资源的任务运行在CPU机器上的概率，提高GPU与CPU资源混合调度的资源利用率。

步骤S206、在以主机网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。

在本发明实施例中，通过以上步骤能够为任务动态地分配资源以及支持多网卡的调度。具体来说，本发明实施例能够实现不同网卡间的自由切换，使得任务既可以在以太网下运行，也可以在IB网下运行。另外，本发明实施例能够为任务动态地分配端口号资源，保证任务对端口号资源的独占性，以及端口号资源生命周期与任务生命周期同步。另外，本发明实施例能够支持GPU资源的调度，提高GPU与CPU资源混合调度的资源利用率。

图3是根据本发明实施例的多资源调度装置的主要模块的示意图。如图3所示，本发明实施例的多资源调度装置300包括：接收模块301、分配模块302、设置模块303。

接收模块301，用于接收任务请求。

其中，所述任务请求可以为各种任务的资源请求，比如机器学习任务的资源请求。所述任务请求可包括：网络申请参数、资源申请参数。所述资源申请参数包括申请的资源类型；所述申请的资源类型包括以下至少一项：GPU、CPU、内存。

例如，某一任务请求包括如下信息“net＝ib，cpu core＝2，gpu core＝1”，其表示：任务申请的网络为IB(InfiniBand)网络，申请的资源类型为CPU和GPU，且CPU的申请量为两个CPU核，GPU的申请量为一个GPU核。

分配模块302，用于根据所述网络申请参数、所述资源申请参数和当前集可用资源监控信息为任务分配资源和运行服务器。

其中，所述运行服务器具有为任务分配的资源，且用于运行该任务的服务器。例如，为任务分配的资源为“两个CPU核，两个GPU核”，运行服务器为编号为“worker-0”的服务器。

在一可选实施方式中，分配模块302根据所述任务请求和当前集可用资源监控信息为任务分配资源和运行服务器具体包括：

1)分配模块302根据资源申请参数和当前集可用资源监控信息为任务分配资源。

示例性的，在获得资源申请参数和当前集可用资源监控信息之后，分配模块302可按照预设的分配原则为任务分配资源。比如，所述预设的分配原则可以是最大最小公平原则。其中，所述最大最小公平原则是指在多资源环境下，应该优先对任务的主导资源进行分配，然后再对非主导资源进行分配。

2)分配模块302根据网络申请参数和为任务分配的所有资源确定该任务的运行服务器，具体包括：

21)分配模块302根据所述网络申请参数从集中筛选出第一候选服务器集合。

例如，假设某一集中包括两种服务器，一种服务器只配置有以太网卡，另一种服务器配置有以太网卡和IB网卡，若网络申请参数为“net＝ib”，则分配模块302可将配置有两种网卡的服务器筛选出来，并基于配置有两种网卡的服务器构建第一候选服务器集合；若网络申请参数为“net＝eth”，则分配模块302可基于集中的所有服务器构建第一候选服务器集合。

22)若所述为任务分配的资源包括GPU资源，则分配模块302根据为任务分配的GPU资源从第一候选服务器集合中筛选出GPU服务器集合；然后，分配模块302根据为任务分配的其他资源从所述GPU服务器集合中筛选出所述任务的运行服务器。

23)若所述为任务分配的资源包括CPU资源且不包括GPU资源，则分配模块302根据为任务分配的CPU资源从第一候选服务器集合中筛选出CPU服务器集合；然后，分配模块302根据为任务分配的其他资源从所述CPU服务器中筛选出所述任务的运行服务器；若筛选出的所述CPU服务器集合为空，则分配模块302根据为任务分配的CPU资源从第一候选服务器集合中筛选出GPU服务器集合，然后，分配模块302根据为任务分配的其他资源从所述GPU服务器中筛选出所述任务的运行服务器。

进一步，所述任务请求还可包括：任务类型。分配模块302，还用于在所述任务类型属于端口依赖类型的情况下，为所述任务分配端口号。

在一可选实施方式中，分配模块302为所述任务分配端口号包括：分配模块302根据初始端口号查询分布式存储系统；若查询结果为所述初始端口号未处于租约中，则分配模块302将所述初始端口号分配给所述任务；若查询结果为所述初始端口号处于租约中，则分配模块302对所述初始端口号进行更新，并根据更新后的端口号查询分布式存储系统；若查询结果为所述更新后的端口号未处于租约中，则分配模块302将所述更新后的端口号分配给所述任务。其中，所述分布式存储系统包可以为Etcd。

设置模块303，用于在以主机(host)网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。

本发明实施例的装置能够为任务动态地分配资源以及支持多网卡的调度。具体来说，本发明实施例的装置能够实现不同网卡间的自由切换，使得任务既可以在以太网下运行，也可以在IB网下运行。另外，本发明实施例的装置能够为任务动态地分配端口号资源，保证任务对端口号资源的独占性，以及端口号资源生命周期与任务生命周期同步。另外，本发明实施例的装置能够支持GPU资源的调度，提高GPU与CPU混合调度的资源利用率。

图4是根据本发明实施例的容器的网络架构图。如图4所示，节点为集中的服务器，容器为集中的最小运行单元。一般情况下，容器会通过Docker进行虚拟化。因此，容器对应的网卡为Docker的网卡docker0。现有技术中，在实现不同服务器上的Docker和容器通信时，大多使用第三方桥接技术(比如，calico和flannel)虚拟路由。但是，由于第三方桥接技术依赖于本地服务器的以太网卡，很难实现网卡的自由切换。在本发明实施例中，通过将Docker的网络模式配置为主机(host)网络模式，并在启动容器时根据网络申请参数动态指定容器的网络资源，实现了多网卡的自由切换。

图5示出了可以应用本发明实施例的多资源调度方法或多资源调度装置的示例性系统架构500。

如图5所示，系统架构500可以包括终端设备501、502、503，网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备501、502、503通过网络504与服务器505交互，以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器505可以是提供各种服务的服务器，例如对用户利用终端设备501、502、503所提交的任务请求提供支持的调度管理服务器。调度管理服务器可以对接收到的任务请求等数据进行分析等处理，并将处理结果(例如分配给任务的资源和运行节点)反馈给终端设备。

需要说明的是，本发明实施例所提供的多资源调度方法一般由服务器505执行，相应地，多资源调度装置一般设置于服务器505中。

应该理解，图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

图6示出了适于用来实现本发明实施例的电子设备的计算机系统600的结构示意图。图6示出的计算机系统仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括接收模块、分配模块、设置模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，接收模块还可以被描述为“接收任务请求的模块”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备执行以下流程：接收任务请求：所述任务请求包括：网络申请参数、资源申请参数；根据所述网络申请参数、所述资源申请参数和当前集可用资源监控信息为任务分配资源和运行服务器；在以主机网络模式启动所述运行服务器上的容器时，根据所述网络申请参数设置该容器的网络，并将为所述任务分配的资源设置为该容器的可用资源。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

本文发布于:2023-04-13 13:39:58，感谢您对本站的认可！

本文链接：https://patent.en369.cn/patent/4/85905.html

上一篇：共享储能电费数字资产通证结算方法及平台

下一篇：一种死锁检测方法、设备及系统

标签：多资源调度方法和装置

留言与评论（共有 0 条评论）