1.本技术的实施
方式涉及数据处理领域,更具体地,涉及一种
语音控制方法、电子设备及计算机可读存储介质。
背景技术:
2.随着车辆技术的提高,车辆控制的相关技术越来越完善。例如,一些车辆增加了语音控制功能以方便用户控制车辆。
3.然而,发明人发现,虽然语音控制简化了用户控制车辆的操作过程,但语音控制过程中仍然存在一些问题。例如,用户在触发用于开启某一功能的语音
指令后,立马发现自己现在不需要使用这一功能,又触发关闭该功能的语音指令。该情况下,车辆会先开启该功能再关闭该功能,使得用户使用体验不好。
技术实现要素:
4.本技术的实施方式提供了一种可至少部分解决现有技术中存在的上述问题或其他问题的语音控制方法、电子设备及计算机可读存储介质。
5.本技术的实施方式一方面提供了一种语音控制方法,包括:响应于车辆处于连续说模式,且在同一时间段内获取到多条语音指令,确定多条语音指令的逻辑关系,逻辑关系至少包括冲突和重复;以及基于多条语音指令的逻辑关系和多条语音指令确定出最终执行的控制指令。
6.本技术的实施方式另一方面提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上述实施方式提及的语音控制方法。
7.本技术的实施方式另一方面提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,实现如上述实施方式提供的语音控制方法。
8.根据本技术的一些实施方式,车辆设置有连续说模式,用户无需反复说出唤醒词或反复触发语音录制控件即可与车机交互,可进一步简化用户语音操作,可减少用户在行车过程中为了触发语音控制服务而转移注意力导致的行车安全问题。针对车辆的连续说模式,车机对用户在同一时间段内触发的多条语音指令进行逻辑关系判断以确定最终执行的控制指令,从而为用户提供更好地语音控制服务。
9.在本技术的一些实施方式中,对于用户在短时间内触发的重复的语音指令,车机基于重复的语音指令所控制的部件的实际运行参数来对重复的语音指令进行合并处理或删除处理以得到控制效果更符合用户习惯或当前场景的控制指令,优化了语音控制逻辑,提高了用户使用体验。
10.在本技术的一些实施方式中,对于用户在短时间内触发的处理逻辑冲突的语音指令,车机响应用户更晚触发的语音指令,优化了车机语音控制逻辑,拦截了错误的语音指
令,给予用户“后悔”的机会,提高了用户使用体验。
附图说明
11.通过阅读参照以下附图所作的对非限制性实施例的详细描述,本技术的其它特征、目的和优点将会变得更明显。其中:
12.图1是根据本技术的一些实施方式的车辆的示意性框图;
13.图2是根据本技术的一些实施方式的语音控制方法的流程示意图;以及
14.图3是根据本技术的一些实施方式的电子设备的示意性框图。
具体实施方式
15.为了更好地理解本技术,将参考附图对本技术的各个方面做出更详细的说明。应理解,这些详细说明只是对本技术的示例性实施方式的描述,而非以任何方式限制本技术的范围。在说明书全文中,相同的附图标号指代相同的元件。表述“和/或”包括相关联的所列项目中的一个或多个的任何和全部组合。
16.应理解的是,当诸如“...中的至少一个”的表述出现在所列特征的列表之后时,其修饰整列特征,而非仅仅修饰列表中的单独元件。此外,当描述本技术的实施方式时,使用“可”表示“本技术的一个或多个实施方式”。
17.除非另外限定,否则本文中使用的所有措辞(包括工程术语和科技术语)均具有与本技术所属领域普通技术人员的通常理解相同的含义。还应理解的是,除非本技术中有明确的说明,否则在常用词典中定义的词语应被解释为具有与它们在相关技术的上下文中的含义一致的含义,而不应以理想化或过于形式化的意义解释。
18.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。另外,除非明确限定或与上下文相矛盾,否则本技术所记载的方法中包含的具体步骤不必限于所记载的顺序,而可以任意顺序执行或并行地执行。下面将参考附图并结合实施例来详细说明本技术。
19.图1是根据本技术的一些实施方式的车辆10的示意性框图。如图1所示,车辆10可包括语音采集装置110、车机120、空调130、发光器件140、发声器150和诸如车窗、天窗在内的其他部件160。其中,语音采集装置110可包括麦克风等能够将声音信号转化为数字信号的装置,其采集的语音数据可通过车机120内的离线语音引擎进行识别,也可通过具有语音识别功能的云端(未示出)进行识别。车机120可基于识别到的语音指令,下发控制指令至其对应的部件(如空调130、发光器件140和发声器150),以实现车辆10的语音控制。例如,车机120可基于指定的语音指令下发控制指令至空调130,以调整空调130的运行模式和/或运行参数。又如,车机120基于指定的语音指令下发控制指令至发光器件140或发声器150,以控制发光器件140或发声器150工作。其中,发光器件140可包括显示屏、内饰灯、氛围灯等能够发光的部件中的至少一个,此处不一一列举,发光器件140可在车机120的控制下开启或关闭。一些发光器件140还可在车机120的控制下调整自身的亮度。
20.应当理解的是,在未背离本技术教导的情况下,车机120也可基于指定的语音指令下发控制指令至车辆10的其他部件160,车机120对控制其他部件160的语音指令的处理方式可参考车机120对控制空调130的语音指令的处理方式、发光器件140的语音指令的处理
方式、发声器150的语音指令的处理方式的相关说明,本技术不一一列举。
21.图2是根据本技术的一些实施方式的语音控制方法200的流程示意图。在本技术的一些实施方式中,车辆10的语音控制方法200可例如图2所示。该语音控制方法200可通过车机120执行,并包括以下步骤。
22.s21,响应于车辆处于连续说模式,且在同一时间段内获取到多条语音指令,确定多条语音指令的逻辑关系。其中,逻辑关系至少包括冲突和重复。
23.s22,基于多条语音指令的逻辑关系和多条语音指令确定出最终执行的控制指令。
24.根据本技术的一些实施方式,车辆10设置有连续说模式,用户无需反复说出唤醒词或反复触发语音录制控件即可与车机120交互,可进一步简化用户语音操作,可减少用户在行车过程中为了触发语音控制服务而转移注意力导致的行车安全问题。针对车辆10的连续说模式,车机120对用户在同一时间段内触发的多条语音指令进行逻辑关系判断以确定最终执行的控制指令,从而为用户提供更好地语音控制服务。
25.为了便于理解,下面对图2所示例的语音控制方法200的各个步骤进行示例性说明。
26.首先,下文对语音数据的采集和语音指令的获取进行示例性地说明。
27.在本技术的一些实施方式中,车辆10可针对语音控制服务设置连续说模式。在连续说模式下,若用户通过唤醒词或车辆10上设置的用于触发语音录制的控件(物理控件或虚拟控件)触发车辆10的语音控制功能,车辆10能够连续地为用户提供语音控制服务。示例地,车辆10在用户开启语音控制服务后,可使语音采集装置110一直处于开启状态,且无需判断其采集的语音数据中是否存在唤醒词而直接进行语音识别。上述方案中,用户无需反复说出唤醒词或反复触发语音录制控件即可与车机120交互,可进一步简化用户语音操作,可减少用户在行车过程中为了触发语音控制服务而转移注意力导致的行车安全问题。
28.应当理解的是,车辆10也可针对语音控制服务设置非连续说模式,即在通过唤醒词或其他方式触发语音控制服务后,采集语音数据,并在检测到说话间隙后,不再直接采集语音数据并进行识别,而是在用户再次通过唤醒词或其他方式触发语音控制服务后执行采集和识别操作。在非连续说模式下,车辆10可在获取到语音指令后直接将其确定为控制指令,也可基于与非连续说模式相同的方式确定控制指令,本技术对此不作限制。
29.在本技术的一些实施方式中,车辆10处于连续说模式的情况下,车机120或语音采集装置110可在检测到用户的说话间隙后,将当前采集的语音数据传输至云端和/或离线语音引擎。其中,车机120或语音采集装置110确定说话间隙的方式包括但不限于:若确定语音采集装置110在距离上一语音信号第一预设时间后仍未检测到新的语音信号,判定存在说话间隙。应当理解的是,第一预设时间通常是一个较短的时间,其具体数值可根据需要设置,例如,设置为1.5s,本技术对此不作限制。车机120或语音采集装置110还可根据其他方式确定说话间隙,本技术对此不作限制。
30.作为一个示例,语音数据被传输至离线语音引擎。该示例中,离线语音引擎对该语音数据进行识别,并将识别结果传输至车机120。车机120对该识别结果进行解析以得到语音指令。
31.作为另一示例,语音数据被传输至云端。该示例中,云端对车辆10上传的语音数据进行识别,并将识别结果传输至车机120。车机120对该识别结果进行解析以得到语音指令。
可选择的,云端可在识别完接收到的语音数据后,基于识别出的语音内容,确定向车辆10反馈的识别结果。示例地,若识别出的语音内容指示触发系统控制类或车辆控制类的语音指令,可向车辆10反馈包含该语音内容的识别结果。若识别出的语音内容指示触发需要借助互联网的数据查询类的语音指令,云端对自身是否具有网络查询功能进行判断。云端若判断出自身具有网络查询功能,可通过网络查询功能查询用户所需数据(例如近几日的天气情况等),并基于查询到的数据生成并反馈识别结果,该识别结果中包括指示车辆10反馈查询到的数据的语音指令;若判断出自身不具有网络查询功能,云端可反馈包含识别出的语音内容的识别结果至车辆10。
32.应当理解的是,在未背离本技术教导的情况下,云端也可在识别完接收到的语音数据后,不对识别出的语音内容进行判断操作,直接向车辆10反馈包含识别出的语音内容的识别结果,本技术对此不作限制。
33.作为又一示例,语音数据被传输至离线语音引擎和云端。该示例中,离线语音引擎和云端分别对该语音数据进行识别并反馈识别结果。其中,云端反馈识别结果的方式可参考上文相关描述,此处不再赘述。示例性地,云端具有网络查询功能。由于离线语音引擎的传输时延小,通常情况下,车机120先接收到离线语音引擎的识别结果。车机120对离线语音引擎的识别结果进行解析。若解析结果指示用户触发系统控制类或车辆控制类的语音指令,车机120可将解析结果中的语音指令确定为语音数据对应的语音指令。若解析结果指示用户触发需要借助互联网的数据查询类的语音指令或识别失败,车机120可等待云端反馈的识别结果。上述方案中,相对于只发送语音数据至云端或离线语音引擎,车机可更快获得与语音数据对应的语音指令,进而提高车机120响应速度。
34.可以理解的是,在一些场景中,车机120可能同时接收到离线语音引擎发送的识别结果和云端发送的识别结果。该情况下,车机120可根据识别结果中的指令类型和预设的仲裁机制,确定语音数据对应的语音指令。例如,预设的仲裁机制指示:若离线语音引擎发送的识别结果和云端发送的识别结果均指示语音数据对应的语音指令为系统控制类或车辆控制类的语音指令,则基于离线语音引擎发送的识别结果确定语音数据对应的语音指令;若离线语音引擎发送的识别结果和云端发送的识别结果均指示语音数据对应的语音指令为借助互联网的数据查询类的语音指令,则基于云端发送的识别结果确定语音数据对应的语音指令。
35.应当理解的是,通常情况下,离线语音引擎和云端的识别结果相同,即使存在区别,指令类型也应当能够保持一致,若在一些特殊情况下出现两者不一致的情况,可预先设置以云端的识别结果或以离线语音引擎的识别结果为准。
36.在完成车机120获取语音数据对应的语音指令的示例性说明后,下面对车机120对获取的语音指令的处理方式进行示例性说明。
37.由于车辆10处于连续说模式,而用户主观想法随时可能发生变化,例如,用户可能在触发开启某一功能的语音指令后立马触发关闭该功能的语音指令,若车机120将这接收到的语音指令均下发至其所控制的部件,可能对该部件的处理模块造成不必要的数据处理负担。同时,部件状态反复转变也容易对该部件造成损耗,影响部件使用寿命。
38.基于此,本技术的一些实施方式中,车机120在得到语音数据对应的语音指令后,判断接收到该语音指令的时间段内是否接收到其他语音指令,若确定未接收到其他语音指
令,则执行该语音指令,若接收到其他语音指令,基于该语音指令和其他语音指令的逻辑关系确定最终执行的控制指令。示例地,车机12可确定多条语音指令的逻辑关系,并基于多条语音指令的逻辑关系和多条语音指令确定出最终执行的控制指令。其中,其中逻辑关系至少包括冲突和重复。
39.为了便于理解,下面先对车机120判断是否在同一时间段内获取到多条语音指令的方式进行示例性说明。
40.在本技术的一些实施方式中,车机120中设置有一待执行队列,该待执行队列中被触发的时间与当前时间的时间差大于等于时间阈值的语音指令被执行。车机120在获取到语音指令后,可将获取的语音指令加入待执行队列中,并在待执行队列中记录该语音指令被触发的时间。车机120可通过待执行队列判断是否存在多条语音指令。例如,若待执行队列中存在除该语音指令以外的其他语音指令,则说明车机120在同一时间段内接收到多条语音指令,需要根据多条语音指令的逻辑关系确定控制指令。
41.上述方案中,由于获取的语音指令均被存入待执行队列,而待执行队列中被触发的时间与当前时间的时间差大于等于时间阈值的语音指令将自动执行,可便于车机120确定是否在同一时间段内接收到多条语音指令,还可使得车机120可无需单独对每个语音指令设置检测其是否达到给用户“后悔”的时间的任务,降低了车机120算法复杂度。
42.应当理解的是,语音指令被触发的时间可以是语音数据的采集时间,也可以是车机120获取到语音指令的时间,本技术对此不作限制。
43.应当理解的是,在未背离本技术教导的情况下,除了通过待执行队列确定是否在同一时间段获取到多条语音指令,还可以采用其他方式确定,例如,基于语音指令被触发的时间和预定义的时间窗宽度来确定该语音指令对应的时间段内是否接收到多条语音指令,本技术对此不作限制。
44.在完成对车机120判断是否在同一时间段内获取到多条语音指令的方式的示例性说明后,下面对车机120确定多条语音指令的逻辑关系的方式进行示例性说明。
45.在本技术的一些实施方式中,车机120可确定多条语音指令彼此之间的逻辑关系。示例地,车机120在同一时间段内接收到语音指令a、语音指令b和语音指令c,车机120分别确定以下逻辑关系:语音指令a与语音指令b之间的逻辑关系、语音指令a和语音指令c之间的逻辑关系、语音指令b和语音指令c之间的逻辑关系。
46.在本技术的另一些实施方式中,车机120将获取的语音指令加入待执行队列,并在每次加入语音指令的过程中,确定待执行队列中新加入的语音指令与之前加入的语音指令之间的逻辑关系。示例地,按照加入时间的前后,待执行队列中之前加入的语音指令依次包括语音指令b和语音指令c,新加入的语音指令为语音指令a,则车机120分别确定语音指令a和语音指令b之间的逻辑关系、以及语音指令a和语音指令c之间的逻辑关系。由于语音指令c加入待执行队列的过程中,已经判断过语音指令c和语音指令b之间的逻辑关系,两者仍然缓存在待执行队列中,即可说明两者之间不存在冲突或重复的逻辑关系。因此,在加入语音指令a时,无需再次判断语音指令c和语音指令b之间的逻辑关系。通过上述内容可知,相对于确定多条语音指令彼此之间的逻辑关系,该方案即可有效判断多条语音指令的逻辑关系,又可减少车机120的数据处理量,减少计算资源的浪费。
47.在本技术的一些实施方式中,车机120在确定两条语音指令之间的逻辑关系的过
程中,先判断两条语音指令所控制的部件是否相同,若确定两条语音指令所控制的部件不同,可判定两条语音指令之间的逻辑关系为不相关,若确定两条语音指令所控制的部件相同,可判断两条语音指令的功能是否相同,若确定相同,可基于该两条语音指令的控制目的判定其为冲突或重复,若确定不相同,可判定两条语音指令之间的逻辑关系为不相关。其中,车机120判断两条语音指令所控制的部件/功能是否相同的方式可以是判断两条语音指令中与部件/功能对应的指令代码是否相同。
48.以车机120在同一时间段内获取的语音指令包括:指示升高空调温度的语音指令a、指示增加多媒体音量的语音指令b、指示降低空调温度的语音指令c、指示升高空调温度的语音指令d和指示提高空调风速语音指令e为例,车机120需要确定语音指令a分别与语音指令b、语音指令c、语音指令d和语音指令e之间的逻辑关系。
49.在确定语音指令a和语音指令b之间的逻辑关系的过程中,由于语音指令a所控制的部件为空调130,语音指令b所控制的部件为发声器150,两者所控制的部件不同,车机120可判定语音指令a和语音指令b之间的逻辑关系为不相关。
50.在确定语音指令a和语音指令c之间的逻辑关系的过程中,由于语音指令a和语音指令c所控制的部件均为空调130,所控制的功能均为空调130的输出温度,但温度调整方向不同,车机120可判定语音指令a和语音指令c之间的逻辑关系为冲突。
51.在确定语音指令a和语音指令d之间的逻辑关系的过程中,由于语音指令a和语音指令d所控制的部件均为空调130,所控制的功能均为空调130的输出温度,且温度调整方向相同,车机120可判定语音指令a和语音指令d之间的逻辑关系为重复。
52.可以理解的是,在一些场景中,若语音指令a和语音指令d分别指示将空调温度升高至不同的度数,虽然两者均提高了空调温度,但由于其实际调控的目标温度不同,车机120可判定两者的逻辑关系为冲突。
53.在确定语音指令a和语音指令e之间的逻辑关系的过程中,由于语音指令a和语音指令e所控制的部件均为空调130,但所控制的功能分别为输出温度和风速,车机120可判定语音指令a和语音指令e之间的逻辑关系为不相关。
54.应当理解的是,在未背离本技术教导的情况下,还可基于其他方法判断两条语音指令之间的逻辑关系,本技术对此不作限制。
55.在完成对车机120确定语音指令之间的逻辑关系的示例性说明后,下面对车机120对存在重复的语音指令的处理方式进行示例性说明。
56.在本技术的一些实施方式中,车机120若确定多条语音指令中存在重复的语音指令,可直接对重复的语音指令进行删除处理或者合并处理以得到控制指令。其中,删除处理可以是指保留多条重复的语音指令中的一条语音指令作为控制指令,合并处理可以是指生成执行效果与重复的语音指令均被执行的执行效果相同的控制指令替代多条重复的语音指令。上述方案中,对重复的语音指令进行删除或合并处理,可减少语音指令所控制的部件的处理模块的响应次数,减少资源消耗。
57.在本技术的另一些实施方式中,车机120若确定多条语音指令中存在重复的语音指令,可获取重复的语音指令所控制的部件的实际运行参数和该部件的参考运行参数,并根据实际运行参数和参考运行参数的数值关系对重复的语音指令进行合并处理或删除处理以得到控制指令。其中,参考运行参数可根据用户行为数据和/或周围的环境参数确定。
上述方案中,车机120对重复的语音指令进行合并处理或删除处理以得到控制效果更符合用户习惯或当前场景的控制指令,优化了车机120的语音控制逻辑,提高了用户使用体验。
58.应当理解的是,在未背离本技术教导的情况下,参考运行参数也可以通过其他方式确定,本技术对此不作限制。
59.需要说明的是,在本公开的技术方案中,所涉及的用户行为数据的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。还需要说明的是,本实施例中的用户行为数据所包括的输出温度的历史数据等等均是为了确定参考运行参数之目的、在经用户授权提供(即,征得用户本人同意)之后所获取的。另外,所获取的信息/数据并非旨在表征某一特定类型的用户,因而也无法反映出某一特定类型的用户的个人信息。
60.作为一个示例,车机120根据实际运行参数和参考运行参数的数值关系对重复的语音指令进行合并处理或删除处理以得到控制指令的方式包括但不限于:车机120若确定数值关系符合预设的合并条件,对重复的语音指令进行合并处理以得到控制指令,控制指令的执行效果与重复的语音指令均被执行的执行效果相同。车机120若确定响应于数值关系不符合预设的合并条件,对重复的语音指令进行删除处理以得到控制指令,控制指令为重复的语音指令中的一个。
61.示例地,预设的合并条件可以指示:在语音指令所指示的运行参数的调整方向与部件的实际运行参数变化为参考运行参数的变化方向相同的情况下,若实际运行参数和参考运行参数的数值关系指示实际运行参数和参考运行参数的差值大于预设阈值,则确定符合合并条件。
62.应当理解的是,在未背离本技术教导的情况下,若语音指令所指示的运行参数的调整方向与变化方向相反,车机120可判定为当前不符合合并条件,也可根据实际运行参数和参考运行参数的数值关系进一步判断,例如,若指示实际运行参数和参考运行参数的差值小于等于预设阈值,判定为符合合并条件。其中,预设阈值可根据部件的类型、该语音指令所控制的部件的功能、开发经验等确定,此处不作限制。
63.应当理解的是,在未背离本技术教导的情况下,合并条件可根据需要设置,本技术对此不作限制。
64.为了便于理解,下面结合车辆10内的一些具体部件,对重复的语音指令的合并处理或删除处理的过程进行示例性说明。
65.实施例1
66.在本技术的一些实施方式中,语音指令所控制的部件为车辆10的发声器150,重复的语音指令的功能为发声器150的音量调节。该场景下,部件的实际运行参数包括发声器150的实际音量,部件的用户行为数据包括发声器150的音量的历史数据,参考运行数据包括基于音量的历史数据确定的参考音量。例如,车机120可根据音量的历史数据确定该发声器150的音量的如众数或平均数等在内的数值,该数值可以能够体现用户习惯使用的音量,车机120可将数值确定为参考音量。
67.以车机120在同一时间段接收到n条指示调高音量的语音指令(本文中n为大于1的整数),且车机120当前设置的音量调节量为a分贝为例,车机120对重复的语音指令的处理过程如下:
68.若当前的实际音量小于参考音量,车机120判定调整方向和变化方向相同,并继续
判断实际音量和参考音量的差值是否大于第一阈值,若确定是,对n条的语音指令进行合并处理以得到指示将音量调高n*a分贝的控制指令,若确定不是,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将音量调高a分贝;
69.若当前的实际音量大于等于参考音量,车机120可判定调整方向和变化方向相反,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将音量调高a分贝。
70.以车机120在同一时间段接收到n条指示降低音量的语音指令,且车机120当前设置的音量调节量为a分贝为例,车机120对重复的语音指令的处理过程如下:
71.若当前的实际音量小于等于参考音量,车机120判定调整方向和变化方向相反,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,最终的控制指令指示将音量调高a分贝;
72.若当前的实际音量大于参考音量,车机120判定调整方向和变化方向相同,继续判断实际音量和参考音量的差值是否大于第一阈值,若确定是,对n条的语音指令进行合并处理以得到指示将音量调高n*a分贝的控制指令,若确定不是,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将音量调高a分贝。
73.应当理解的是,第一阈值可为预设的数值,也可以是根据n*a的值确定,例如,第一阈值等于或略小于n*a。
74.应当理解的是,语音指令被待执行队列,通常情况下,重复的语音指令为2条,即n=2,若2条语音指令分别指示将音量增加a1分贝和a2分贝(a1≠a2),则合并处理后的得到的控制指令指示将音量增加(a1+a2)分贝,而第一阈值可等于或略小于a1+a2。换言之,合并后的控制指令的控制效果根据各重复的语音指令共同达到的控制效果确定,第一阈值亦可根据各重复的语音指令共同达到的控制效果确定。
75.通过上述内容可知,在调整方向和变化方向相同且实际音量和参考音量相距较大时,车机120将语音指令进行合并处理,以使得调整后的音量更接近参考音量,更符合用户使用习惯,降低用户再次触发重复的语音指令的概率,提高了用户使用体验,从一定程度上降低了车机120的数据处理量。
76.实施例2
77.在本技术的一些实施方式中,语音指令所控制的部件为车辆10的空调130,重复的语音指令的功能为空调130的输出温度调节。该场景下,部件的实际运行参数包括空调130的实际输出温度,用户行为数据包括空调130的输出温度的历史数据,参考运行参数包括根据输出温度的历史数据确定出的参考输出温度。
78.作为一个示例,输出温度的历史数据中包括在不同的天气温度下空调130的输出温度,若同一天气温度对应多个输出温度,可将多个输出温度的众数或平均数作为该天气温度对应的输出温度。车机120根据输出温度的历史数据确定参考输出温度的方式可包括:获取当前的天气温度,将该天气温度对应的输出温度确定为参考输出温度。
79.应当理解的是,在未背离本技术教导的情况下,还可通过其他方式设置空调的参考输出温度,本技术对此不作限制。
80.以车机120在同一时间段接收到n条指示升高空调温度的语音指令,且车机120当前设置的温度调节量为b
°
为例,车机120对重复的语音指令的处理过程如下:
81.若空调130当前的实际输出温度小于参考输出温度,车机120判定调整方向和变化方向相同,并继续判断实际输出温度和参考输出温度的差值是否大于第二阈值,若确定是,对n条的语音指令进行合并处理以得到指示将输出温度升高n*b
°
的控制指令,若确定不是,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将输出温度升高b
°
;
82.若空调130当前的实际输出温度大于参考输出温度,判定调整方向和变化方向相反,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将输出温度升高b
°
。
83.以车机120在同一时间段接收到n条指示降低空调温度的语音指令,且车机120当前设置的温度调节量为b
°
为例,车机120对重复的语音指令的处理过程如下:
84.若空调130当前的实际输出温度小于等于参考输出温度,判定调整方向和变化方向相反,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将输出温度降低b
°
;
85.若空调130当前的实际输出温度大于参考输出温度,车机120判定调整方向和变化方向相同,并继续判断实际输出温度和参考输出温度的差值是否大于第二阈值,若确定是,对n条的语音指令进行合并处理得到指示将输出温度降低n*b
°
的控制指令,若确定不是,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将输出温度降低b
°
。
86.应当理解的是,第二阈值可为预设的数值,也可以是根据n*b的值确定,例如,第二阈值等于或略小于n*b。
87.应当理解的是,语音指令被待执行队列,通常情况下,重复的语音指令为2条,即n=2,若2条语音指令分别指示将音量增加b1度和b2度(b1≠b2),则合并处理后的得到的控制指令指示将音量增加(b1+b2)度,而第二阈值可等于或略小于b1+b2。换言之,合并后的控制指令的控制效果根据各重复的语音指令共同达到的控制效果确定,第二阈值亦可根据各重复的语音指令共同达到的控制效果确定。
88.通过上述内容可知,在当前调整方向和变化方向相同且实际输出温度和参考输出温度相距较大时,车机120将语音指令进行合并处理,以使得调整后的输出温度更接近参考输出温度,更符合用户使用习惯,降低用户再次触发重复的语音指令的概率,提高了用户使用体验,从一定程度上降低了车机120的数据处理量。
89.应当理解的是,与空调130对应的语音指令还可以包括指示风速调节的语音指令等,车机120对该类重复的语音指令的处理逻辑可参考重复的指示输出温度调节类的语音指令的处理逻辑,此处不一一赘述。
90.实施例3
91.在本技术的一些实施方式中,语音指令所控制的部件为车辆10的发光器件140,重复的语音指令的功能为发光器件140的亮度调节。该场景下,部件的实际运行参数包括发光器件140的当前亮度,参考运行参数包括发光器件140的参考亮度,参考亮度可根据发光器件140的亮度的历史数据和/或车辆10的环境参数确定。其中,车辆10的环境参数包括车辆
10检测的环境亮度或车辆10查询的当日天气信息。
92.作为一个示例,车机120可存储有不同的环境亮度对应的屏幕亮度。在确定参考亮度的过程中,车机120可将检测到的环境亮度对应的屏幕亮度作为参考亮度。
93.应当理解的是,不同环境亮度对应的屏幕亮度可以由厂商或用户设置,也可以有车机120根据该环境亮度下发光器件的亮度的历史数据确定,本技术对此不作限制。
94.作为另一示例,车机120可存储有不同天气对应的屏幕亮度,在确定参考亮度的过程中,车机120可将当前天气对应的屏幕亮度作为参考亮度。
95.应当理解的是,不同天气对应的屏幕亮度可以由厂商或用户设置,也可以有车机120根据该天气下发光器件的亮度的历史数据确定,本技术对此不作限制。
96.应当理解的是,在未背离本技术教导的情况下,车机120还可通过其他方式确定参考亮度,本技术对此不作限制。
97.以车机120在同一时间段接收到n条指示调亮发光器件140的语音指令,且车机120当前设置的温度调节量为t cd/m2为例,车机120对重复的语音指令的处理过程如下:
98.若发光器件140的当前亮度小于参考亮度,车机120判定调整方向和变化方向相同,并继续判断当前亮度和参考亮度的差值是否大于第三阈值,若确定是,对n条的语音指令进行合并处理得到指示将亮度升高n*t cd/m2的控制指令,若确定不是,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将亮度升高t cd/m2;
99.若发光器件140的当前亮度大于等于参考亮度,判定调整方向和变化方向相反,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将亮度升高t cd/m2。
100.以车机120在同一时间段接收到n条指示降低发光器件140的语音指令,且车机120当前设置的温度调节量为t cd/m2为例,车机120对重复的语音指令的处理过程如下:
101.若发光器件140的当前亮度小于等于参考亮度,判定调整方向和变化方向相反,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将亮度降低t cd/m2;
102.若发光器件140的当前亮度大于参考亮度,车机120判定调整方向和变化方向相同,并继续判断实际输出温度和参考输出温度的差值是否大于第三阈值,若确定是,对n条的语音指令进行合并处理得到指示将将亮度降低n*t cd/m2的控制指令,若确定不是,对n条的语音指令进行删除处理以去除其中n-1条语音指令而剩余一条语音指令作为控制指令,该控制指令指示将亮度降低t cd/m2。
103.应当理解的是,第三阈值可为预设的数值,也可以是根据n*t的值确定,例如,第三阈值等于或略小于n*t。
104.应当理解的是,语音指令被待执行队列,通常情况下,重复的语音指令为2条,即n=2,若2条语音指令分别指示将音量增加t1 cd/m2和t2 cd/m2(t1≠t2),则合并处理后的得到的控制指令指示将音量增加(t1+t2)cd/m2,而第三阈值可等于或略小于t1+t2。换言之,合并后的控制指令的控制效果根据各重复的语音指令共同达到的控制效果确定,第三阈值亦可根据各重复的语音指令共同达到的控制效果确定。
105.通过上述内容可知,在当前亮度和参考亮度相距较大,且当前调整方向和变化方
向相同时,车机120将语音指令进行合并处理,以使得调整后的亮度更接近参考亮度,更符合用户使用习惯,降低用户再次触发重复的语音指令的概率,提高了用户使用体验,从一定程度上降低了车机120的数据处理量。
106.应当理解的是,在未背离本技术教导的情况下,控制车辆10的其他部件的语音指令也可以参考上述实施例的示例性说明,本技术对此不作限制。
107.在完成车机120对重复的语音指令的处理方式的示例性说明后,下面对车机120对冲突的语音指令的处理方式进行示例性说明。
108.在本技术的一些实施方式中,车机120在确定多条语音指令中存在冲突的语音指令后,可将冲突的语音指令中被触发的时间更晚的语音指令确定为控制指令。示例的,语音指令a和语音指令c存在冲突,语音指令c先加入待执行队列,语音指令a正要加入待执行队列,则将语音指令a确定为控制指令。
109.可选择的,确定出的控制指令可直接下发至所控制的部件的处理模块,也可加入待执行队列,并更新其被触发时间,本技术对此不作限制。
110.上述方案中,车机120将晚触发的语音指令确定为控制指令,优化了车机120语音控制逻辑,拦截了错误的语音指令,给予用户“后悔”的机会,提高了用户使用体验。
111.根据本技术的一些实施方式,车辆10设置有连续说模式,用户无需反复说出唤醒词或反复触发语音录制控件即可与车机120交互,可进一步简化用户语音操作,可减少用户在行车过程中为了触发语音控制服务而转移注意力导致的行车安全问题。针对车辆10的连续说模式,车机120对用户在同一时间段内触发的多条语音指令进行逻辑关系判断以确定最终执行的控制指令,从而为用户提供更好地语音控制服务。
112.上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
113.本技术的实施方式还提供一种电子设备,该电子设备可包括:至少一个处理器和存储器,存储器与至少一个处理器通信连接,并存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施方式提及的语音控制方法200。
114.在本技术的一些实施方式中,该电子设备可以是车辆10中的车机120,也可以是可控制车辆10内的部件的其他终端,本技术对此不作限制。
115.本技术的一个实施方式还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序被处理器执行时,实现上述实施方式提及的语音控制方法200。
116.图3是根据本技术的一些实施方式的电子设备30的示意性框图。如图3所示,电子设备30包括处理器301,其可以根据存储在只读存储器(rom)302中的计算机程序或者从存储器308加载到随机访问存储器(ram)303中的计算机程序,来执行各种适当的动作和处理。在ram 303中,还可存储电子设备30操作所需的各种程序和数据。处理器301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
117.电子设备30中的多个部件连接至i/o接口305,包括:输入单元306,例如,按钮、触控屏等;输出单元307,与例如各种类型的显示器、扬声器等连接,以输出各种形式的信号;
存储器308,包括用于存储计算机可执行程序的任意媒介;以及通信单元309,例如网卡、调制解调器、无线通信收发机等。通信单元309允许电子设备30通过诸如局域网或其它无线通信网络与其他设备交换信息/数据。
118.处理器301可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器301的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器301执行上文所描述的各个方法和处理,例如上述实施方式提及的语音控制方法。例如,在一些实施方式中,上述实施方式提及的语音控制方法可被实现为计算机软件程序,其被有形地包含于计算机可读存储介质,例如存储器308。在一些实施方式中,计算机程序的部分或者全部可以经由rom 302和/或通信单元309而被载入和/或安装到电子设备30上。当计算机程序加载到ram 303并由处理器301执行时,可以执行上文描述的上述实施方式提及的语音控制方法的一个或多个步骤。备选地,在其他实施方式中,处理器301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述实施方式提及的语音控制方法。
119.本文中参照根据本技术示例性实施方式的方法、设备(系统)、和计算机程序产品的流程图和/或时序图描述了本技术的各个方面。应当理解,流程图和/或时序图的每个步骤以及流程图和/或时序图中各步骤的组合,都可以由计算机可读程序指令实现。
120.这些计算机可读程序指令可以提供给电子设备中的处理器、通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤的各个方面的指令。
121.也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤。
122.附图中的流程图和时序图显示了根据本技术的多个实施方式的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或时序图中的每个步骤可以代表一个模块、程序段或指令的一部分,该模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实施方式中,步骤中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,时序图和/或流程图中的每个步骤、以及时序图和/或流程图中的步骤的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
123.以上描述仅为本技术的实施方式以及对所运用技术原理的说明。本领域技术人员应当理解,本技术中所涉及的保护范围,并不限于上述技术特征的特定组合而成的技术方
案,同时也应涵盖在不脱离技术构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
技术特征:
1.一种语音控制方法,其特征在于,包括:响应于车辆处于连续说模式,且在同一时间段内获取到多条语音指令,确定
所述多条语音指令的逻辑关系,所述逻辑关系至少包括冲突和重复;以及基于所述多条语音指令的逻辑关系和所述多条语音指令确定出最终执行的控制指令。2.根据权利要求1所述的方法,其中,所述基于所述多条语音指令的逻辑关系和所述多条语音指令确定出最终执行的控制指令包括:响应于所述多条语音指令的逻辑关系指示所述多条语音指令中存在重复的语音指令,获取所述重复的语音指令所控制的部件的实际运行参数,以及所控制的部件的参考运行参数;以及根据所述实际运行参数和所述参考运行参数的数值关系,对所述重复的语音指令进行合并处理或删除处理以得到所述控制指令。3.根据权利要求2所述的方法,其中,所述根据所述实际运行参数和所述参考运行参数的数值关系,对所述重复的语音指令进行合并处理或删除处理以得到所述控制指令包括:响应于所述数值关系符合预设的合并条件,对所述重复的语音指令进行合并处理以得到所述控制指令,所述控制指令的执行效果与所述重复的语音指令均被执行的执行效果相同;以及响应于所述数值关系不符合预设的合并条件,对所述重复的语音指令进行删除处理以得到所述控制指令,所述控制指令为所述重复的语音指令中的一个。4.根据权利要求2所述的方法,其中,所述部件的参考运行参数根据所述部件的用户行为数据确定。5.根据权利要求4所述的方法,其中,所述重复的语音指令所控制的部件包括所述车辆的发声器,所述重复的语音指令的功能为所述发声器的音量调节,所述实际运行参数包括所述发声器的实际音量,所述用户行为数据包括所述发声器的音量的历史数据;或者,所述重复的语音指令所控制的部件包括所述车辆的空调,所述重复的语音指令的功能为所述空调的输出温度调节,所述实际运行参数包括所述空调的实际输出温度,所述用户行为数据包括所述空调的输出温度的历史数据。6.根据权利要求2所述的方法,其中,所述部件的参考运行参数根据所述部件周围的环境参数确定。7.根据权利要求6所述的方法,其中,所述重复的语音指令所控制的部件包括所述车辆的发光器件,所述重复的语音指令的功能为所述发光器件的亮度调节,所述实际运行参数包括所述发光器件的当前亮度,所述车辆的环境参数包括所述车辆检测的环境亮度或所述车辆查询的当日天气信息。8.根据权利要求1所述的方法,其中,所述基于所述多条语音指令的逻辑关系和所述多条语音指令确定出最终执行的控制指令包括:响应于所述多条语音指令的逻辑关系指示所述多条语音指令中存在冲突的语音指令,将所述冲突的语音指令中被触发的时间更晚的语音指令确定为所述控制指令。9.根据权利要求1至8中任一项所述的方法,其中,所述方法还包括:获取语音数据;对所述语音数据进行识别以得到所述语音数据对应的语音指令;
将所述语音数据对应的语音指令加入待执行队列中,并在所述待执行队列中记录所述语音数据对应的语音指令被触发的时间,其中,所述待执行队列中被触发的时间与当前时间的时间差大于等于时间阈值的语音指令被执行;以及通过所述待执行队列判断是否存在多条语音指令。10.根据权利要求9所述的方法,其中,所述确定所述多条语音指令的逻辑关系包括:确定所述待执行队列中新加入的语音指令与之前加入的语音指令之间的逻辑关系。11.一种电子设备,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至10中任一项所述的语音控制方法。12.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至10中任一项所述的语音控制方法。
技术总结
本申请的实施方式提供了一种语音控制方法、电子设备及计算机可读存储介质。在一些实施方式中,语音控制方法包括:响应于车辆处于连续说模式,且在同一时间段内获取到多条语音指令,确定所述多条语音指令的逻辑关系,并基于所述多条语音指令的逻辑关系和所述多条语音指令确定出最终执行的控制指令。其中,逻辑关系至少包括冲突和重复。关系至少包括冲突和重复。关系至少包括冲突和重复。
技术研发人员:
陈立荣
受保护的技术使用者:
博泰车联网(南京)有限公司
技术研发日:
2022.11.02
技术公布日:
2023/2/3