1.本公开涉及用于生成唯一地识别各种
声音的视觉
符号的系统和方法。
背景技术:
2.一个人通常难以向以前没有听过某种声音的另一个人准确地描述该声音。通常,另一个人可能会试图基于他/她过去暴露于其他声音来解释对声音的描述。因此,例如,如果声音被描述为“轰隆隆”,则第一人可能听到这个词并基于他/她过去在雷暴期间听到雷击的经验来解释
所述描述,第二人可能会基于他/她过去在演唱会场所处的经验来解释同一个词,并且第三人可能会基于他/她过去在施工现场听到爆炸的经验来解释同一个词。
3.因此,期望提供一种可以更一致且可靠的方式表征声音的方式。还期望以可以由计算机操作以执行各种类型的动作的格式提供这种表征。
技术实现要素:
4.依据总体概述,本公开涉及用于生成唯一地识别各种声音的视觉符号的系统和方法。用于生成视觉符号的示例性方法可以涉及识别声音并将量化值分配给所述声音的各种属性。在示例性实现方式中,使用数值模板将量化值分配给每个属性。一组此类量化值构成可以被指定为所述声音的视觉符号的图形表示。在示例性应用中,对应于所述视觉符号的所述量化值可以与对应于其他声音的其他视觉符号的量化值一起存储在存储器中。然后,所述存储器可以用于各种目的,诸如例如执行对与期望声音类似的声音的搜索。
附图说明
5.下面参考附图给出具体实施方式。使用相同的附图标记可以指示类似或相同的项。各种实施例可以利用除了附图中示出的那些之外的元件和/或部件,并且一些元件和/或部件可能不存在于各种实施例中。附图中的元件和/或部件不一定按比例绘制。在整个本公开中,根据上下文,单数和复数术语可以可互换地使用。
6.图1示出了根据本公开的其中对象产生可以转换成视觉符号的声音的示例性场景。
7.图2示出了根据本公开的实施例的可以用于表征声音的第一示例性模板。
8.图3示出了根据本公开的实施例的可以用于表征声音的第二示例性模板。
9.图4示出了根据本公开的实施例的可以用于产生平均视觉符号的第三示例性模板。
10.图5示出了根据本公开的实施例的用于生成声音的视觉符号的方法的流程图。
11.图6示出了根据本公开的实施例的用于在存储器中搜索声音的视觉符号的方法的流程图。
具体实施方式
12.下文将参考附图更全面地描述本公开,其中示出了本公开的示例性实施例。然而,本公开可以以许多不同形式来体现,并且不应被解释为受限于本文阐述的示例性实施例。相关领域技术人员将理解,在不脱离本公开的精神和范围的情况下可对各种实施例作出形式和细节上的各种变化。因此,本公开的广度和范围不应受到上述示例性实施例中的任何一个限制,而是应仅根据所附权利要求和其等效物限定。以下描述是为了说明目的而呈现,并且不意图是详尽性的或受限于所公开的精确形式。应当理解,替代实现方式可以任何期望的组合来使用,以形成本公开的另外的混合实现方式。例如,相对于特定装置或部件描述的功能中的任一者可以由另一个装置或部件执行。此外,尽管已描述了特定的装置特性,但本公开的实施例可涉及许多其他装置特性。另外,尽管已用特定于结构特征和/或方法动作的语言描述了实施例,但是应理解,本公开不一定受限于所描述的特定特征或动作。而是,将特定特征和动作公开为实现实施例的说明性形式。
13.本文使用的某些词语和短语应被解释为指代本领域普通技术人员通常以各种形式和等效形式理解的各种对象和动作。例如,如本文所使用的短语“心理刺激”可适用于声音中存在的各种属性中的任何属性。如本文所使用的词语“声音”是指各种类型的声音中的任何声音,诸如例如声音剪辑、声音片断、声音段、由第一对象与第二对象接触发出的声音、由移动对象发出的声音、通过扬声器产生的声音、来自歌曲的片断、音乐片断和/或声音信号的数字表示(例如,如由模数转换器装置产生)。如本文所使用的短语“在示例性实现方式中”必须被理解为短语“在根据本公开的示例性实现方式中”的缩写版本。应理解,如本文所使用的词语“示例”意图在本质上是非排他性的和非限制性的。
14.图1示出了根据本公开的其中对象产生可以转换成视觉符号的声音的示例性场景。在该示例性场景中,产生声音的对象是车辆115。在其他场景中,根据本公开,各种其他对象可以产生可以由一个或多个个体解释以生成各种视觉符号的各种类型的声音。
15.与车辆115相关联的声音可以是各种类型的声音中的任何声音,诸如例如当车门关闭时产生的声音、行李厢盖关闭时产生的声音、发动机舱盖关闭时产生的声音、车门打开时的响铃声音、发动机加速的声音或通过信息娱乐系统产生的语音通知。此类声音中的每一个可以是声音剪辑、声音突发脉冲、声音片断或声音段。在示例性应用中,此类声音的持续时间小于三分钟。然而,在其他应用中,本文公开的过程同样可适用于在更长的持续时间内延续的声音,包括例如歌曲或音乐编曲。
16.在图1所示的示例性场景中,当个体110关闭车辆115的车门时产生声音。在一种情况下,车辆115可以是豪华轿车,其包括结合有用于抑制声音的各种类型的声学材料的车门。因此,由关闭车门产生的声音具有第一组声音属性。在另一种情况下,车辆115可以是包括具有较少声学材料的重型金属车门的多用途卡车。在这种情况下,由关闭车门产生的声音具有与第一组属性不同的第二组声音属性。
17.个体110可以是例如识别属性差异并且本能地将第一组属性与豪华车辆相关联并且将第二组属性与多用途卡车相关联的车辆爱好者。个体110可能试图通过一些描述性词语(诸如例如豪华车辆的车门的“低沉的撞击声”或“轻柔的关闭”,和卡车的车门的“金属铛铛声”或“重击声”)向某个其他人(未示出)描述这些差异。另一个人可能试图基于他/她过去暴露于各种类型的声音(诸如例如建筑物的门被关闭或银行金库的门被关闭)来解释所
述描述。这种解释在一些情况下可能是不充分的,而在一些其他情况下可能是不准确的。此外,使用此类定性描述来指示计算机执行某些操作(诸如例如搜索与豪华轿车的车门产生的声音类似的声音)或执行由豪华轿车的车门产生的声音与由建筑物的门产生的声音之间的比较分析可能是具有挑战性的。因此,期望提供一种根据本公开通过量化声音的各种声音属性来表征声音的方式。如本文所使用的短语“心理刺激”涵盖这些各种声音属性。
18.图2示出了根据本公开的实施例的可以用于通过量化各种声音属性来表征声音的第一示例性模板200。模板200是可以包括两个或更多个
标度的数值模板,诸如例如标度205、标度210、标度215、标度220、标度225和标度230。每个标度在数值范围内扩展。在图2所示的示例性实现方式中,每个标度从0扩展到10。在另一个示例性实现方式中,每个标度可以从1扩展到100。在又一个示例性实现方式中,每个标度可以包括正值以及负值,诸如例如从-10到+10。
19.模板200中包括的标度的数量可以对应于声音中存在的心理刺激的数量。心理刺激的性质和数量可以根据所表征的声音和/或通过执行表征的实体(例如,车辆制造商或音乐制作人)而变化。例如,由单个声源(车辆的部件、个体、单个乐器等)产生的声音的特征在于比由多个声源以同时方式产生的声音(管弦乐队、周围街道声音、在车辆中的发动机噪声上听到的无线电声音等)更少的心理刺激。一些其他示例性心理刺激可以由诸如旋律(例如,不协调到和谐)、节奏(例如,无规律到有节奏)、纹理(乐器的数量或声音层、人为到自然、通常所有二元物)、结构/形式(例如,像奏鸣曲与流行歌曲的音乐或声音的分类)、情感表现(例如,柔和到充满热情、消极到积极)、情境(例如,听者体、当日时间、将播放音乐或声音所在的相关联环境、或者将播放音乐或声音期间的情绪)来定义。
20.在示例性实现方式中,模板200可以显示在计算机的显示屏上。通过使用模板200执行声音片断(或任何其他类型的声音)的表征的个体可以通过放置光标(通过操作鼠标或经由触摸屏动作)来指示每个标度上的选择。模板200的标度205与被标记为人为声音的第一心理刺激相关联。个体可以基于他/她将声音片断感知为具有人为声音质量(例如诸如将由音乐合成器产生)来将第一量化值分配给第一心理刺激。数值10将指示个体将声音片断感知为高度人为的声响。较低的数值指示较低水平的人为性。在该示例中,个体分配第一量化值3。
21.模板200的标度210与被标记为不协调声音的第二心理刺激相关联。执行声音片断的表征的个体可以基于他/她将声音片断感知为具有不协调声音质量(例如诸如将由摔门产生)来将第二量化值分配给第二心理刺激。数值10将指示个体将声音片断感知为高度不协调的声响(其中较低数字指示较低水平的不协调性)。在该示例中,个体分配第二量化值6。
22.模板200的标度215与被标记为无规律声音的第三心理刺激相关联。执行声音片断的表征的个体可以基于他/她将声音片断感知为具有无规律声音质量(例如诸如将由起动发动机产生)来将第三量化值分配给第三心理刺激。数值10将指示个体将声音片断感知为高度无规律的声响(其中较低数字指示较低水平的无规律性)。在该示例中,个体分配第三量化值7。
23.模板200的标度220与被标记为环境声音的第四心理刺激相关联。执行声音片断的表征的个体可以基于他/她将声音片断感知为具有环境声音质量(例如诸如与电梯音乐相
关联)来将第四量化值分配给第四心理刺激。数值10将指示个体将声音片断感知为高度环境的声响(其中较低数字指示较低水平的环境性)。在该示例中,个体分配第四量化值3。
24.模板200的标度225与被标记为柔和声音的第五心理刺激相关联。执行声音片断的表征的个体可以基于他/她将声音片断感知为具有柔和声音质量(例如诸如将由车辆中的响铃产生)来将第五量化值分配给第五心理刺激。数值10将指示个体将声音片断感知为高度柔和的声响(其中较低数字指示较低水平的柔和度)。在该示例中,个体分配第五量化值2。
25.模板200的标度230与被标记为中性声音的第六心理刺激相关联。执行声音片断的表征的个体可以基于他/她将声音片断感知为具有消极声音质量(例如诸如将由刺耳的警报声产生)来将第六量化值分配给第六心理刺激。数值10将指示个体将声音片断感知为高度消极的声响(其中较低数字指示较低水平的消极性)。在该示例中,个体分配第六量化值1。
26.可以在计算机的显示屏上显示各种动作图标和/或消息,以允许个体执行附加操作,诸如例如查看、编辑、修改和接受他/她对模板200执行的选择。当个体已经接受他/她的选择时,计算机可以基于选定的量化值来产生声音片断的图形表示。在一个示例性实现方式中,计算机可以使用线性段来连接选定的量化值以产生图2所示的图形表示。在另一个示例性实现方式中,计算机可以使用非线性段来连接选定的量化值以产生弯曲的图形表示。
27.然后,计算机可以将图形表示指定为声音片断的视觉符号,并将视觉符号存储在存储器中。在示例性实现方式中,视觉符号可以在模板200上为各种心理刺激指定的量化值的形式存储在存储器中。在该示例中,视觉符号的所存储的量化值可以是367321。在一些情况下,标签可以文件名的形式附接到所存储的视觉符号。
28.在所存储的视觉符号的第一示例性使用中,计算机的用户可以将查询输入到计算机中以定位并检索视觉符号。所述查询可以包括整个数字367321或数字367321的一部分以及文件名,以用于定位和检索视觉符号。在另一个示例性操作中,用户可能希望识别与同视觉符号相关联的声音片断听起来类似的一个或多个其他声音。在这种情况下,查询可以被格式化为367*,其中*指示通配符搜索。计算机可以通过显示以367开始的所有视觉符号来响应查询。其他此类数值可以用于执行其他类型的搜索。例如,可以通过输入诸如例如32*的查询来发起对环境柔和声音的搜索。计算机可以通过显示包括环境心理刺激的量化值3和柔和心理刺激的量化值2的所有视觉符号来响应查询。
29.在另一个示例性实现方式中,视觉符号可以坐标值的形式存储在存储器中,以用于在计算机的显示屏上呈现视觉符号。计算机的用户可以观察视觉符号并执行各种操作,诸如例如将视觉符号的形状与显示在显示屏上的其他视觉符号的形状进行视觉比较。例如,可以执行比较,以便识别与同所显示的视觉符号相关联的声音片断听起来类似的其他声音。
30.图3示出了根据本公开的实施例的可以用于表征声音的第二示例性模板300。模板300的各种标度在与每个标度相关联的功能性和数值方面类似于模板200的那些标度。然而,模板300的每个标度都提供两种类型的心理刺激之间的比较评估。显示在数字标度左侧的第一组心理刺激对应于模板200中所示的心理刺激。显示在数字标度右侧的第二组心理刺激对应于在声音感知方面可能与第一组心理刺激的声音感知相反的各种心理刺激。
31.更具体地,模板300包括标度305,所述标度允许在其上显示模板300的计算机的用户选择心理刺激的量化值,所述量化值的范围可以从人为声音到自然声音。数值0指示高度人为的心理刺激,并且数值10指示高度自然的心理刺激,其间的值在从高度人为到高度自然的等级范围内。
32.通过使用模板300执行声音片断(或任何其他类型的声音)的表征的个体可以将第一量化值分配给第一心理刺激。第一量化值可以是基于他/她将声音片断感知为具有人为声音质量(诸如将由音乐合成器产生)的数值。数值10将指示个体将声音片断感知为高度人为的声响(其中较低数字指示较低水平的人为性)。在所示示例中,执行表征的个体在标度305上分配量化值1,因为个体感知到声音段具有很大程度上是人为的第一心理刺激。
33.模板300还包括标度310,所述标度允许通过使用模板300执行声音片断(或任何其他类型的声音)的表征的个体将第二量化值分配给范围可以从不协调到和谐的心理刺激。然后,个体可以在标度310上分配量化值3,因为个体感知到声音段具有略微不协调的第二心理刺激。
34.模板300还包括标度315,所述标度允许个体将第三量化值分配给范围可以从无规律到有节奏的心理刺激。然后,个体可以在标度315上分配量化值2,因为个体感知到声音段具有略微无规律的第三心理刺激。
35.模板300还包括标度320,所述标度允许个体将第四量化值分配给范围可以从环境到吸引人的心理刺激。然后,个体可以在标度320上分配量化值2,因为个体感知到声音段具有相当环境的第四心理刺激。
36.模板300还包括标度325,所述标度允许个体将第五量化值分配给范围可以从柔和到充满热情的心理刺激。然后,个体可以在标度325上分配量化值4,因为个体感知到声音段具有略微柔和的第五心理刺激。
37.模板300还包括标度330,所述标度允许个体将第六量化值分配给范围可以从中性到积极的心理刺激。然后,个体可以在标度330上分配量化值2,因为个体感知到声音段具有略微消极的第六心理刺激。
38.可以以诸如上面关于模板200描述的方式的方式对制成模板300的条目起作用。例如,可以在计算机的显示屏上显示各种动作图标和/或消息,以允许个体执行附加操作,诸如例如查看、编辑、修改和接受他/她对模板300执行的选择。当个体已经接受他/她的选择时,计算机可以连接选定的量化值来产生声音片断的图形表示,所述图形表示可以被指定为所述声音片断的视觉符号。视觉符号可以存储在存储器中并以各种方式使用,诸如上述方式。
39.图4示出了根据本公开的实施例的可以用于产生平均视觉符号的模板400。上面关于图3提供的描述公开了其中单个个体使用模板300来创建声音片断的视觉符号的过程。在一些场景中,由第一个体创建的视觉符号可能不一定反映其他个体如何感知声音片断。因此,模板400可以用于基于从“n”(n≥2)个个体获得的输入来产生声音片断的视觉符号。
40.视觉符号405是由第一个体使用上述方法产生的视觉符号。第二个体可以使用上述同一程序来基于他/她如何感知第一个体所听到的用于创建视觉符号405的同一声音段中的音组分而产生视觉符号415。第三个体可以使用上述同一程序来基于他/她如何感知第一个体收所听到的用于创建视觉符号405的同一声音段中的音组分而产生视觉符号
420。
41.第二个体的量化值与第一个体的量化值不同。然而,视觉符号415的总体轮廓略微类似于视觉符号405的总体轮廓。计算机可以评估两个视觉符号的量化值,并且生成基于对视觉符号405和视觉符号415的各种量化值求平均的视觉符号410。
42.在示例性实现方式中,可以在每个标度的基础上执行平均。因此,基于对标度305上的量化值1(对应于视觉符号405)和量化值3(对应于视觉符号415)求平均来确定标度305的平均值2。确定标度310的平均值为4(3和5的平均值)、标度315的平均值为3(2和4的平均值)、标度320的平均值为3(2和4的平均值)、标度325的平均值为4.5(4和5的平均值)、以及标度330的平均值为3(2和4的平均值)。平均视觉符号410可以存储在存储器中并且用于响应查询,诸如检索查询和搜索查询。在其他实现方式中,可以通过对由两个以上的个体提交的量化值求平均来产生视觉符号410。
43.第三个体的量化值与第一个体和第二个体的量化值不同。此外,与视觉符号405和视觉符号415相比,视觉符号420的总体轮廓是不同的。计算机可以评估视觉符号420的轮廓,并且确定视觉符号420是在执行上述求平均过程时应忽略的异常值。
44.图5示出了根据本公开的实施例的用于生成声音的视觉符号的方法的流程图500。流程图500示出了可以硬件、软件或其组合实现的一系列操作。在软件的背景下,所述操作表示存储在一个或多个非暂时性计算机可读介质(诸如计算机中的存储器)上的计算机可执行指令,所述计算机可执行指令在由一个或多个处理器(诸如计算机中的处理器)执行时执行所列举的操作。一般而言,计算机可执行指令包括执行特定功能或实现特定抽象数据类型的例程、程序、对象、部件、数据结构等。描述操作的顺序不意图被解释为限制,并且任何数量的所描述的操作可以不同的顺序执行、省略、以任何顺序组合和/或并行执行。
45.在框505处,一个或多个个体听到声音。每个个体可以以各种方式感知声音的各种属性。感知可能由于各种因素而变化,所述各种因素诸如例如个体的听觉能力(较年轻的人可能会听到比年长的人更宽的频率范围的声音)、个体的分析能力(工程师可能以与艺术家不同的方式感知声音)、个体的注意力(例如,成年人可能比青少年更专注)、个体的音乐技能/背景(音乐家可能会识别出非音乐家可能无法识别的音质)等等。各种声音属性在本文中被称为声音的心理刺激。
46.在框510处,一个或多个听者将量化值分配给各种心理刺激。可以为任何数量的心理刺激分配量化值。在示例性实现方式中,一个或多个听者通过使用模板(诸如例如上述模板200或模板300)将量化值分配给各种心理刺激。
47.在任选的框515处,可以将声音分类在各种类别下。分类可以基于各种标准,诸如例如基于在存储器中搜索具有特定心理刺激的声音时的搜索考虑因素。作为一个示例,声音可以被分类为车辆声音,以便允许搜索具有可能与车辆声音(关闭车门、响铃等)相关联的心理刺激的声音(或其他声音)。
48.在框520处,可以创建声音的视觉符号。在示例性实现方式中,可以从在模板上产生的图形表示创建视觉符号。可以通过对由两个或更多个个体提交的量化值求平均来产生上面描述的示例性视觉符号410。
49.在框525处,可以将视觉符号存储在存储器中。在示例性实现方式中,视觉符号可以被存储为一组数值(数字位)。在另一个示例性实现方式中,视觉符号可以被存储为坐标
值,用于在显示屏上生成视觉符号。在又一个示例性实现方式中,视觉符号可以被存储为文件。文件可以包括文件名和使文件更易于搜索的其他属性(例如,文件扩展名或元数据)。
50.图6示出了根据本公开的实施例的用于在存储器中搜索声音的视觉符号的方法的流程图600。在一些情况下,存储器可以被配置为用于存储视觉符号和相关联信息的数据库。在框605处,可以识别声音的各种属性。如果声音是车辆声音(例如,车门响铃的声音),则可以识别各种心理刺激,诸如例如和谐心理刺激、柔和音组分、充满热情的音组分、有节奏的心理刺激或者刺耳的心理刺激。所述识别可以基于车门响铃的期望类型的声音质量。在一种情况下,可能期望以温和的不唐突的提醒的形式操作响铃。在另一种情况下,可能期望以刺耳的强烈要求警告的形式操作响铃。
51.在框610处,确定是否期望在存储器中搜索与由特定视觉符号指定的声音匹配或基本上类似的声音。
52.如果期望定位与由特定视觉符号指定的声音匹配或基本上类似的声音,则在框615处,可以通过查询可以存储各种视觉符号的存储器来发起搜索。当存储器被配置为数据库时,可以通过使用数据库类型查询来进行搜索。在一些情况下,查询可以涉及定位与查询中定义的视觉符号参数完全匹配的一个或多个视觉符号。在一些其他情况下,查询可以涉及定位具有与查询中所定义类似的视觉符号参数的一个或多个视觉符号。
53.在示例性实现方式中,存储在存储器中的视觉符号可以以调板的形式进行配置。可以通过识别共享某种类型的相似性的两个或更多个声音和对其分组来定义所述调板。相似性可以基于各种标准,诸如例如基于环境(诸如例如与车辆相关联的声音)、基于共享特性(柔和声音、有节奏声音、自然声音等)、基于业主权益(诸如例如,可能与制造商、产品或品牌唯一地相关联的声音)以及两种声音之间的差异程度。
54.在示例性实现方式中,可以使用数值参数(诸如例如公差值或统计参数(偏差、中值等))来指定两种声音之间的差异程度。因此,例如,类似的声音可以被指定为具有相对于上述(并且在图4中示出)视觉符号410的心理刺激的数值具有10%公差的心理刺激的声音。
55.如果在框610处确定期望在存储器中搜索与由特定视觉符号指定的声音不类似的声音,则在框620处,可以通过使用可以指示声音中一个或多个优选的心理刺激的查询来执行搜索。例如,查询可以涉及定位具有在模板200的标度220上范围从约1到约6的环境心理刺激和/或在模板200的标度225上范围从约1到约6的柔和心理刺激的一个或多个声音。
56.在以上公开中,已经参考了形成以上公开的一部分的附图,附图示出了可实践本公开的具体实现方式。应理解,在不脱离本公开的范围的情况下,可以利用其他实现方式,并且可以进行结构改变。说明书中对“一个实施例”、“实施例”、“示例性实施例”、“示例性实现方式”等的引用指示所描述的实施例或实现方式可以包括特定的特征、结构或特性,但是每个实施例或实现方式不必包括特定的特征、结构或特性。此外,此类短语不一定指相同的实施例或实现方式。此外,当结合实施例或实现方式描述特定特征、结构或特性时,无论是否明确地描述,本领域技术人员都将认识到结合其他实施例或实现方式的此类特征、结构或特性。例如,上文关于自主停车操纵所描述的各种特征、方面和动作适用于各种其他自主操纵,并且必须相应地进行解释。
57.本文所公开的系统、设备、装置和方法的实现方式可以包括或利用包括硬件(诸如,例如本文所讨论的一个或多个处理器和系统存储器)的一个或多个装置。计算机可执行
指令包括例如在处理器处执行时致使处理器执行特定功能或功能组的指令和数据。计算机可执行指令可以是例如二进制代码、中间格式指令(诸如汇编语言)或甚至源代码。虽然已经用特定于结构特征和/或方法动作的语言描述了本主题,但是应理解,在所附权利要求中限定的主题不一定限于上面描述的所述特征或动作。而是,所描述的特征和动作被公开作为实现权利要求的示例性形式。
58.存储器装置可以包括任一存储器元件或易失性存储器元件(例如,随机存取存储器(ram,诸如dram、sram、sdram等))和非易失性存储器元件(例如rom、硬盘驱动器、磁带、cdrom等)的组合。此外,存储器装置可以并入有电子、磁性、光学和/或其他类型的存储介质。在本文件的背景下,“非暂时性计算机可读介质”可以是例如但不限于电子、磁性、光学、电磁、红外或半导体系统、设备或装置。计算机可读介质的更具体的示例(非详尽列表)将包括以下项:便携式计算机软磁盘(磁性)、随机存取存储器(ram)(电子)、只读存储器(rom)(电子)、可擦除可编程只读存储器(eprom、eeprom或快闪存储器)(电子)以及便携式压缩盘只读存储器(cd rom)(光学)。应注意,计算机可读介质甚至可以是上面打印有程序的纸张或另一种合适的介质,因为可以例如经由对纸张或其他介质的光学扫描来电子地捕获程序,随后进行编译、解译或另外在需要时以合适的方式进行处理,并且随后存储在计算机存储器中。
59.本领域技术人员将理解,本公开可以用许多类型的计算机来实践,所述计算机诸如例如个人计算机、台式计算机、膝上型计算机、消息处理器、用户装置、多处理器系统、基于微处理器的或可编程的消费电子产品、网络pc、小型计算机、大型计算机、移动电话、pda、平板计算机、寻呼机、路由器、交换机、各种存储装置等。本公开还可在分布式系统环境中实践,其中通过网络链接(通过硬连线数据链路、无线数据链路或者通过硬连线数据链路与无线数据链路的任何组合)的本地和远程计算机系统两者都执行任务。在分布式系统环境中,程序模块可以位于本地和远程存储器存储装置两者中。
60.另外,在适当的情况下,本文描述的功能可以在以下项中的一者或多者中执行:硬件、软件、固件、数字部件或模拟部件。例如,一个或多个专用集成电路(asic)可被编程为执行本文所描述的系统和程序中的一者或多者。贯穿说明书以及权利要求使用某些术语指代特定系统部件。如本领域技术人员将理解,部件可以通过不同的名称来指代。本文件不意图区分名称不同但功能相同的部件。
61.本公开的至少一些实施例已经涉及计算机程序产品,其包括存储在任何计算机可用介质上的这种逻辑(例如,以软件的形式)。这种软件当在一个或多个数据处理装置中被执行时致使装置如本文所描述那样进行操作。
62.尽管上文已描述了本公开的各种实施例,但应理解,仅通过示例而非限制的方式呈现本公开的各种实施例。相关领域的技术人员将明白,在不脱离本公开的精神和范围的情况下可进行形式和细节上的各种改变。因此,本公开的广度和范围不应受到上述示例性实施例中的任何一个限制,而是应仅根据所附权利要求和其等效物限定。已经出于说明和描述目的而呈现了前述描述。前述描述不意图是详尽的或将本公开限制于所公开的精确形式。鉴于以上教导,许多修改和变化形式是可能的。此外,应注意,前述可选实现方式中的任一者或全部可按任何所期望的组合使用,以形成本公开的附加混合实现方式。例如,相对于特定装置或部件描述的功能中的任一者可以由另一个装置或部件执行。另外,尽管已经描
述了具体装置特性,但本公开的实施例可能涉及许多其他装置特性。另外,尽管已用特定于结构特征和/或方法动作的语言描述了实施例,但是应理解,本公开不一定受限于所描述的特定特征或动作。而是,将特定特征和动作公开为实现实施例的说明性形式。除非另有特别说明或在使用时在上下文内以其他方式理解,否则诸如尤其是“能够”、“可能”、“可以”或“可”的条件语言通常意图表达某些实施例可以包括某些特征、元件和/或步骤,而其他实施例可以不包括某些特征、元件和/或步骤。因此,此类条件语言一般并不意图暗示一个或多个实施例无论如何都需要各特征、元件和/或步骤。
63.在本发明的一个方面,所述处理器还被配置为访问所述存储器并执行所述计算机可执行指令以执行包括以下各项的操作:接收第三用户输入,所述第三用户输入指示将第三量化值分配给第二声音中的第三心理刺激;接收第四用户输入,所述第四用户输入指示将第四量化值分配给所述第二声音中的第四心理刺激;产生包括所述第三量化值和所述第四量化值的第二图形表示;将所述第二图形表示指定为所述第二声音的第二视觉符号;并且将所述第二视觉符号存储在所述存储器中。
64.在本发明的一个方面,所述处理器还被配置为访问所述存储器并执行所述计算机可执行指令以执行包括以下各项的操作:接收包括所述第一视觉符号的查询;并且响应于所述查询而从存储器中检索所述第一视觉符号。
65.在本发明的一个方面,所述设备还包括显示屏,并且所述处理器还被配置为访问所述存储器并执行所述计算机可执行指令以执行包括以下各项的操作:在所述显示屏上显示包括第一标度和第二标度的模板;接收所述第一用户输入作为从在所述第一标度上显示的数值范围中选择的第一数值;并且接收所述第二用户输入作为从在所述第二标度上显示的数值范围中选择的第二数值。
66.在本发明的一个方面,所述处理器还被配置为访问所述存储器并执行所述计算机可执行指令以执行包括以下各项的操作:通过包括将所述第一数值与所述第二数值连接的第一线段或第一曲线段中的一者来产生所述第一图形表示。
67.在本发明的一个方面,所述数值范围从表示自然声音组分、和谐声音组分或充满热情的声音组分中的一者的第一数字扩展到表示人为声音组分、不协调声音组分或柔和声音组分中的相应一者的第二数字。
技术特征:
1.一种方法,其包括:识别第一声音;将第一量化值分配给所述第一声音中存在的第一心理刺激;将第二量化值分配给所述第一声音中的第二心理刺激;产生包括所述第一量化值和所述第二量化值的第一图形表示;以及将所述第一图形表示指定为所述第一声音的第一视觉符号。2.如权利要求1所述的方法,其中所述第一心理刺激被感知为自然声音组分、人为声音组分、和谐声音组分、不协调声音组分、充满热情的声音组分或柔和声音组分中的至少一者。3.如权利要求1所述的方法,其中所述第一量化值是从所分配的数值范围中选择的第一数值,所述第二量化值是从所述所分配的数值范围中选择的第二数值,并且所述第一图形表示包括将所述第一数值与所述第二数值连接的第一线段或第一曲线段中的一者。4.如权利要求3所述的方法,其还包括:显示包括第一标度和第二标度的数值模板;在所述第一标度上分配所述第一数值;以及在所述第二标度上分配所述第二数值。5.如权利要求3所述的方法,其还包括:识别第二声音;将第三量化值分配给所述第二声音中的所述第一心理刺激;将第四量化值分配给所述第二声音中的所述第二心理刺激;产生包括所述第三量化值和所述第四量化值的第二图形表示;以及将所述第二图形表示指定为所述第二声音的第二视觉符号。6.如权利要求5所述的方法,其中所述第三量化值是所述所分配的数值范围中的第三数值,所述第四量化值是所述所分配的数值范围中的第四数值,并且所述第二图形表示包括将所述第三数值与所述第四数值连接的第二线段或第二曲线段中的一者,并且其中所述方法还包括:将所述第一视觉符号和所述第二视觉符号存储在存储器中;以及基于包括所述第一视觉符号或所述第二视觉符号的查询来检索所述第一图形表示或所述第二图形表示中的一者。7.如权利要求1所述的方法,其中将所述第一量化值分配给所述第一声音中的所述第一心理刺激包括量化所述第一声音的第一感知声音质量,并且将所述第二量化值分配给所述第一声音中的所述第二心理刺激包括量化所述第一声音的第二感知声音质量。8.如权利要求1所述的方法,其中将所述第一量化值分配给所述第一心理刺激是基于确定由听到所述第一声音的一组个体提供的第一组量化值的平均值,并且其中将所述第二量化值分配给所述第二心理刺激是基于确定由听到所述第一声音的所述一组个体提供的第二组量化值的平均值。9.一种方法,其包括:将第一量化值分配给与车辆相关联的第一声音中的第一心理刺激;将第二量化值分配给与所述车辆相关联的所述第一声音中的第二心理刺激;
产生包括所述第一量化值和所述第二量化值的第一图形表示;以及将所述第一图形表示指定为与所述车辆相关联的所述第一声音的第一视觉符号。10.如权利要求9所述的方法,其中所述第一声音由所述车辆的车门、所述车辆的喇叭、所述车辆的声音系统和/或所述车辆的发动机产生。11.如权利要求9所述的方法,其中将所述第一量化值分配给所述第一心理刺激是基于确定由听到所述第一声音的一组个体提供的第一组量化值的平均值,并且其中将所述第二量化值分配给所述第二心理刺激是基于确定由听到所述第一声音的所述一组个体提供的第二组量化值的平均值。12.如权利要求9所述的方法,其中所述第一量化值是从所分配的数值范围中选择的第一数值,所述第二量化值是从所述所分配的数值范围中选择的第二数值,并且所述第一图形表示包括将所述第一数值与所述第二数值连接的第一线段或第一曲线段中的一者。13.如权利要求12所述的方法,其还包括:将第三量化值分配给与所述车辆相关联的第二声音中的所述第一心理刺激;将第四量化值分配给与所述车辆相关联的所述第二声音中的所述第二心理刺激;产生包括所述第三量化值和所述第四量化值的第二图形表示;以及将所述第二图形表示指定为与所述车辆相关联的所述第二声音的第二视觉符号。14.如权利要求13所述的方法,其中所述第三量化值是所述所分配的数值范围中的第三数值,所述第四量化值是所述所分配的数值范围中的第四数值,并且所述第二图形表示包括将所述第三数值与所述第四数值连接的第二线段或第二曲线段中的一者,并且其中所述方法还包括:将所述第一视觉符号和所述第二视觉符号存储在存储器中;以及基于包括所述第一视觉符号或所述第二视觉符号的查询来检索所述第一图形表示或所述第二图形表示中的一者。15.一种设备,其包括:存储器,所述存储器存储计算机可执行指令;和处理器,所述处理器被配置为访问所述存储器并执行所述计算机可执行指令以执行操作,所述操作包括:接收第一用户输入,所述第一用户输入指示将第一量化值分配给第一声音中的第一心理刺激;接收第二用户输入,所述第二用户输入指示将第二量化值分配给所述第一声音中的第二心理刺激;产生包括所述第一量化值和所述第二量化值的第一图形表示;将所述第一图形表示指定为所述第一声音的第一视觉符号;以及将所述第一视觉符号存储在所述存储器中。
技术总结
本公开提供“生成声音剪辑的视觉表示”。本公开总体上涉及用于生成唯一地识别各种声音的视觉符号的系统和方法。用于生成视觉符号的示例性方法可以涉及识别声音并将量化值分配给所述声音的各种属性。在示例性实现方式中,使用数值模板将量化值分配给每个属性。一组此类量化值构成可以被指定为所述声音的视觉符号的图形表示。在示例性应用中,对应于所述视觉符号的所述量化值可以与对应于其他声音的其他视觉符号的量化值一起存储在存储器中。然后,所述存储器可以用于各种目的,诸如例如执行对与期望声音类似的声音的搜索。行对与期望声音类似的声音的搜索。行对与期望声音类似的声音的搜索。
技术研发人员:
J
受保护的技术使用者:
福特全球技术公司
技术研发日:
2022.04.27
技术公布日:
2022/11/15