973计划项目数字内容理解的理论与方法

阅读: 评论:0

973计划项目“数字内容理解的理论与方法
年度总结报告
(2007年度)
一、年度计划执行情况
(一)年度计划完成情况
2007年度是本项目承前启后的一年。本项目在认真总结过去两年工作的基础上,对后三年的工作进行了认真的谋划。在这一年,通过项目全体成员的精诚合作,共同努力,项目顺利进入了一个新的时期。现将一年来本项目的年度计划完成情况概述如下:
1.视觉注意基本表达及脑功能成像研究
本年度,在视觉注意基本表达及脑功能成像方面的研究围绕“知觉物体”这个核心概念开展实验研究,特别是脑成像实验研究,同时进一步抓紧对前期实验结果的整理成文:已有一篇论文被PNAS杂志接受,另有一项工作发表在Nature Neuroscience上。总体上,各项年度计划已基本完成,达到或超过预期目标。
2.文本内容理解的数据基础
箔绕机本年度是执行三年调整计划的第一年。课题组充分理解古训“一年之计在于春,一日之计在于晨”的启迪意义,努力完成了本年度的任务,为三年调整方案的按期完成奠定了坚实的基础。
按照调整方案,本年度该方向的研究把建设综合型语言知识库臵于工作的重心,带动各子任务都有可喜的进展,同时努力探索文本内容理解的理论和新思路。相关成果占主体的综合型语言知识库已取得重要进展,于2月份通过教育部组织的技术鉴定,并向教育部申报科技进步一等奖。在此基础上,又提出了“面向文本内容理解的语言与知识基础平台”的规划,并取得阶段性成果。应用研究探索也取得进展,4个实用系统向实用化方向前进,特别是人机互动的百科知识工程,提出了基于知识元的知识描述体系、文本知识自动分析和重构方案,实现了一个知识服务应用示范系统——心血管疾病知识咨询系
氟苯尼考琥珀酸钠统。配合“国家知识资源数据库”大型工程的立项,作了有益的探索。
3.机器学习与数据描述
在应用需求的推动下,机器学习正在面临新一轮的研究,因此,本年度该方向的部分研究是为以后两年的研究做准备,包括,对基于凸上界损失函数的学习理论与算法的研究和结构化数据的结构学习理
论和算法的研究。另外,部分研究是以本课题前两年的研究为基础,包括,基于reduct理论特征选择方法与Rashomon特征选择理论框架和规则+例外学习的研究。在上述理论研究的基础上,开始情报分析的研究。
4.自然语言理解的交互引擎研究
双面发光字
该方向后三年的研究工作重点集中在突破句处理上,以语境单元萃取为基础使计算机具有篇章处理能力。同时,首先选择在一个局部形成比较完善的处理模式,以展示本研究的理解特征。研究重点凝聚在对“体育比赛”这一专业领域的句处理研究方面。根据这一目标,2007年度课题计划任务书预计完成的研究工作包括:体育比赛领域内所涉及的子领域的范畴及其概念延伸结构;探索体育比赛领域内各个子领域之间的概念联想关系,以及这些子领域与其他概念树和延伸概念的关系;进行领域句类知识的表述研究;探索语境单元萃取方法;探索HNC理解度方面在语层面的理解度量化方法。
5.音频场景分析连供系统
本年度的研究工作主要集中在单麦克风条件下底层信号处理与高层知识的结合研究、音频场景分析在语音识别中的应用以及麦克风阵列的设计和研究三个方面。
首先,在单麦克风条件下底层信号处理与高层知识的结合研究方面,课题组在第一阶段研究工作的基
础上,加强了与相关课题之间的联系和沟通,重点从基音线索的提取和利用、多基音跟踪与听觉场景分析的结合、基于时域包络的语音客观感知质量评估与听觉场景分析的结合以及借助机器学习获取特定说话人语音分布规律的高层知识以指导混合语音清、浊音的分离等方面,进行了系统而深入的研究和探索。这些新的研究和探索不仅是对课题前一阶段研究成果的有益补
充和整合,还与之前的研究成果一起,共同构建了一整套既涵盖了底层分离线索(基音/多基音、共同的开始和结束等)的提取和使用,又涵盖了高层语音语言知识(语音分布规律性和感知质量等)的学习和引入;既包括了自下而上的数据驱动模式,又包括了自上而下的图式驱动模式;既采用了同步组织的方式,又采用了序贯组织方式;既能够实现语音与噪声混合信号的分离,又能够实现多说话人混合语音分离;既可以分离混合语音中的浊音信号,又可以同时分离语音中的清音信号的相对比较系统和完整的单麦克风音频场景分析理论。
其次,在音频场景分析在语音识别中的应用方面,课题组在前两年工作的基础上,围绕音频场景分析中单声道混合语音分离这一关键问题,选择了实际应用中经常遇到的两说话人混合语音分离作为切入点,重点研究和探索了这种情况下音频场景分析预处理与语音识别的结合问题。通过在计算听觉场景分析框架下采用实值掩蔽替代二值掩蔽对混合语音进行分离,并将分离语音作为输入直接应用于后端的语音识别系统,显著地改善了语音识别系统的性能,提高了语音识别系统的鲁棒性。
再次,在麦克风阵列设计、研究方面,课题组研究设计了具有同步实时采集、信噪比高、扩展性好等特点的麦克风阵列原型系统。在此基础上,从麦克风阵列信号处理的机理出发,重点研究了麦克风阵列语音增强问题,并提出了相应的语音增强处理算法,获得了较好的效果。
拉画笔
6.口语化语音信息的分析与识别
在口语语音的特征和韵律方面,研究了信号精细结构对汉语语音的元音、辅音、声调以及句子识别率的影响,研究了鉴别性更强的高斯化特征参数提取方法;初步建立了韵律树,用最大熵方法对韵律进行预测。
在声学模型建模技术方面,研究了基于最小音素错误准则的声学模型训练算法;在语言模型建模技术方面,研究了语言模型自适应技术;根据实际环境需要,对特征和模型进行了优化,取得很好效果。
研究了基于内容的音频信息检索算法。研究了基于小波变换的音频特征提取方法,提出了基于全局优化参数的MCE方法计算候选关键词的臵信度,并将网格臵信度和声学臵信度相融合。在解码算法方面,提出了基于状态网络的Cross-word静态搜索空间构建方法,有
效地集成语言模型之外的所有知识源。
7.图像序列内容理解
采用机器学习等方法深入分析阿尔兹海默病(AD)患者海马形状;进一步对脑自发活动进行检测;从而探索脑功能连接和复杂脑网络的计算理论和方法;开展基于弥散张量成像的脑疾病研究;并建设了功能近红外脑成像数据处理平台。在以上研究的基础上发展了计算机视觉的计算理论与方法。以上研究获得了较丰富的成果,相关文章发表在一批国际顶尖的期刊和会议上。
8.基于内容的多媒体信息检索
本年度该方向的研究基本按照年度计划顺利进行,进一步发展了商空间的理论和方法;对基于多粒度和多模态的视频概念检索方法开展了深入研究;对基于用户行为的语义挖掘问题开展了研究,给出了一种通过用户行为挖掘对相关网页实现自动标注的方法;利用自动标注结果,初步的实现了搜索引擎性能的自动评价;利用标注结果实现对搜索引擎结果的重排序,提高其检索性能;进一步完善了基于描述文档的专家检索的研究工作;开展了Web事件检测和聚合的研究,实现了对新闻事件的自动检测和聚合。
9.大规模文本内容计算
smdao本年度该方向的研究,根据中期调整方案的要求重点开展了面向web2.0网络信息的理论研究和算法研制,圆满完成了2007年度的预定研究内容。取得的具体进展如下:
1)在理论和算法研究方面,我们针对web2.0网络信息的特点,提
出了有效的网页信息采集和提取方法、网络社区发现算法、面向结构的文本挖掘、高性能的信息检索算法、高性能多文档文摘算法等,部分算法在应用系统中发挥了重要作用,有效性得到了较好的验证。
2)在应用系统研制方面,我们继续互联网信息管理分析系统、大规
模情报分析等系统的升级完善,成功推出了网络舆情分析系统的一期版本,并在一些国家部门试用得到了好评。
3)开源软件方面:中文检索平台FirteX继续升级到
firtex-1.0.3_RC版,先后获得中国开源软件大赛银奖第一名,第二届东北亚OSS竞赛大奖,中科院开源软件竞赛金奖第一名等荣誉;火速桌面搜索FIRE发布了升级版本-快乐超级搜索,影响持续扩大。
10.数字内容理解的战略与集成研究
1)面向安全的视频分析:在阴影去除、运动目标的大范围跟踪、基
于在线学习的运动目标分类方面取得了明显进展。
2)生物特征识别:进一步扩充数据库;提出了便捷、智能的中远距
离虹膜图像获取方法;在掌纹和虹膜识别算法方面均有突破。3)多源数字内容的感知,集成与理解研究:继续构建完善“智能实
验室SmartLab系统”,对多模感知子系统中的身份识别进行了研究实现,对行为监控子系统的行为分析进行了研究实现。并从理论上取得一系列进展。
11. 项目的协调管理与学术交流
本年度,整个项目是一个总结过去,规划未来的重要一年,本课题作为项目的总体组,组织整个项目严格按照科技部的要求顺利完成了评估、审计和预算编报工作,并为此做了大量组织协调的工作,具体如下:
1)组织进行中期总结与评估工作
按照科技部的统一部署,本年度本项目进行了中期总结与评估工作。在课题总结的基础上,组织召开了中期总结会议,之后认真总结和讨论了会上多位专家提出的意见,形成了我们后三年的调整方案,精心准备科技部的评估答辩,最后顺利通过了科技部中期评估。
2)组织做好审计准备工作
3月份,本项目接受了科技部组织的关于经费使用情况的审计:为了迎接这次审计,项目组织召开了由课题负责人和相关财务人员的会议,传达相关精神,安排各项工作。经过大约1个月的时间,本项目各个课题都顺利通过了科技部的审计。
3)组织编报后三年的预算
7月份,在派员参加了科技部组织的预算编报部署工作会议后,我们进行了如下工作:(1)仔细研究了预算编报指南,并将材料编印

本文发布于:2023-06-27 05:33:45,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/2/154031.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:研究   语音   方法   方面   分析
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图