网站地图 联系我们English电子所务中国科学院
   首页  |  机构概况  |  组织机构  |  新闻中心  |  科研工作  |  研究队伍  |  交流合作  |  研究生教育  |  创新文化  |  科学传播
 
 
研究领域
重点项目
科研成果
成果转化推介项目
  您现在的位置:首页 > 科研工作 > 成果转化推介项目
语音检索系统
2009-09-27| 【 【打印】【关闭】

技术背景及概况

进入二十一世纪,以数字媒体技术、网络技术与文化内容相融合而产生的数字内容产业在世界各地高速成长。随着各级广播电视制作发布单位、广播电视监测部门以及互联网音视频社区中各类音视频形式数字音视频内容的迅速膨胀,目前基于简单元数据标签(tag)以及粗放分级编目的手工信息索引方式,不仅费人费时、容易出错,且日益无法满足使用者精确、负责和个性化检索的需求。 

技术性能

中科院自动化研究所具有20多年语音技术研究的基础,结合实际业务单位的特点和需求,率先开发成功了面向海量内容处理的语音检索系统(Pattek SIR v.1.5)系统。该系统将先进的语音综合处理技术应用于广播电视音视频节目检索与管理,设计目标是让用户可以像使用谷歌、百度检索文本一样方便地对语音内容进行检索。 

Pattek SIR v.1.5产品应用功能框架 

    在全面分析海量视音频库中广播电视节目管理和服务需求基础上,Pattek SIR v.1.5具有以下功能:

   1. 对语音内容自动、快速建立索引,预处理能力强;

   2. 提供文字和语音输入的语音内容检索服务,定位准确度高,检索速度快,并具有模糊检索能力;

   3. 强大的索引和检索数据以及系统管理功能,提供与媒体资产管理和内容服务系统的接口。 

技术特性

   1. 先进的语音处理技术:根植中科院自动化所积累20年研究经验和成果,具备国内领先世界一流的语音语言、音视频处理技术;

   2. 先进的系统架构:采用J2EE技术和多层结构设计支持跨平台应用,全浏览器(B/S)模式,零客户端维护,集成化管理,适合各类企业应用;

   3. 领先的海量音视频数据处理能力:集成稳定、高效、可扩展的集群并行计算基础运行环境,支持万小时量级的媒体索引和快速检索;

   4. 面向行业定制的应用接口:可根据行业媒体资产管理和个性化服务的要求,定制可扩展的输出接口;

   5. 灵活的接口模式:支持各种常见的视音频格式(mp3wmvwmarmavi等)和多种API开发接口,满足多种开发和应用集成环境的要求;

   6. 优异的产品性能:Pattek在广播电视行业海量音视频内容处理、信息发现领域多个成功应用的基础上开发而成。 

应用领域

   1. 各级广播电视内容采集、制作、编目、管理、发布、服务单位;

   2. 各级广播电视内容监测与管理单位;

   3. 互联网音视频社区网站。

 
1996 - 2009 中国科学院 版权所有 备案序号:京ICP备5002853号 备案编号: 京公网安备110108003079号 联系我们
地址:北京市海淀区中关村东路95号 邮编:100190 Email:casia@ia.ac.cn