关注微信
扫一扫
关注微信
扫一扫
IBM 公司的研究人员正在开发一种名为Marvel的搜索引擎 ,它能够获取目前在互联网上很难获取的音像资料 。ballbet的后代将能够点斜热缢凳且淮巫芡潮缏鄣难??掌?蛎枋鲆桓龀【埃?佑?SCRIPT language=javascript>document.write("");ad_dst = ad_dst+1; 电视公司 、电影厂商 、个人艺术家创造的数以千计小时的音像资料中获得相关的内容 。
尽管象雅虎 、Google等搜索引擎也能够用来查找视频和图片资料 ,但它们并非真正地对文件中的图像进行搜索 ,而是对附加在图片询问的文字进行搜索 ,因此也只能搜索数量较少的文件 。
IBM 研究院负责智能信息管理的高级经理史密斯说 ,为了能卸韵衷谝?笕斯し掷嗟哪谌萁?兴饕??颐钦?谂?υ诓皇褂梦淖只蛉斯さ那榭鱿露阅谌萁?兴饕??/P>
人工索引需要大量的时间 。对30分钟的视频资料进行解析和分类需要约5 个小时 。更为糟糕的是 ,需要分类的信息在呈爆炸性增长 。加州大学伯克利分校进行的调查显示,2002年全球电视台共生产了1.23亿小时的节目 ,其中包括3100万小时的原创节目 ,相当于70000TB 数据 。这还不包括来自安全监视摄像机和家庭用摄像机的内容 。
Marvel能够使用“户外” 、“室内” 、“城市风景” 、“发动机噪音”等描述音像片断中内容的修饰语自动地对内容进行分类 。
Marvel研究小组于8 月末在剑桥大学的一次会议上展示了第一款Marvel原型产品 ,它能够对包含超过200 小时视频内容的数据库进行扫描 ,并使用100 种不同的修饰语对内容进行分类 。IBM 公司希望在明年4 月份将使用的修饰语数量提高到1000个 。
进行一次查值氖奔湫枰? 、3 秒钟 。尽管是基于MPEG-7数据格式的 ,但Marvel能够对任何标准的视频格式进行扫描 。IBM 公司没有公布如何使Marvel成为一种实用的产品 ,它很可能首先被应用在电视产业内 ,而不是向消费者推广 。
尽管Marvel从理论上能够自动地对视频和音频文件进行分类 ,但目前该项目还在人工操作阶段 。到明年4 月份 ,IBM 公司希望能够有一个包含1000个用于对内容进行分类的修饰语清单 ,其中一部分是通用型的━━例如风景 ,另一部分则是特指型的━━例如网球 、篮球 。史密斯表示 ,1000个修饰语不能包含整个语义空间 。
IBM 公司称 ,至少还需要3-5 年的时间 ,它才能够推出成熟的 、基于搜索引擎的Marvel产品 。