摘要:本发明公开了一种基于隐结构学习的图像摘要生成方法。它包括如下步骤:1)对图片提取HSV颜色直方图特征、视觉单词特征以及方向直方图特征;2)对上一步提取的三种特征进行归一化的预处理并在归一化后将三种特征融合为一个特征向量;3)构造一个带有隐变量的结构支持向量机,从数据库中多次选取训练集合,并利用训练集中不同主题相关的图片集合进行权重系数学习;4)利用上一步学习得到的权重系数,从数据库中选取不同主题相关的图片集,预测出它们的隐含的特征选择偏好并生成与之对应的摘要图片集合。本发明具有更高的信息覆盖率和更低的冗余度可以隐式地学习出不同主题相关的图片集合在特征选择上的不同偏好,比传统的方法取得更好效果。
- 专利类型发明专利
- 申请人浙江大学;
- 发明人汤斯亮;邵健;方晗吟;吴飞;庄越挺;
- 地址310027 浙江省杭州市西湖区浙大路38号
- 申请号CN201310410623.1
- 申请时间2013年09月10日
- 申请公布号CN103530656B
- 申请公布时间2017年01月11日
- 分类号G06K9/66(2006.01)I;G06F17/30(2006.01)I;G06T11/60(2006.01)I;