视频挖掘的语义提取能力挺强,尤其是对想做智能视频的你来说,算是个不错的起点。
从场景识别
、动作检测
到视频摘要
,这篇 PDF 讲得都蛮细,关键是有实际案例支撑,理解起来不费劲。你如果搞过数据挖掘,应该能快上手。
技术上结合了数据挖掘、模式识别和机器学习,有点像把视频拆开来逐帧做内容,比如检测人是不是在打电话、跑步之类的。嗯,这在安防、交通、甚至内容推荐场景都挺常见的。
PDF 里提到不少研究挑战,比如语义层次建模难度大、视频结构化复杂等,但也不是搞不定,像用Matlab
做特征提取、聚类,就是比较常见的套路。
如果你平时也用MATLAB
搞图像识别,推荐你看看这几个相关资料:视频模式识别库学习指南、聚类工具,还有一份不错的源码包
:模式识别源代码,直接上手更省事。
,如果你在做视频或者搞AI 视频应用方向的东西,这资料能让你少走不少弯路。建议配合工具看,边读边实验,效率更高。