GB/T 41864-2022 信息技术 计算机视觉 术语.pdf

GB/T 41864-2022 信息技术 计算机视觉 术语.pdf
仅供个人学习
反馈
标准编号:
文件类型:.pdf
资源大小:14.4 M
标准类别:国家标准
资源ID:136216
免费资源

标准规范下载简介

GB/T 41864-2022 信息技术 计算机视觉 术语.pdf简介:

GB/T 41864-2022 信息技术 计算机视觉 术语.pdf部分内容预览:

3.5.3图像分类与识别

GB/T 418642022

3.5.4图像语义理解子类

.6.1视频表示与处理子

背景background 图像中远离摄像机或不感兴趣的区域。 3.6.1.2 光流场opticalflowfield 图像中所有像素点构成的一种二维(2D)瞬时速度场CECS 1031-2022-T_建筑机电抗震工程技术规程 (1).pdf,其中某一点的二维速度矢量是1 前帧到下一帧的位移矢量。 3.6.1.3 镜头边界检测shotboundarydetection 检测一段视频中发生镜头切换的图像帧位置。 注:镜头切换主要包括突变和渐变两种类型。 3.6.1.4 前景检测foregrounddetection 定位视频中感兴趣目标区域。 3.6.1.5 时空表达 spatialtemporalrepresentation 视频序列中时间和空间信息的联合表示。 3.6.1.6 视频video 一系列图像序列。 3.6.1.7 视觉预测visualprediction 根据当前帧图像信息(或目标状态)预测后续帧图像内容或目标状态的未来变化。 3.6.1.8 视频剪辑videoclipping 将视频序列剪切为若干小段视频序列。 3.6.1.9 视频语义分割videosemanticsegmentation 对视频序列中每帧图像的每个像素进行语义属性的分类。 3.6.1.10 视频上下文videocontext 视频中不同对象之间或对象与场景之间相互作用的环境信息。

背景background 图像中远离摄像机或不感兴趣的区域。 3.6.1.2 光流场opticalflowfield 图像中所有像素点构成的一种二维(2D)瞬时速度场,其中某一点的二维速度矢量 前帧到下一顿的位移矢量。 3.6.1.3 镜头边界检测shotboundarydetection 检测一段视频中发生镜头切换的图像帧位置。 注:镜头切换主要包括突变和渐变两种类型。 3.6.1.4 前景检测foregrounddetection 定位视频中感兴趣目标区域。 3.6.1.5 时空表达 spatialtemporalrepresentation 视频序列中时间和空间信息的联合表示。 3.6.1.6 视频video 一系列图像序列。 3.6.1.7 视觉预测visualprediction 根据当前帧图像信息(或目标状态)预测后续帧图像内容或目标状态的未来变化。 3.6.1.8 视频剪辑videoclipping 将视频序列剪切为若干小段视频序列。 3.6.1.9 视频语义分割videosemanticsegmentation 对视频序列中每帧图像的每个像素进行语义属性的分类。 3.6.1.10 视频上下文videocontext 视频中不同对象之间或对象与场景之间相互作用的环境信息。

视觉问答visualquestion answering

将一幅图像(或一段视频)和关于这幅图像(这段视频)的自然语言问题作为输人,结合这两部分 成 一条自然语言答案为输出。

将一幅图像(或一段视频)和关于这幅图像(这段视频)的自然语言问题作为输人,纟 息生成一条自然语言答案为输出。

©版权声明
相关文章