规范图像采集与AI有关系吗

360影视 动漫周边 2025-04-09 08:00 1

摘要:《公共安全视频图像信息系统管理条例》(以下简称《条例》)日前施行,对公共场所安装视频图像采集设备做出规范,引发公众关注。那么,图像采集究竟是一种什么样的科学技术?随着AI运用越来越广泛,未来我们又将如何平衡技术安全与创新发展之间的关系?

张田勘

《公共安全视频图像信息系统管理条例》(以下简称《条例》)日前施行,对公共场所安装视频图像采集设备做出规范,引发公众关注。那么,图像采集究竟是一种什么样的科学技术?随着AI运用越来越广泛,未来我们又将如何平衡技术安全与创新发展之间的关系?

图像信息包括摄影和摄像两大类

人类历史得以延续,文明得以发展,是因为人能用文字和图像信息来记录知识、创造和发明,并在此基础上不断创新。也就是说,文字语言和图像是两大信息源。

说到图像信息,它的范围其实很广,包括摄影和摄像(视频和电影、电视画面)两大类别。而视频,可以说是脱胎于摄影。

摄影即通常所说的照相,是通过物体所反射的光线使感光介质曝光的过程,由此留下人或物的静态图像。1826年,法国人尼埃普斯把涂有沥青的金属板置于暗箱中对着窗外的风景,经过长达8个小时的曝光,成功拍摄了摄影史上第一张照片。尼埃普斯称这种技术为日光蚀刻法。之后他的合伙人、法国画家达盖尔发明了银版摄影法(又称达盖尔摄影法),1839年被法国政府买下专利权,并宣告摄影术诞生。

到了1878年,英国摄影师埃德沃德·迈布里奇借助24台相机,连续拍摄了24张马飞奔的照片,再把这些照片放到一个在光源前旋转的玻璃盘上,制作了人类历史上第一部电影《骑手和奔马》。同一时期,发明家爱迪生在留声机上,录下了自己朗读的《玛丽有只小羊羔》歌词,短短数秒的声音,成就了人类历史上第一条音频。自此,人类社会进入音视频时代。

现代意义上的视频,确切地说是在电视的基础上,经过数字技术和AI的改善和革新所形成的。视频技术最早是从阴极射线管的电视系统建立起来的,之后新显示技术的发明,使视频技术范畴扩大,并且过渡到数字图像格式,包括超高清电视(UHD)、数 字 多 功 能 光 盘(DVD)、蓝 光 光 碟(Blu-ray)、MP4和模拟信号磁带等,因此,视频可以通过不同的介质来记录和传播。

今天的数字摄像机除了使用磁带,也使用硬盘和闪存卡等其他载体,同时可以通过网络进入云数据进行储存、保管、提取和回放。比如,现在广泛安装的视频图像采集设备,就是使用视频拍摄设备(如摄像头)把光学图像信号转变为电信号和数字信号,再进行存储、传输、发送和回放。

图像采集历经4次技术迭代

在本质上,图像信息采集是将真实世界的图像转化为计算机可以理解和处理的数字格式的过程。现在常用的图像采集设备包括摄像头、数码相机、扫描仪和医学成像设备等。

针对公共安全领域的图像信息采集设备,大量应用的是摄像头,它虽然属于相机的一种,但是具有视频摄影/传播和静态图像捕捉等基本功能。摄像头借由镜头采集人或物的动态图像后,由其内部的感光组件电路及控制组件对图像进行处理,并转换成电脑能识别的数字信号,再输入电脑由软件进行图像还原。由摄像头获取的视频图像也可以传输到数据库或云端保存,以供后续查看。

可以获得人、物的动态画面的摄像头和视频图像信息采集技术,是在20世纪70年代初进入中国的,最初用作取证、保障城市和家中安全。其中,负责维护公共安全的视频图像信息系统在国内主要经历了4个发展时期。

第一个时期是模拟监控。这种技术源于模拟闭路电视,由摄像机通过视频线点对点连接到监视器进行视频监控,主要靠眼和手控制,没有视频存储。之后,发展为视频源-传输-控制切换-存储-显示的完整系统,称为模拟闭路电视(CCTV)监控系统。该系统由前端设备和监控中心组成,前端设备包括摄像机、云台、解码器等,监控中心设备有监视器(电视墙)、视频分割器、切换矩阵、控制键盘、盒式录像(VCR)等。这两部分的设备由视频线、控制线缆等连接。

第二个时期是模数结合监控。从20世纪90年代起,计算机视频编解码技术快速发展,出现了DVR(数字硬盘录像机),实现了图像编解码、存储、网络访问等多种功能。通过DVR,可将模拟视频转换为数字信号并进行压缩编码,实现了视频的数字化存储。DVR很快取代VCR成为监控系统的存储部分,促成了“模数结合”。

第三个时期是网络监控。进入新世纪,随着全国“平安城市”和“科技强警示范城市”建设的启动,需要新的安防系统以实现“统一指挥、多级联网、分布式管理、多点监控”,网络监控开始发挥作用。IT(信息技术)的迅速发展形成了成熟的联网、数据集中,改善了以IT建构的视频监控系统。其中最关键的是,这种技术将IP网络交换技术引入安防视频监控,替换了原先的模拟交换,具备了大规模视频监控的联网能力。

当前,我国公共安全视频图像信息系统已经发展到智能监控的阶段。在图形处理器(GPU)、物联网、大数据、云计算、AI识别和追踪等技术的支持下,安防视频监控由联网、高清化向智能分析转变。通过AI和大数据等,可以对大量人、车、物的行为关系进行数据挖掘,并且分析时空关系(时间和位置),有助于刑侦线索分析、案件规律分析、社会舆情分析、金融诈骗分析、公共交通优化等。未来,公共安全视频图像信息系统还会利用AI进行深层次的逻辑分析,如人员可疑行为分析。

保护与反噬是新技术的一体两面

尽管公共安全视频图像信息系统有利于保护公众安全和维护社会秩序,但是使用不当会有反噬作用。意识到这一点,《条例》规定了私密场所不得安装视频图像采集设备及相关设施,以更好地保护公民个人隐私。除了暴露隐私之外,视频图像信息采集的反噬还可能引发社会混乱、伦理问题和违法犯罪。

首先,视频图像信息系统可能会出错。

一方面,摄像头的摄像有交错(隔行)扫描与循序(逐行)扫描两种方式来发送图像。交错扫描是以前技术不发达,网络带宽较低时用来改善画质的方法;循序扫描是指每次画面更新时都会刷新所有的扫描线,虽占据更多带宽,但可减少画面的闪烁与扭曲。这两种方式都可以通过无线网络传输,却不能保证画面的完全清晰和对个体的准确识别。此外,摄像的长宽比例、色彩、像素、画面质量等也会影响视频图像质量,导致错误辨识。

另一方面,视频图像信息系统获取人像后进行的识别技术存在缺陷。目前,人脸识别是基于数学计算和模型以及机器学习进行识别,可根据人脸五官轮廓位置的关键点坐标,如眼虹膜、鼻翼、嘴角等的大小、位置、距离等属性,计算出它们的几何特征量,然后由这些特征量形成某一面像的描述特征,再将已检测到的待识别人脸与数据库中已知人脸进行比较匹配,从而得出结果。常用的人脸识别算法有3种:基于几何特征的识别算法、基于特征子空间(特征脸)的识别算法、基于模板匹配的人脸识别算法。只是这些识别算法各有缺陷,因此可能出现或大或小的错误。依靠数学模型和机器学习进行个体识别,与人脑识别个体有很大差异,需要结合起来使用。当然,最准确的个体识别应当是采用多种身份识别办法,除了人脸识别,还需进行DNA检测等。

还有一个问题是,如今基于视频图像信息系统而进行的人脸识别会因为面部改变和人们采用的种种物理手段而导致识别错误,如脸部毛发多少或长短变化、使用化妆品、光照条件影响、噪声(在视频压缩过程中,噪声会导致压缩算法产生较大失真,还会混淆图像中的细节和边缘,造成图像不太清晰)干扰、人脸角度倾斜、遮挡面部特征(戴帽子、围巾或面罩)等。关于这一点,有事实证明。2018年7月,美国一个机构测试了亚马逊的人脸识别系统Rekognition API(一种视频图像信息系统),扫描了535位国会议员的面部照片,然后用来对照25000张公开的罪犯面部照片,结果有28位议员被识别为“罪犯”。尽管亚马逊方面将此次失误归因于校准不良,但这种大比例的错误率(5.2%)仍招来广泛关注和质疑。该机构指出,鉴于一个识别系统无论准确与否,都有可能剥夺人的自由乃至生命,呼吁国会认真对待这种威胁,并颁布暂停执法人员使用人脸识别的法令。

其次,视频图像信息系统采集的图像可能会被犯罪活动利用,尤其是深度伪造软件Deep Fake的出现,导致了大量骗局。基于这一点,国外有的城市已经开始禁用人脸识别系统,初衷是为了防止视频图像信息系统滥用人脸信息采集功能。社交网络公司Meta在2021年关闭了人脸识别系统,并删除了超过10亿用户的面部扫描数据。国际商业机器公司(IBM)也因类似的担忧,停止提供人脸识别技术。

人工智能该不该用于大规模监控

视频图像信息系统如同很多探索中的科学技术一样,是把双刃剑。因此,它需要在科学管理下,避免技术的无序“放飞”,尤其是在人工智能快速发展的当下,公共安全领域更需对之持谨慎态度。

2021年11月,193个联合国成员国通过了教科文组织制定的有史以来第一份全球人工智能伦理标准《人工智能伦理问题建议书》,要点主要有两个:1.在国家或国际层面建立适当的数据保护框架和治理机制,将其置于司法系统保护之下,并在人工智能系统的整个生命周期内予以保障;2.禁止人工智能进行社会评分和大规模监控。而视频图像信息系统正好就属于这类监控技术,若人工智能失控,对于人权侵犯的后果将难以想象。基于这份建议书的内容,现在无论是国内还是国外,人工智能运用的一个基本原则是,能不使用人脸识别的就不使用,一是人脸识别不一定准确,二是人脸信息可能通过各种方式流失于网络,造成隐私泄露和欺诈。

近几年,人工智能技术获得突破性进展,人们对于它在科学领域的应用也更加慎重。2024年2月5日,全球移动通信系统协会(GSMA)、联想、LG AI研发、微软、摩托罗拉等全球8大科技公司与联合国签署了一项具有开创性的协议,即在设计和使用人工智能系统时,将结合《人工智能伦理问题建议书》中有关AI伦理的价值观和原则。

此次我国颁布的《条例》明确了隐私保护的规定,在图像信息采集维护公共安全与保护个人隐私之间划了一条红线,限定了一些不可安装图像采集设备的场所,如旅馆、饭店、宾馆、招待所、民宿等经营接待食宿场所的客房或者包间内部;学生宿舍的房间内部;公共的浴室、卫生间、更衣室、哺乳室、试衣间的内部等。这与《人工智能伦理问题建议书》中的伦理原则相吻合。

客观地看,人工智能和图像信息采集技术“搭档”的应用场景其实很广阔。若二者能良好配合,将有利于推动公共安全事后治理模式向事前预防模式转变。比如,人工智能对从危险突发事件中获取的数据进行实时智能对比分析,获得“经验”,此后便可提前有效预测危险事件的发生,为人们应对突发事件争取更多时间。另外,交通运输也是一个极具发展前景的应用领域。比如,在基于历史车祸数据、道路地图、图像信息采集甚至卫星图像的基础上,利用深度学习技术建立模型,可以预测高分辨率的车祸风险地图,以确定高风险区域。

归根结底,这些都是科学技术发展如何与社会伦理和法律兼容的极为重要的本质问题。在信息和AI时代,更需要促进科学技术与社会兼容,来实现既保护人,又不伤害人的愿景。

来源:北京日报客户端

相关推荐