实现视觉知识表达、推理、学习和应用的技术将是人工智能(AI)2.0取得突破的重要方向之一

2019-10-18 10:43:28 来源：《中国科学报》

人类对世界的认知中，80%的信息来自视觉，人们希望人工智能未来也能像人一样敏锐地观测、认知和预测世界。在中国工程院院士潘云鹤看来，实现视觉知识表达、推理、学习和应用的技术将是人工智能(AI)2.0取得突破的重要方向之一。

近日，潘云鹤首次系统地提出“视觉知识”概念，在接受《中国科学报》专访时对其进行了具体阐述和解释。

《中国科学报》：您提出视觉知识这一概念的背景是什么？

潘云鹤：

视觉处理技术对AI发展有重要影响。

首先，近年来，图像识别水平的快速提升推动了AI热潮的形成。图像识别技术的突破不仅提高了计算机对人脸、文字、指纹及生物特征、医学图片等识别的准确率，而且进一步推动了智能制造等领域的发展。中国科学技术发展战略研究院按技术分类对2018年中美AI企业数量进行了统计，可以看出，提供和应用图像识别技术的企业占一半以上。

其次，传统的知识表达方式有显著缺陷。早期图像识别和计算机视觉建立在图像处理技术之上;深度神经网络的使用以数据驱动的方法来学习特征表达，有效提高了图像分类和识别的准确率。

不过，作为AI知识表达的一种方式，深度神经网络难以解释、不可推理，以及因需大量标识的数据训练网络参数而难以避免地会引入数据偏见等不足。因此，我们需要研究一种全新的知识表达——视觉知识。

这启示我们，数字视觉领域是推动AI发展的重要领域;更好的知识表达是推动数字视觉发展的关键技术;克服深度神经网络缺陷是“视觉知识”研究的关键方向。

《中国科学报》：什么是视觉知识？它有哪些特征？

潘云鹤：

视觉知识是知识表达的一种新形式，它能表达世界的时空结构与变化特征。计算机图形学经过长期发展，提供了视觉知识表达与操作的技术基础。但是，对视觉知识进行表达及其推理等操作，还需在此基础上加以改造与重构。

视觉知识与迄今为止人工智能所用知识表达方法不同。视觉概念具有典型与范畴结构、层次结构与动作结构等要素。视觉概念能构成视觉命题，包括场景结构与动态结构。视觉命题能构成视觉叙事。重构计算机图形学成果可实现视觉知识表达及其推理与操作，重构计算机视觉成果可实现视觉知识学习。

实现视觉知识表达、推理、学习、使用的理论和技术将是AI 2.0取得突破的重要方向之一。

视觉知识因为难以用语言符号表达，曾被统归为常识，而以往AI研究的一大弱点便是视觉知识研究不足。因此，视觉知识的研究与运用将会是AI 2.0的一个重要发展方向。

《中国科学报》：如何构建视觉知识体系？

潘云鹤：

视觉知识体系构建与利用需要解决的首要问题是视觉知识学习，这也是一个知识学习的无人区。建立一个系统的知识体系，往往更需要自顶向下的设计，在这个过程中，诸如3D形状重建等计算机视觉研究成果为系统的视觉知识学习提供了发展土壤。

不过，视觉知识学习要将目标从视觉形状重建进一步深入到视觉知识重建，还需要对现有计算机视觉技术作进一步研究，比如，重建3D形状的层次结构，定位其在概念范畴中的位置等。

除了视觉概念，还要研究视觉命题与视觉叙事的表达和学习。

《中国科学报》：视觉知识有哪些应用？

潘云鹤：

从当前AI热潮中视觉识别技术的广泛渗透，可推知视觉知识的应用极广。这里我举例说明视觉知识的各种应用。

基于知识的识别方法，如用于图像识别。例如“猫”，根据“猫”的视觉概念的典型与范畴等，使用综合推理方法自动生成猫的范畴内外各种图像大数据，并根据范畴内外自动标识为正、负范例。然后，用上述范例大数据训练多层神经网络，最后，用训练过的多层神经网络识别图像。

事实上，视觉知识有着独特的优点，能够提供综合生成能力、时空比较能力和形象显示能力，而这些正是字符知识所缺乏的重要能力。它们能在创造、预测和人机融合等方面为AI新发展提供基础动力。

《中国科学报》：关于视觉知识，未来，我们需要关注的重点还有哪些？

潘云鹤：

建设视觉知识词典将是十分重要的，这是一个巨大而实用的知识平台和数据平台，应当联合全球人工智能、计算机图形学和计算机视觉科技工作者共同建设。为了顺利而高效地完成视觉知识词典的建设，群智组织模式不可或缺。

吉安县2019年“三看”财政支出有保有压

2019年，吉安县财政部门认真落实公共财政政策，坚持公共财政就是百姓财政、民生财政，始终把保障民生、改善民生放在首位，财政支出做到主次

科技 (2020-02-16 10:42)

中科院重庆绿色智能技术研究院研发的“泡沫瓷砖”，在1000℃高温下也不变形

建筑外墙保温层保温却不防火，每年都有外墙保温层引起或因保温层迅速蔓延的火灾，那么能否有既保温又隔热防火的材料?1月6日，中科院重庆绿

科技 (2020-01-08 15:17)

产学研合作是创新驱动发展战略的关键环节，正引领创新发展的新潮流

创新成果从实验室到成熟产品的过程常被称为死亡之谷。然而，产学研合作是创新驱动发展战略的关键环节，是催生智慧生产生活的新途径，正引领

科技 (2020-01-08 15:16)

牛津大学科学家完成了世界首例基因治疗手术，为治愈老年性黄斑变性眼疾带来了希望

生物技术和生物医药研究一直是英国的传统强项，2019年仍然是成果纷呈的一年。10月7日，彼得·拉特克里夫爵士获得诺贝尔生理学或医学奖，标

科技 (2020-01-08 15:13)

正常组织随年龄增长发生基因突变和癌变的机理被阐明

正常组织随年龄增长发生基因突变和癌变的机理被阐明。京都大学和东京大学的研究小组详细解析了食道基因突变，发现随着年龄的增长，食道癌中

科技 (2020-01-08 15:08)

法国科研院校的科学家们成功恢复了DFNB9耳聋小鼠的听力

来自巴斯德研究所等法国科研院校的科学家们成功来自巴斯德研究所等法国科研院校的科学家们成功恢复了DFNB9耳聋小鼠的听力。患有DFNB9耳聋的

科技 (2020-01-08 14:48)

江苏决定研究制定相应举措，深度融入长三角创新一体化

2020年，江苏省将启动建设综合类国家技术创新中心，统筹建设领域类国家技术创新中心。7日，在江苏省科技工作会议中，省科技厅厅长王秦介绍

科技 (2020-01-08 14:47)

2020年9月正式出版发行面向高中生的人工智能教材

7日，由图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长姚期智领衔主编的教材《人工智能(高中版)》，在清华大学举办出版签约仪式

科技 (2020-01-08 14:46)

全球首个万种原生生物基因组计划正式发布发布，旨在建立一个大规模的原生生物遗传资源数据库

近日，全球首个万种原生生物基因组计划(Protist 10000 Genomes Project，简称P10K)正式发布，旨在绘制万种代表性原生生物基因组图谱，建

科技 (2020-01-08 14:44)

为破解超级细菌的威胁，我国科学家从抗菌肽找到思路

近年来，由于广谱抗生素、抗菌药物的大量使用或滥用，各种耐药性细菌或真菌随之大量涌现，每年全球有近100万人死于无法用普通抗生素治疗的

科技 (2020-01-08 14:42)

吉安县2019年“三看”财政支出有保有压

2019年，吉安县财政部门认真落实公共财政政策，坚持公共财政就是百姓财政、民生财政，始终把保障民生、改善民生放在首位，财政支出做到主次

科技 (2020-02-16 10:42)

中科院重庆绿色智能技术研究院研发的“泡沫瓷砖”，在1000℃高温下也不变形

建筑外墙保温层保温却不防火，每年都有外墙保温层引起或因保温层迅速蔓延的火灾，那么能否有既保温又隔热防火的材料?1月6日，中科院重庆绿

科技 (2020-01-08 15:17)

产学研合作是创新驱动发展战略的关键环节，正引领创新发展的新潮流

创新成果从实验室到成熟产品的过程常被称为死亡之谷。然而，产学研合作是创新驱动发展战略的关键环节，是催生智慧生产生活的新途径，正引领

科技 (2020-01-08 15:16)

牛津大学科学家完成了世界首例基因治疗手术，为治愈老年性黄斑变性眼疾带来了希望

生物技术和生物医药研究一直是英国的传统强项，2019年仍然是成果纷呈的一年。10月7日，彼得·拉特克里夫爵士获得诺贝尔生理学或医学奖，标

科技 (2020-01-08 15:13)

正常组织随年龄增长发生基因突变和癌变的机理被阐明

正常组织随年龄增长发生基因突变和癌变的机理被阐明。京都大学和东京大学的研究小组详细解析了食道基因突变，发现随着年龄的增长，食道癌中

科技 (2020-01-08 15:08)

法国科研院校的科学家们成功恢复了DFNB9耳聋小鼠的听力

来自巴斯德研究所等法国科研院校的科学家们成功来自巴斯德研究所等法国科研院校的科学家们成功恢复了DFNB9耳聋小鼠的听力。患有DFNB9耳聋的

科技 (2020-01-08 14:48)

江苏决定研究制定相应举措，深度融入长三角创新一体化

2020年，江苏省将启动建设综合类国家技术创新中心，统筹建设领域类国家技术创新中心。7日，在江苏省科技工作会议中，省科技厅厅长王秦介绍

科技 (2020-01-08 14:47)

2020年9月正式出版发行面向高中生的人工智能教材

7日，由图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长姚期智领衔主编的教材《人工智能(高中版)》，在清华大学举办出版签约仪式

科技 (2020-01-08 14:46)

全球首个万种原生生物基因组计划正式发布发布，旨在建立一个大规模的原生生物遗传资源数据库

近日，全球首个万种原生生物基因组计划(Protist 10000 Genomes Project，简称P10K)正式发布，旨在绘制万种代表性原生生物基因组图谱，建

科技 (2020-01-08 14:44)

为破解超级细菌的威胁，我国科学家从抗菌肽找到思路

近年来，由于广谱抗生素、抗菌药物的大量使用或滥用，各种耐药性细菌或真菌随之大量涌现，每年全球有近100万人死于无法用普通抗生素治疗的

科技 (2020-01-08 14:42)

相关文章

精巧的结合，更长时间的发光，一种新型长余辉材料，可以用于肿瘤切除手术导航

新研究表明，残存数十年的人造化学污染物，仍会影响胎儿的生长发育

新年开门红，通信技术试验卫星五号发射成功，顺利进入预定轨道

日本决定建成全球最大规模的肠道细菌数据库

美国天文台宣布第二次探测到来自双中子星合并的引力波

美国太空探索技术公司第三批60颗“星链”卫星送入太空，继续搭建其全球卫星互联网

德国研究人员找到了恶性疟原虫对青蒿素产生耐药性的机理，有助于未来改善针对疟疾的药物

移除与生物钟调控相关的关键基因，能提升小鼠抵抗肺炎的能力

智能头盔SAFE-TEC新品面世，也是业界通过亚马逊Alexa认证的首款运动头盔

我国2019年全年共授权发明专利45.3万件，平均每万人口发明专利拥有量达到13.3件