阿里达摩院2020趋势第一弹：感知智能的“天花板”和认知智能的“野望”

“感知智能与认知智能是相辅相成的关系。认知智能需要感知系统来进行信号处理和概念识别，而感知系统也需要认知系统的反馈来决定如何进行更有效的提取和识别。”

1月2日，阿里巴巴达摩院发布2020十大科技趋势，其中趋势预测的第一弹即为“人工智能从感知智能向认知智能演进”。AI发展为什么会有这种演进？从技术层面，AI科技大本营采访了达摩院资深算法专家杨红霞，就感知智能向认知智能的演进和变革进行更深入解读。

感知智能的“天花板”

如你所知，目前人工智能在图像、音频、文本的识别等感知操作方面取得了巨大成功，太多企业的新闻稿中传递着AI在诸多特定任务上已经达到或超越了人类水准的消息。很大程度上，感知智能技术的诸多成果归因于强大的算力和大量的标注数据。

杨红霞指出，AI目前对于单一任务上取得的成绩，如图像识别、机器翻译等均是通过海量样本的堆砌与合适深度学习模型架构得到，这与人类学习的过程非常不一样：目前感知智能技术的方式是learn from scratch（从无到有），而人类学习是有体系的、多模态、多任务的continuous learning（连续学习）。

她认为，感知智能目前还只是任务驱动，做到从底层信号到最终结果的条件反射，而不是经过显式的、高维的、概念的识别和组合。但这种概念识别和组合的能力才是人类能处理各种不同任务或者新任务的基础。

而单一任务模型的训练消耗已经非常庞大，“BERT模型需要30亿词量的训练数据，训练一次产生相当于1400磅的二氧化碳，这与一个人来回坐飞机穿越美洲的排放量相当。”

这样的技术路线难以为继。她称，想要再通过更大数据量和更大模型来继续这样的模型线路可能已经很难取得真正意义上的突破。

更重要的是，感知智能本身存在的技术问题并没有真正得到解决。“我们可以轻易攻击一个模型从而产生极大的安全隐患，换到另一个没有样本覆盖的场景模型就像傻瓜一样，这都对人工智能模型和机制层面的改进都提出了迫切的要求。”

杨红霞总结了三点感知智能技术存在的缺陷，包括但不限于：

模型鲁棒性差。对于样本分布敏感，迁移到少样本新任务上的能力差，模型极易受到攻击；
模型可解释性差，对于可靠性要求高的任务很难胜任；
缺乏积累知识的能力，也没能和人类已有的知识体系进行很好的关联，缺乏可靠的推理方法。

总之，无论是在具备智能理解能力还是安全性方面，以感知智能技术为主的AI与人类智能相去甚远。

为了突破这些感知智能局限性，AI需要向认知智能演进。她给出了研究方向，“更多的去研究如何绑定、发现、积累可理解的可分解性的概念以及概念间的关系，融合基于高纬度概念的可靠的推理方法，从而提高模型的稳定性与可靠性，完成可靠的逻辑推理。”

达摩院指出，相较于感知智能这一人工智能1.0，人工智能2.0将更多基于数据，能够自动将数据变成知识，从非结构化的数据直接变成有结构化的知识，做到真正意义上的认知智能。在探索如何在保持大数据智能优势的同时下，赋予机器常识和因果逻辑推理能力，实现认知智能成为了当下人工智能研究的核心。

认知智能的“野望”

去年开始，认知智能开始被AI界摆在下一步AI技术变革的台面上进行广泛讨论。

认知智能可以帮助机器跨越模态理解数据，学习到最接近人脑认知的“一般表达”，获得类似于人脑的多模感知能力，有望带来颠覆性创新的产业价值。达摩院称，认知智能的出现使得AI系统主动了解事物发展的背后规律和因果关系、而不再只是简单的统计拟合，进一步推动下一代具有自主意识的AI系统。

一些学界的研究者已经率先出发，图灵奖得主Yoshua Bengio频繁强调可解释因果关系对深度学习的重要性。杨红霞也特意提及Bengio在近期的 NeurIPS 2019 上题为《From System 1 Deep Learning To System 2 Deep Learning》的报告，后者也指出认知智能是接下来人工智能的重点突破方向。

Bengio报告的核心内容提到，人的认知系统包含两个子系统（这是认知理论中的共识观点）：System1直觉系统，主要负责快速、无意识、非语言的认知，这是目前深度学习主要做的事情；System2是逻辑分析系统，是有意识的、带逻辑、规划、推理以及可以语言表达的系统，这是未来深度学习需要着重考虑的。当然Bengio也提到计算机作为Agent实现AI，需要从计算机角度考虑，比如更好的模型和知识搜索等。

Bengio认为，对于计算机来说，最关键的是处理数据分布中的变化。对于System 2来说，基本的要素包括：注意力和意识。注意力（attention）实际在目前的深度学习模型中已经有大量的实现和探讨，比如GAT（图注意力机制）等；意识这部分则比较难，其实意识最关键的是定义到怎样的边界。在他看来，意识先验可以使用稀疏因子图模型来实现，这是一个思路，实现了因果关系。从整体的理论框架方面可以考虑元学习（Meta-learning）、局部修正假设（localized change hypothesis）、因果发现（causal discovery），最后架构方面可以考虑如何学习不同对象的操作。

这是认知智能技术的其中一条技术研究路径，杨红霞则概括了四大类将有所突破的关键方向。

a. 推理系统的建设

基于（神经）符号系统的关系推理
感知系统和认知系统协同推理 System 1&2

b. 与人类知识融合

融合结构化知识图谱的推理模型

c. 从人类学习方式入手

Continuous Learning（连续学习）

d. 从认知发展的根源入手

Emergent language/communication/tool use

她称，目前比较亲民的应用主要来自于b（与人类知识融合），在各类问答系统中，都会融合外部知识图谱来完善。

当然，既然阿里将认知智能放在第一大趋势预测的位置，那么他们在其研究和应用上有何探索或进展？杨红霞提到，基于认知学Dual Process Theory（双重加工理论）将认知推理任务转化为System 1&2之间的迭代式交互，System 1利用感知系统进行语义解析形成一张概念图并作为类似人脑中的Working Memory，而System 2可以充分考虑Working Memory中的关系网络从而进行精细推理。多跳阅读理解任务中，他们利用这个系统取得了世界第一的成绩。

他们也在考虑如何发现Compositional的高级概念，这与人类的binding problem（捆绑问题）息息相关。他们首次在电商场景下研究怎样对用户和商品进行解离化表征，从而能够显式化的表示宏观的兴趣意图和微观的电商认知概念，从而利用这些显式的概念进行可控的搜索和推荐。

另外，阿里研究人员也结合电商知识图谱做了大量的工作，如结合图谱进行更好的主题标题、推荐理由生成，提升了用户的购物体验。

达摩院在趋势预测中还指出，认知智能将结合人脑的推理过程，进一步解决复杂的阅读理解问题和少样本的知识图谱推理问题，协同结构化的推理过程和非结构化的语义理解。认知智能也需要解决多模态预训练问题，帮助机器获得多模感知能力，赋能海量任务。其中，大规模图神经网络也被认为是认知智能计算的强有力的推理方法。

尽管未来人工智能热潮能否进一步打开天花板，形成更大的产业规模，认知智能被寄予厚望，不过在需要外部知识、逻辑推理或者领域迁移的认知智能领域，显然还处于初级探索阶段。

达摩院预计，认知智能将从认知心理学、脑科学及人类社会历史中汲取灵感，并结合扩领域知识图谱、因果推理、持续学习等技术，建立稳定获取和表达知识的有效机制，让知识能够被机器理解和运用，实现从感知智能到认知智能的关键突破。

文章来源：AI科技大本营编辑：司马行空