摘要
本文通过追溯人工智能从萌芽、发展到实现产业化应用的历史,揭示了技术创新与新兴产业演进的一般性规律。前沿技术的创新路径存在高度的不确定性,在技术发展初期出现潮涌现象并呈现多条技术路线竞争的格局,其发展需要多学科技术的支持,受到多领域科技发展的启发。新技术的产业化往往要经历曲折、漫长的过程,需要来自互补产品与互补技术协同演进的支撑,其在国民经济中发挥作用也需要互补技术的进步与互补产品的发展。笔者通过分析提出,政府可以在技术推动和需求拉动两方面对新技术的产业化及其广泛应用发挥重要作用;人工智能技术既有其优势,也存在其不足和滥用风险;未来的创新与生产更可能是人工智能与人类的高度协作。本文从研发支持、发展环境建设、传统产业数字化改造、市场支持、创新创业、科技伦理治理等方面提出加快人工智能产业化的对策建议。
关键词
前沿技术;新兴产业;人工智能;产业化;通用目的技术
基金项目
研究阐释党的十九大精神国家社会科学基金专项立项课题“推动新一代信息技术与制造业深度融合研究——基于新时代和新工业革命的视角”(18VSJ054);国家社会科学基金重点项目“‘互联网+’背景下的中国制造业转型升级研究”(16AJY011);中国社会科学院登峰战略优势学科(产业经济学)成果。
科学技术是第一生产力,但是只有当人类从自发到自觉地发现和运用自然规律,科学技术才真正爆发出它的洪荒之力。针对英国工业革命之后人类取得的巨大经济成就,经济史统计学家麦迪森[1]指出,19世纪之前的世界人均GDP增长缓慢,直到19世纪20年代世界经济发展才呈现更强劲的势头。马克思和恩格斯曾这样形容工业革命之后的技术发展:“资产阶级在它的不到一百年的阶级统治中所创造的生产力,比过去一切世代创造的全部生产力还要多,还要大”[2]。然而,科技的发展从来不是一帆风顺的,从最初技术的萌芽到产业化创造出巨大的经济价值往往需要经过曲折漫长的历程。2016年谷歌旗下DeepMind公司的AlphaGo人工智能系统战胜人类世界围棋冠军李世石,人工智能真正从实验室进入生产和生活并成为投资的风口,美国、日本、欧洲、中国等纷纷提出自己的人工智能战略。实际上,从人工智能理论的提出到大规模产业化应用也已七十年有余,且经历了多次技术路线的变换。可以说,人工智能技术创新与产业发展的历史为我们提供了一个近距离观察前沿技术创新与新兴产业演进规律的契机。
1 前沿技术创新的规律
新兴产业是由前沿技术不断发展进而工程化、产业化并不断壮大形成的。前沿技术如同其他现代科学技术一样,不仅是由新发现的基本效应或自然规律所推动的,更是以基本效应或自然规律为核心、集成和融合其他领域的科学技术而形成的复合技术或技术集。而前沿技术的工程化、产业化过程更是离不开相关技术和产业的支撑,某一项前沿技术发展实际上是与其他相关技术协同演进的结果。前沿技术在工程化、产业化过程中,表现出在技术路线、商业模式上的巨大不确定性,历史地考察新兴产业的发展历程就会发现,在早期阶段,通常有多条技术路线交替出现、相互竞争、此起彼伏。
(一)技术演进路线的不确定性
科学发现和技术发明是新兴产业形成与发展壮大的基础,但技术演进的路线从来都不是直线向前的,从最初的基础科学被提出到最终产业化主导设计的确立都面临着巨大的不确定性。弗里曼和苏特[3]划分了由低到高六种与创新相联系的不确定性程度,相比之下,产业化之前的科学研究与产品创新的不确定性要比产业化之后的产品改进所面临的不确定性大得多,其中基础性研究和基础性发明的不确定性最高,新型号较小的技术改进的不确定性最低。这种对不确定的分类意味着,一种技术路线在研究开发阶段的失败率要比进入较为成熟的商业开发之后大得多。
技术创新路径的不确定性在产业化之前表现得尤为明显。林毅夫[4]指出,当新的投资机会出现时,企业会像浪潮般涌向这个领域,出现所谓的潮涌现象。实际上,潮涌现象不仅发生在产业领域,在技术创新领域同样存在。当科技工作者发现一个具有重大前景的研究领域时,其会最先蜂拥而入;政府、科学基金会、风投机构、企业继而发现技术的产业化前景也会加大研发投入,使研发阶段的潮涌现象比产业化阶段的更为突出。在技术产业化之前或竞争前阶段,新科技的基本原理尚不清晰,需要在摸索和试错中不断向自然规律靠近。由于科研机构、科研人员的学术背景和研究基础大相径庭,他们会利用各自的优势从不同的角度对自然现象作出解释、对产品原型进行构建,因而就会出现多种不同的技术路线先后涌现、相互竞争的局面。人工智能技术发展的历史非常典型地呈现出技术演进路线的不确定性、潮涌现象以及多条技术路线竞争的特征。
19世纪50年代,科学家们尝试应用计算机程序进行抽象化、符号化的数学证明,并取得了一定的成功。纽埃尔和西蒙在达特茅斯会议上展示的首个人工智能程序“逻辑理论家”能够证明《数学原理》前52个定理中的38个,1963年“逻辑理论家”已能够证明全部的52个定理。科学家们在用计算机进行平面几何定理证明和不定积分式计算方面也取得了一定的成功。但是随后人工智能系统在数学定理的证明方面陷入瓶颈,在自然语言翻译方面也遭遇滑铁卢[5]。20世纪60年代初期,美国计算机科学家费根鲍姆首先将视线从抽象的通用证明方法转移到具体的专家知识上来,认为人工智能应在知识的指导下实现,这一构想催生了专家系统(Expert System)。最初的专家系统主要应用于学术领域,如1965年斯坦福大学在美国国家航天局的要求下研制的具有丰富化学知识的DENRAL系统[6],其能够根据质谱仪的数据推知物质的分子结构,并被应用于世界各大学及工业界的化学实验室中。但是专家系统的不足也是非常明显的:其运作需要大量外界的知识输入,耗时耗力,而且从一组专门知识中推演出的逻辑规则只能适用该特定领域,不能解决需要极其复杂逻辑推理的常识问题。面对专家系统技术路线撞上的“高墙”,人工智能科学家们继续沿着不同的路径进行探索。在20世纪80—90年代的10年间,形成了符号主义、连接主义和行为主义三大学派鼎足而立的格局。
符号主义学派认为,人工智能源于数理逻辑推理,其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理[7]。人类认知和思维的基本单元是符号,认知过程就是在符号上进行的逻辑运算。如果利用计算机中的逻辑运算来模拟人类的抽象逻辑思维,就可实现人类认知的机械化,即实现人工智能。因此,人工智能实现的重点在于对人类思维中数理逻辑的模拟,这种模式既可以基于碳基的人脑,又可以基于硅基的计算机处理器。连接主义学派认为,人工智能源于仿生学,其原理为神经网络及其之间的连接机制和学习方法。人类的大脑由数百亿神经元细胞构成,神经元是大脑神经系统的基本单位,也是行为反应的基本单位。人类的智能活动通过大脑中神经元突触的复杂连接与协同作用加以实现。连接主义学派基于这一思路认为,可以通过大量的非线性并行处理器来模拟人脑中众多的神经元,通过处理器之间复杂的连接关系来模拟人脑中众多神经元之间的突触连接。行为主义学派认为,人工智能以控制论和感知—行为型控制系统为基础。该学派将复杂的行为分解为多个简单行为,智能行为在行为主体与环境的交互过程中产生,行为主体根据环境的刺激作出反应,特定的反应对应着引起该反应的情景或刺激。
(二)多学科融合与技术演进
人工智能在学科分类上属于信息科学与技术领域,但是人工智能技术进步的动力不仅来自于人工智能学科本身,更需要来自多个学科技术的支撑,受到多领域科技发展的启发。多个相关学科理论和技术的集成与融合构成完整的人工智能科学体系,进而产生具有实际应用价值的产品或系统。根据《2019年中国新一代人工智能发展报告》,人工智能呈现明显的学科交叉、融合发展态势,人工智能领域的学术论文涉及多个学科[8],数学与逻辑学、控制论和信息论、生物学特别是神经科学构成了人工智能的主要理论来源。
1.数学与逻辑学构成人工智能的基石
数学肇始于人类文明早期的生产活动,算术、几何、代数可视为数学发展史上三次革命的重要标志[2]。欧洲文艺复兴时期,法国科学家笛卡尔就提出,所有的科学解释必须以精确的数学定量方式表达。同一时期,关于随机现象与可能性的理论——概率论被提出。到20世纪,苏联数学家柯尔莫哥洛夫构建了基于公理化—集合论的概率论理论体系。思维逻辑是人类智慧的重要表现,古希腊哲学家苏格拉底提出如何判定某个定义是否正确的问答法[9],可视为对人工智能思维逻辑思考的起点,与人工智能的开创者图灵定义“机器智能”的方法一致。将符号化、数字化的数学方法用于表达形式逻辑以及推理、证明问题的“数理逻辑”随后被发明。
数学和逻辑学对计算机科学的发展起到决定性作用[10]。1935年,当时年仅23岁的图灵在思考数学家希尔伯特提出的23个世纪问题中的“能否通过机械化运算过程来判断正系数方程是否存在整数解”这一问题时意识到,解决这一问题的关键在于对机械化运算的严格定义,即“依照一定的有限的步骤,无需计算者的灵感就能完成的计算”[5]。他提出,是否能在数学上给“可计算”下一个精确定义,然后用数学手段来研究万事万物的可计算性?这便是计算机的理论先导。20世纪40年代起,图灵开始思考依据什么标准判断一台机器是否具有智能[11]。他从行为主义的角度,将智能等同于符号运算的智能表现。美国科学家诺依曼将图灵理论物化成为实际的物理实体,完成初步计算机硬件体系结构的构建。在达特茅斯会议上,纽埃尔和西蒙展示了“逻辑理论家”(Logic Theorist)计算机程序,用于代替人类进行自动推理来证明数学定理,人类历史上首个人工智能程序在纯数学学科上实现了突破。
2.控制论和信息论构成人工智能的理论基础
控制论诞生于美国数学家Wiener[12]在他的专著中,将控制论定义为一门研究机器、生命在社会中控制和通讯的一般规律科学。控制论建立在统计理论的基础上,兼容了数学、物理学与哲学。控制论认为,计算机与神经系统的工作机理具有相似性[13],都是一个自我调节和自我控制的动态系统。
人工智能研究应用了控制原理和方法,主要包含三类理论:一是对人工大脑反馈机制的研究,通过对大脑中神经网络的模拟,构造出类似的人工大脑。具体来说,将被控制对象输出端的信息与目的信息比较,导出偏差信息并反馈给控制器输入端作为控制信息抵消干扰作用,从而使系统恢复稳定,达到或接近目标状态。二是对模式识别的研究,包括研究生物体(包括人)感知对象的方式等认知科学问题。三是对如何利用电子计算机,在给定条件下对某些复杂的系统进行鉴别和分类进行研究。
20世纪中叶,信息论出现。电信时代的开拓者申农最先以严格的数学方式进行了信息的数学计算,为通信系统建立了完整的数学理论。他提出量化信息的“熵”(Entropy)这一概念,开启了数字信息时代[14]。同时,申农在信息编码与概率论的基础上,研究了信号传输中的波形与干扰。当代的信息科学技术是在申农工作的基础上,进一步研究如何实现信号采集、传输、存储、处理,并从中提取和使用深层次信息。作为信息通信和计算机科学的一个重要思潮,信息论成为深度学习和人工智能的重要理论来源。
3.生物学推动了人工智能研究的突破
生物进化理论的提出是现代生物学诞生的重要标志。1809年拉马克提出的进化学说、1859年达尔文提出的进化论以及1865年孟德尔提出的遗传学都揭示了生物物种是一种复杂系统,其进化中体现出了奇妙的自适应、自组织和自优化能力,这是一种生物进化中的智能[15],也是人工智能研究行为主义学派的理论基础。对脑科学的研究则成为人工智能研究的连接主义学派的理论基础。脑研究分为两类:“自上而下”的脑研究以及“自下而上”(还原论)的脑研究。“自上而下”的脑研究从整体上研究脑功能,发现大脑既分工又合作,既具有整体活动功能,又具有分区处理功能,脑区域与身体之间的映射关系可以在数周之内发生根本性改变。“自下而上”的脑研究则是从单个神经元开始研究大脑的工作原理。数理逻辑学家McCulloch和Pitts[16]提出了以形式化数学描述神经网络结构的方法,创立了理想化的人工神经元网络脑模型(即MP模型),开辟了用电子装置模仿人脑结构和功能的途径。此后,在20世纪60年代至70年代,美国心理学家White和Rosenblatt[17]将反馈学习算法引入神经网络中,提出了以“感知机”为代表的脑模型。到20世纪80年代,神经科学的发展推动人们对大脑的了解不断加深,激发了人们对用机器模拟神经网络研究的兴趣。深度学习理论模仿人类大脑的核心结构特征,通过设置输入层、输出层及其之间的中间层(隐藏层)的分层结构,以反向传播的方式实现机器的自我学习。有趣的是,一些著名的深度学习开创者都具有生物学(生理学、心理学、神经科学)的背景。如神经网络建模的顶尖人物之一马尔从剑桥大学获得了数学学士学位和生物学博士学位,他的导师是专门研究视网膜和色觉的生理学家布林德利;深度学习开创性论文的作者辛顿在剑桥大学获得的是心理学学士学位,而他的博士论文导师希金斯则是一位发明了早期联想记忆网络模型的杰出化学家[18]。由此可见,人工智能体现出明显的多学科交叉特征。
需要说明的是,人工智能的不同技术路线、构成人工智能基础的不同学科之间不是彼此隔离的,而是互相吸收思想、彼此融合互补,共同推动了人工智能技术的发展与产业化。以人工智能三种流派为例,三者从不同的角度理解、定义和构造人工智能,但也存在各自的瓶颈与局限,而且三者之间既存在差异也存在联系。符号主义学派致力于数理逻辑在计算机中形式化的表达,在专业化领域得到很好的表现。但万能逻辑推理系统并不存在,计算机和智能机器人不可能完全模拟人类思维。连接主义学派致力于构造模拟动物与人类大脑和各种感觉器官的结构和功能的智能。但人脑是一个极其复杂的系统,目前已知的结构和活动机制仅仅是冰山一角。而行为主义学派从智能是生物体与外界环境的动态适应出发,通过对来自外部环境的信号在感应器内进行转换,在智能机器与环境的相互作用下构建智能。但该种基于行为—动作模式的智能只能捕捉到特定目标的行为,并且存在缺乏创造性、存在意向性等缺陷。三大学派从不同的方向上模拟人工智能,而在现实中,真正的智能正是以上三种模式的结合,或许三者的融合会成为人工智能研究的下一突破口。
[1] [2] [3] [4] [5] 下一页