8月12日,雷锋网主办的“CCF-GAIR全球人工智能与机器人峰会”于深圳香格里拉大酒店准时拉开帷幕。在圆桌讨论环节“机器学习大浪下进击的巨头们”中,主办方邀请到今日头条科学家兼头条实验室总监李磊博士、360人工智能研究院院长颜水成博士等4位专家发表了对当前人工智能领域的专业见解。拥有两家科技公司从业经验的科学家李磊博士,首次公开对前东家百度、现东家今日头条在人工智能领域研究的看法,并分享了头条实验室的最新AI研究成果。
人工智能技术研发已成科技大公司「必守阵地」
李磊博士认为,百度和今日头条两家公司有一个共同点,就是都以人工智能技术为主的公司。百度在人工智能方面投入非常大,比如语音识别和无人驾驶等。
大家传统的观念认为今日头条是新闻客户端。其实不然,今日头条不仅仅是新闻客户端,是一款基于机器学习的个性化资讯推荐引擎,是所有信息、内容分享创作的平台。人工智能和机器学习的算法起到了重要作用,能够帮助高效精准地把用户感兴趣的内容推荐出去。今日头条的内容平台对应着双边用户:一边是内容的创作者,另一边是内容的消费者。所以为了把最好的内容推荐给最需要的读者,就需要机器学习的技术。从这一点上来讲这两家公司都是以人工智能技术为核心的公司。
讲到今日头条和百度等公司在人工智能领域发展的不同时,李磊博士坦言,“我觉得主要在发展阶段和体量上是有不同的。百度、谷歌、微软在深度学习领域的探索发现早、发展迅速。像微软在2009年开始研究语音识别技术;谷歌在2012年使用1000台计算机、16000个CPU做猫脸识别技术;百度则做了深度学习研究院,主要研究语音识别和图象识别技术。现在百度研究的项目基本同微软、谷歌一样多,涉及到了人工智能所有领域。”
今日头条不同于这几家公司,它于2012年创立,已成立4年。回溯那些顶级科技公司在成立4年时做什么? Facebook在2008年没有研究院;百度在2003年也没有实验室;谷歌在2002年时做了一个GFS奠定了搜索的基础架构。今日头条在成立4年的时候就有意识成立实验室,在最前沿人工智能技术上做非常大的投入。在人工智能前沿技术方面,不管现阶段这个技术能否投入应用,亦或是做技术储备做前沿研究,今日头条在这方面的理念是非常有前瞻性的。
自然语言处理和深度学习的进步——兼顾写稿和知识问答的AI机器人
李磊博士介绍说,他已经连续2年参加国际自然语言大会(ACL),感受最深的是在自然语言处理和理解方面用深度学习来作出的成果进步非常之大。而且今年几乎超过2/3的论文都是研究深度学习领域。所以如果说我们好像没有看到深度学习在自然语言方面取得像语音技术和图像技术那样有很大的成功,其实不然。
当然,深度学习和自然语言处理在文本方面没有像语音处理在2009年就成功、像图像处理在2012年就成功。但现在已经有很大的进步。在今日头条的头条实验室,我们正在研发自然问答的机器人,可以在2200万的事实里面准确率达到75%,比之前最先进的方法准确率高13%。
为什么能做得这么好?因为我们用了更先进的深度学习模型。与此同时,里约奥运期间,我们还为机器人增加了「写稿」模块——AI机器人Xiaomingbot可以自动生成体育新闻报道,包含简讯和资讯,并使用智能选图技术,实现了给新闻配图。
据今日头条技术负责人介绍,截至8月16日,Xiaomingbot在过去11天已经发布超400篇奥运新闻,为92.5万用户提供赛果第一时间的报道,单篇报道阅读量最高达10.1万。
人工智能研究并不局限于深度学习
对于现阶段公众对人工智能研究的认识,李磊博士认为有必要厘清几个常被提到的概念,“大家想到人工智能,不要认为人工智能等同于机器学习,而机器学习也不等同于深度学习。”
事实上,除深度学习之外、其他的机器学习框架在历史上有曾经有一段时间非常成功,甚至现在也有很多的问题可以用其他框架来解决。李磊说,“我们不应该把视野仅仅局限于深度学习领域上。我们要解决的很多问题比有监督学习更为复杂,我们要让计算机去学习一些简单的问题,但是也要让计算机学会逻辑推理,学会在复杂的环境下如何跟环境交互,同时也学会怎么样用最少的能量去掌握新的技能。”
李磊博士,今日头条科学家、头条实验室总监,原百度美国深度学习实验室少帅科学家 。 上海交通大学计算机系本科,卡耐基梅隆大学计算机系博士,毕业论文获美国计算机学会SIGKDD最佳博士论文之一。曾于微软研究院、Google、IBM TJ Watson、加州大学伯克利分校工作 。在机器学习和自然语言理解方面于国际顶级学术会议发表论文30余篇,拥有三项美国技术发明专利。