2015年度北京市科学技术奖一等奖的29个获奖项目中,有一个名为“群体智能支撑的互联网搜索技术及其应用”的项目,获得了很高的评价:这种技术能够显著提高当前的搜索引擎对用户意图的理解和对搜索结果的展现,不仅对于搜索引擎技术创新有着巨大的提升,也能在实际的产品应用中让用户获益。这一成果受到了广泛的关注,不仅是因为技术本身具有的重大价值,更因为这一技术的两位合作者——来自清华的一对师兄弟:王小川和刘奕群。
500米光纤连接资源与智慧,搜狗与清华的十年攻坚
王小川和刘奕群都曾是清华大学计算机系,王小川比刘奕群高三级,当年凭借师兄弟的情谊相识。博士毕业后,刘奕群留校从事网络信息检索研究的工作,王小川则成为了搜狗公司CEO。一天王小川找到他,问:“你是否愿意让自己的研究成果被上千万中国网民所使用呢?”从此,刘奕群和师兄王小川因“打造中文环境下最强的搜索引擎”梦想而又聚到了一起。他们联手开展了“群体智能支撑的互联网搜索技术及其应用”研究,并获得2015年度北京市科学技术奖一等奖。
对于清华副教授刘奕群来说,大规模数据的处理项目,单纯依靠高校是很难完成的。一方面在计算和存储资源上有限,最重要的是高校很难收集到大量用户的真实行为数据。而对于搜狗CEO王小川来说,大数据时代的信息技术研究,仅凭研究人员出色的理论功底和巧妙地算法设计,已远远不能取得令人满意的成果。真实的互联网数据,是展开搜索技术,前沿研究最重要的依靠,这使得搜狗在人工智能领域拥有得天独厚的优势。
为解决这一难题,2006年清华与搜狗联合成立实验室,在清华和搜狗之间搭建了一条专用光纤,用于共享整个搜狗的计算数据资源,使双方的难题迎刃而解。刘奕群带领团队从海量规模的用户数据中提取群体智慧,成功应对了三项搜索引擎面临的重要技术挑战:从用户看似无序的点击行为中,挖掘规律,改进搜索引擎查询理解的性能;借助用户浏览行为模式的差异,监测网页质量,让垃圾和非法信息无处遁形;通过认知心理实验建立用户行为模型,改进搜索引擎结果排序的性能。荣耀的背后,是联合实验室数百场技术研讨会、数十篇国际顶级学术论文,和数十项发明专利的十年攻坚,也是搜狗人和清华学子共同钻研和奋斗的身影。
让搜索具有智慧,搜狗与清华的新梦想
作为一家技术驱动的公司,搜狗取得的技术成果有目共睹:搜狗拥有的技术专利超过1000项,在业界排名第三,仅搜狗输入法就已经累积了200多项专利。同时搜狗一直保持着对互联网技术的高度关注,几年前已开始应用深度学习方法进行产品研究,今年更是打出了知识计算+自然交互的人工智能战略。目前,在语音及图像识别、自然语言理解等方面,基于多年在深度学习方面的研究,以及搜狗输入法积累的海量数据优势,搜狗语音识别准确率已超97%,位居第一。
今年4月,搜狗向清华大学捐赠1.8亿元,共同成立“天工智能计算研究院”,共同致力人工智能领域的前沿技术研究。这是首个校企合作的中国人工智能领域研究院,标志着搜狗与清华将共同发力向世界人工智能顶级水平迈进。
依托于清华大学的紧密合作,让搜狗能够参与到国内最前沿的技术研究和应用过程中,以强大的技术底蕴加强自身的产品体验和企业实力;同时也让搜狗将有能力吸引全球顶级专家学者加盟,共同推进中国人工智能理论与技术进步。让人工智能不仅是概念,更能够作用于情景化的产品,让人们的生活更加智慧和便利。
而对于清华,搜狗海量的数据积累与产品体系为技术研究提供了强大的数据支持与实践应用渠道,也能极大加强高校的技术研发实力与实用性。
让搜索拥有智慧,是王小川和刘奕群的梦想,他们努力让人工智能技术变得巧夺天工。 “技术不是空中楼阁,他真正的土壤源于人们的生活,如何利用技术优势解决生活中实实在在的问题,这才是有意义的事”王小川说。