继搜狗CEO王小川携搜狗语音亮相央视后,近日搜狗正式对外发布搜狗语音交互引擎——知音,该技术主打“能听会说”以及“能理解会思考”能力,让人机交互更加自然。
凭借互联网公司的天然优势以及多年来的数据和技术积累,搜狗的“知音”引擎可以做到识别速度更快、纠错能力更强、支持更加复杂多轮的交互以及更加完善的服务能力。
首先,“知音”解决了用户在说话过程中因语速过快而导致的吞音问题,语音识别错误率相对下降30%以上,语音识别速度提升3倍。其次,“知音”能够在语音交互的过程中支持用户修正错误的识别结果,用户可以使用自然语言进行改错,例如,用户可以说:“把‘张’修改为立早‘章’,或者把‘张’修改为文章的‘章’。”
不仅如此,“知音”还支持多轮对话,处理更复杂的用户交互逻辑,用更自然并且用户更容易接受和理解的方式进行交互,更好地感知用户语音请求背后的真正需求,从而提供更为便捷的人性化服务。比如用户说我要去首都机场,它会问T1还是T2,当用户确定航站楼后,它会问是出发还是接人。
据搜狗CTO杨洪涛介绍,搜狗从2012年开始研发智能语音技术,并在2013年开始进行深度学习,目前搜狗的智能语音技术已经成功应用到搜狗的全线产品中。数据显示,搜狗日均语音搜索次数增长超过4倍,搜狗手机输入法日均语音输入超过1.4亿次,成为中国语音输入功能使用量最大的移动手机产品,搜狗语音技术也在用户产品的迭代中快速取得了行业领先效果。相关数据显示,在语音输入的准确性上,搜狗与科大讯飞大致持平,领先于百度。
杨洪涛表示,自然交互和知识计算是搜狗在人工智能领域的两大战略方向,目前搜狗在AI领域的研发已经全面展开,并在智能语音领域取得了重大突破,“知音”引擎作为搜狗在自然交互方面的重要成果,充分说明了搜狗强大的技术实力,未来随着搜狗在自然交互与知识计算方面的不断完善,“知音”将会在更多场景为用户提供服务。
随着人工智能浪潮的来临,以及物联网场景下应用需求的不断扩大,智能语音产业规模将持续快速增长。搜狗适时推出“知音”引擎,不仅有利于其在即将迎来的行业爆发期中占得良机,对整个智能语音行业的技术革新也具有深刻意义。随着搜狗语音技术的日趋智能化和服务化,“知音”将会在物联网、车联网、人工智能等各个方面得到应用,并布局到更多的终端入口。