随着科技的不断发展,无论是虚拟世界还是现实世界都在经历着一场前所未有AI变革战。
1月16日,百度输入法搞了一场名为“AI·新输入 全感官输入2.0”的发布会,发布了其宣称为“国内首款真正意义上的AI输入法”的百度输入法AI探索版,百度高级副总裁王海峰表示,“百度输入法将扮演好沟通桥梁的重要角色,让人机交互进入一个全新的阶段”。
可以说,百度输入法正是目前的业内标杆。这也是第一家真正思考AI时代人机交互的输入法产品。
借用AI优势 语音交互开启“百度式”新体验
从PC时代到移动互联网时代,输入法可以说完美的呈现了人机交互的升级变革,尤其是AI技术的应用,让这种笨重机械式的搜索工具有了更加人性化的一面,这对于游走于内容世界的我们来说无疑是技术入局后的体验升级,而语音作为人诞生以来最天然的交互方式但却一直没有在这场升级大战中完美释放,这对于那些信奉“技术改变世界”的变革者来说无疑是遗憾的。
自从百度高调开启AI战略以来,百度系产品就进行了一系列的智慧化变革,而输入法作为内容和人类衔接的完美桥梁,在这样一个AI时代也迎来了应有的尊重,百度作为内容产业的佼佼者,不仅借助了自己强有力的内容产业闭环,更重要的是在新一轮产业升级时期,百度把过去的搜索引擎,变成“搜索+信息流”的双引擎产品。在融入AI之后,把过去搜索引擎时代的人找信息,变成信息、服务找人。既能让用户找到信息,也能让信息找到用户,重构了新型信息服务体验。
据百度高级副总裁王海峰表示,输入法是离用户最近的产品之一,也是AI落地的“桥头堡”,百度全方位的AI能力正在不断赋能输入法,让输入法更”聪明“。他也给出了输入法行业的“未来画像”,虽然目前的输入法产品主要应用于手机端,但未来的输入法将应用于各种智能设备与用户的交互,并走向世界,为全球用户提供更多元的输入方式。
多样式玩法激变 革新固有化输入法逻辑
既然是一款百度输入法AI探索版,那就不会只停留在AI在语音交互层面的价值,否则“探索”二字将变得毫无意义。
为了更好的激发用户的交互热情,百度输入法AI探索版的“新探索”推出了凌空手写,用手指在摄像头取景范围内的空中手写,输入法即可识别并生成文字。乍看这是利用手机摄像头和AI技术的一种新奇玩法,而事实上,这意味着输入法有了脱离PC和手机的机会,比如,在目前已有的案例中,百度输入法凌空手写技术已经在小寻手表、小天才电话手表上得到应用。
当然了,这只是“探索”价值的一面,伴随着百度语音、视觉、自然语言处理、知识图谱等百度AI技术落地输入法,“全感官”的输入变成现实。除了语音输入,百度输入法AI探索版还推出了拍立活、秀场、凌空手写等新功能玩法。无论是心爱的偶像,还是日夜陪伴的宠物,“拍立活”功能都可以让用户通过自己的动作“驱动”对方做出相同表情;“秀场”功能运用图像分割技术,让用户“穿越”到不同的虚拟场景之中,科技、清新、赛博朋克多种风格随意挑选,表情创作更具场景感、更加生活化;凌空手写如同隔空打怪,在空中书写也能被流畅识别,目前整体识别率已达到大规模应用的要求。
从百度输入法AI探索版的表现形式来看,可以说完全打破了用户对输入法的固有认知,除了敲键盘、语音交互这些思维意识形态存在的画面感以外,百度输入法AI探索版完全将用户拉到了另一个产品空间,通过技术加码后的产品形态不仅更好的吸引了用户,更重要的是这种新方式的内容交互为百度后期迎接产业升级的万物互联打下了衔接基础,在助推产业升级的同时也为用户带去了更加多元化的场景新体验。
深挖用户需求 极致体验助推人类返璞归真
不过,作为一款用户驱动的产品,玩法的“千姿百态”无疑是吸引用户围观的有效法宝,但如何释放用户的后发实力,才是产品得以生生不息的关键所在。
而百度输入法AI探索版作为一款默认输入方式为全语音输入的产品,无疑是会把语音交互打造成产品的重要亮点,而对于语音交互而言,其首要难题就是如何通过用户的语音输出准确的完成语义表达呢?为此,百度输入法特意发布了在线语音的“流式截断多层注意力建模”(SMLTA)技术,按其说法,是“世界上首次实现了局部注意力建模识别精度超过全局注意力模型”,以及“世界上第一次大规模部署在线语音交互注意力模型”。该技术可以解决传统模型存在的“时延性”问题,百度方面宣称其“将在线语音识别精度提升了15%,超越行业最高水平15%”。
而且,除了语音识别精准度以外,百度输入法AI探索版还专门针对方言进行了优化,通过“方言与方言、方言与普通话的混合语音输入”技术,从而实现无缝切换,用户可实现“自由说”。与此类似地,中英文夹杂亦可来回切换。目前为止,百度输入法应当是市面上唯一实现了高精度中英文混合语音输入、方言免切换语音输入的输入法产品。
同时,在离线语音识别领域,为解决用户多元输入场景的需求,百度持续优化Deep Peak 2系统,让离线语音输入相对准确率再次提升,高于行业平均水平35%。即使用户处于地铁、电梯、隧道或人流密集等离线场景中,依然可以借助百度输入法进行精准的语音输入。
截至2018年底,百度输入法月活跃人数已达5亿,语音日请求量峰值突破5.5亿,AR表情使用次数超过1亿。同时,百度海外输入法全球安装量超过1亿,支持120种语言,覆盖全球190个国家地区,并与超过100个全球知名IP达成合作,实现技术与市场的双丰收。
纵观历史长河,PC时代,输入法要通过键鼠让我们和机器交互;移动互联网时代,触摸屏又取代键鼠,成了输入法新的承载者。试想一下,在键盘、鼠标、触摸屏等一系列交互手段之后,以智能语音为代表的对话式人工智能将会产生什么样的产业形态呢?
或许,属于百度的时代将再一次开启!