语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

镁客网 中字

近日,搜狗召开发布会,正式推出其自研的速记神器——搜狗听写。这是一款能够将语音实时转变成文字的速记工具,拥有转写和听写两种模式,主要面向记者、编辑、作家等文字工作者。

语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

由搜索而知名的搜狗,在人工智能领域似乎也玩的风生水起

众所周知,搜狗以搜索业务起家。除搜索业务外,其在近年还因搜狗输入法、搜狗高速浏览器等在行业内颇具名气。

如果仅从以上这些来看,搜狗此次推出“搜狗听写”似乎显得有些无厘头。然而,搜狗CEO王小川曾表示,搜索本身也是一种AI。

语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

回顾搜狗的发展史,除去初期产品,搜狗在其产品迭代或新品中都或多或少的运用到了人工智能技术,例如搜狗云输入法、加入了云计算技术的搜狗输入法5.0版本、儿童智能手表“糖猫”等。

很显然,这一次搜狗将目光瞄准了语音识别领域,也似乎做出了点成绩。搜狗语音交互技术中心总经理王砚峰表示,搜狗听写中涉及到了大量前沿技术,例如大规模的优质语音数据训练和深度学习的技术能力积累等,不仅可应用于多个场景,其语音识别准确率也高达97%以上。

产品并无明显差异化竞争优势,搜狗听写要拿什么去竞争?

从搜狗方面的介绍看,搜狗听写可提供两种服务,语音转写和语音听写。此外,它还同时具备了边听边改、无线标重点、多端同步、信息分享等多个功能。而这样的语音转写工具,似乎在行业内并没有什么明显的差异化竞争优势。

语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

除新鲜出炉的搜狗听写之外,科大讯飞的云犀、思必驰的语音输入板等,都是能够将语音转换成文字的工具。此外,仅在中国,除去普通话,大方言就有八种,各小地区方言更是多不胜数。这其中所涉及到的语音识别、语义识别、深度学习、算法训练等多个人工智能尖端技术,难度不可谓不大。

很显然,与一直致力于语音识别领域技术开发的企业相比,搜狗在专业程度及行业经验方面都有不做。而除去这些专业性企业和产品之外,当下很多输入法及搜索工具也有类似的功能,搜狗并没有赋予搜狗听写具有差异化竞争力的功能。在市场逐渐开拓的当下,搜狗想要凭借搜狗听写搏得一方市场,显然不容易。

技术+人工,AI至今未能真正做到全智能

在语音转化文字方面,除去偏C端的工具外,专业性系统或软件也有很多,例如科大讯飞的听见智能会议系统。在大多数的专业性会议,主办方都会聘请的专业速记人员。而与前几年相比,现今的速记工作已经有了更多人工智能的参与。

只是这其中存在着一个的现象,当前的语音转写技术并不能一力承担整场专业性会议,还需要有专业速记员全程盯着,实时进行纠错没有识别出的内容、标点等。

语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

科大讯飞负责会议现场速记的一位专业速记员表示,在以科大讯飞听见智能会议系统为主导、没有纯正方言的情况下,正常会议速记工作的人工参与率是5%—10%。

不过,在人工智能相关技术不够成熟的当下,这样的人工参与率已经是很低的了。虽然目前我们并不能做到完全智能,但仅就速记AI领域来说,有了专业速记员的配合,不仅能够保证速记内容的精准,还能为开发者提供更为直观的现场反馈,为技术的进一步发展助力。

总结

随着人工智能相关技术的发展与前景的逐渐明朗,似乎所有行业都想在这一领域插上一脚,大公司更是不例外。当然,企业发展需要新鲜元素的加入,但如果只是为了与“AI”沾亲带故以获得“宣传”的理由,对于行业来说,这样的企业或从业者也许就是毒瘤。

从当前来看,速记神器确实为特定人群所需,但想要让这类产品成为刚需,还需行业者切实考虑用户需求,尽快让AI成为真正的全智能技术。

声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存