互联网

录音5分钟,修改1小时,搜狗录音笔值得买吗?

  编辑 | 谢治贤

  出品 | 于见(ID:mpyujian)

  在科技时代,过目不忘、过而成诵的惊人本领成为了人人都垂手可得的易事。只要打开智能设备的录像、录音功能,任是再复杂的场景、声音也能点滴不落的记录、回放。

  这种本该与人类智力天赋紧密结合的本领,如今只需要会简单的技术操作就可以完美实现。也成了诸多新闻工作者、办公文案者炙手可热的利器。而在录音方面,搜狗录音笔最近可谓占足了风头。

  8月28日,搜狗(SOGOU.US)推出了升级版的人工智能记录笔c1,并与爱国者、纽曼、索尼和万城集团组成了人工智能创新联盟。

  搜狗在人工智能录音笔上不断增加的筹码也得到了资本市场和投资者的认可。自8月28日至8月30日,搜狗股价已经连续三天上涨。

  在搜狗录音笔取得成绩沾沾自喜的时候,殊不知,在录音笔行业,人工智能录音笔C1还面临着市场规模增长缓慢、产品同质化替代性严重等诸多问题亟待解决。

  手机便携,录音笔可取代性强

  随着人工智能的深入人心,搜狗开放了转写、云存储等服务,并与业界领袖建立了人工智能创新联盟,希望能解决智能录音中“单功能”、“手机易替代”的痛点。企图在细分区域建立生态系统,创造更大的价值,推动行业进入人工智能时代。

  这次,升级版的搜狗人工智能录音笔增加了黄色、红色和白色三种颜色搭配。它在高清录音、转录、云存储三大基本功能的基础上,还集成了语音识别、机器翻译、自然语言处理等技术,可应用于面试、会议记录、学习训练、自我认知等领域,同时还可适应旅行笔记,记录灵感和其他应用场景。

  面对市场规模增长缓慢、产品同质化替代性严重的痛点,突破人工智能时代录音笔发展的瓶颈迫在眉睫。8月28日,SOGO.US推出了升级版的人工智能记录笔c1,成立了人工智能创新联盟。值得注意的是,搜狗已经向合作伙伴开放了智能服务,且合作品牌是免费的,相关用户可以享受录音转文字、同声传译等增值服务。

  然而,由于录音笔具有天然的功能单一和智能手机录音功能的可替代性,录音笔行业的用户规模不断受到冲击。录音笔行业产量增长基本停滞,进入缓慢发展和饱和状态。为了更好地满足用户的高品质需求,搜狗正利用人工智能技术加快产品迭代,进一步开发使用录音笔,并打开行业规模的天花板。

  但其努力收效甚微,通过搜狗录音笔统计用户信息可知。其用户大多是专业记者工作者,办公文案人员等,这些人员出于工种、场景的缘故,不得不使用更专一、严谨的录音笔。而普通消费者一端,则很容易被智能手机取代其AI录音功能。因为录音笔有的功能,手机可以实现全覆盖;录音笔没有的功能,手机还可以补充强化。无论是硬件情况,还是服务周到程度,似乎录音笔在智能手机面前失去了竞争力。它只能代表录音两个字,给人有记录的正式感和仪式感。而在真正的录音体验上,恐怕额外购买录音笔在大多数消费者眼里是一笔累赘的花销。

  搜狗录音笔还有许多突破有待探索。此前录音笔的创新仅限于容量扩展、持续使用日期、外观修饰等方面。搜狗开始思考用户的主要需求,以及如何借助海量数据做好录音笔背后的服务,从用户使用频率和场景信息来判断,人工智能技术能给这个行业带来什么价值?

  为了适应更多的场景,减少外界噪声对录音的影响,搜狗在新产品中加入了双小麦阵列设计、录音笔C1的数字降噪算法等语音增强功能,并启动了语音识别功能。录音转文字时,搜狗能自动辨别人声。同时,人工智能录音笔还可以在抄写时主动去除口头和重复的文字。

  但据体验过的消费者反映,上述语音识别、翻译、转录、转录等功能体验并不良好。

  搜狗录音笔官方负责人表示,互联网上的大数据为深度学习的爆发提供了基础,而麦克风和传感器等设备则为人工智能提供了无尽的数据来源。搜狗的智能录音笔重量不到17克,但拥有语音识别、机器翻译、自然语言处理等技术已颇为难得。

  商业模式难以转变

  此前录音笔市场竞争中,一直存在着同质化产品打价格战的问题,此次搜狗与产业头部厂商组建AI创新联盟,向合作伙伴开放其听写服务,目的是想改变这一现状。从产品价格竞争向产品质量和服务方向改变,盈利模式向“硬件+服务”新模式改变,搜狗录音笔还面临诸多难题。

  事实上,与移动电源、蓝牙耳机等电子产品相比,目前录音笔的市场规模较小,录音笔已经到了衰退期,必须改变。纽曼董事长王洪峰也指出,传统单功能、低端录音笔的生存空间越来越小。搜狗现在持续改进的是语音转录、翻译和识别服务,也只有如此,才有望成为行业价值纵向延伸的代表,也可以为录音笔行业开辟更广阔的天地。

  搜狗录音应该为合作伙伴提供免费听写服务,而不是听写技术,不仅仅是一个开放平台或语音识别的应用程序编程接口。搜狗需要将语音听写技术转变为面向合作伙伴的完整服务,这样合作才能产生更大的用户价值。

  论搜狗的开放服务,此次与合作伙伴共同开发AI录音笔这个大品类,必须要解决的问题是用户体验的全新改变,通过“AI+软件服务+硬件”方式打破行业规模天花板,让整个行业从降低成本竞争改变为软件服务与硬件联合的方式,促进商业模式的升级。

  以搜狗的标签产品搜狗输入法为例,搜狗录音可以进一步将其听写服务与搜狗输入法相结合,这可能是提高用户体验的一个很好的途径。数据显示,搜狗输入法在PC机上占有90%的市场份额,手机用户超过4.5亿。如果搜狗能进一步开放口述服务,就可以为市场上90%以上的录音笔产品提供接入服务,也就是说,所有有需要的用户都可以大大节省录音转换时间。

  同时也要注意的是,搜狗口述服务是基于用户习惯的搜狗输入法。为了降低用户常用词的误码率,必须进一步自动构建个性化识别网络。

  根据大量搜狗录音笔用户反映,其录音笔在录音转文字的过程中,经常出现大量的错字病句,语法不通、言不达意的情况通篇皆是。往往是录音五分钟,修改一小时。

  搜狗CEO王小川在联盟成立当天表示,为了更好地实现搜狗的语音增强、语音静音和语音合成技术,他决定将搜狗录音与搜狗输入法和搜狗搜索两大旗舰产品逐步整合。希望未来能利用人工智能技术推动整个行业在表达和信息获取领域的进步,与同行业企业一起为用户提供更好的服务体验。

  有分析人士表示,搜狗听写服务在拥有录音等能力的基础上,还需要实现个性化转写、提升转写准确率。同时,搜狗建立起来的行业联盟对于促使录音笔收益模式从单一结构转向“硬件+服务”有一定的作用,而如何改变传统录音笔行业的商业模式将是搜狗录音亟需解决的一大难题。

  AI时代下,行业扩展不足

  随着人工智能技术的落地,搜狗人工智能录音机集录音、编辑、同声传译等功能于一体,为速记、记者、办公人员提供了一定的解决方案。然而,要实现录音笔智能化,仍然需要实现更高的翻译准确率,扩展更多的应用场景,满足用户在各个场景中的独特需求,从而实现行业的整体变革。

  录音笔要实现多场景应用、实现产业扩张,首先必须要有较强的联接能力,要有云端储存调取能力。要做到这一点,搜狗录音还须依靠借助搜狗输入法,并添加连接能力和转写的能力。此外,搜狗必须开发云端储存功能,脱离对物理设备的过度依赖,在没有携带录音笔的时候,也能跨区域编辑。

  除了提升客户服务的使用体验,搜狗还必须改善其合作伙伴的服务。搜狗的开放的口述服务,从技术到服务体系,都需要相关服务品牌的匹配,才能吸引更多的合作伙伴。

  据了解,搜狗推出了搜狗身份识别、搜狗语音合成、语音变化等多项人工智能技术,为搜狗语音识别、语音合成、翻译等相关能力提供技术支持。但是,搜狗的核心AI能力尚存不足,也还不具规模。该公司在升级智能硬件业务方面和许多AI新品的研发上还不够成熟周全。

  “未来的人工智能授权必须更重,而不是更轻。它需要对场景进行独特的优化和便利化。”人工智能业内人士表示,未来行业能够挖掘的空间有很大一部分是人工智能技术在会议等使用场景中能够提供的服务。

  由此,目前录音笔涉及到音频的分析、录制和处理等问题,但如何将这些功能扩展到更广泛的行业和场景,将是搜狗乃至整个行业未来面临的难题。

  中国人工智能学会副理事长马少平认为,从应用的角度看,中国人工智能已经达到世界水平,但搜狗智能录音笔背后的语音识别和机器翻译,实则处于当下AI发展的弱人工智能阶段,在特定场景下和传统产业进行结合,这种AI很难发挥应有的爆发力。

  录音笔作为一个工具类的产品,在人工智能技术的基础上不断加持,将使更多的用户了解未来录音笔的各种功能。搜狗智能硬件产品要想突破技术、产品和产业链,必须依托搜狗开放语音转录服务、人工智能创新联盟和产业链延伸。只有这样,录音笔生产企业才能提高录音笔的质量和用户服务水平,推动行业真正走向录音笔人工智能时代。

[!--page.stats—]
希望看到您的想法,请您发表评论x