AR眼镜字幕效果如何。
实测来了!
不仅可以将语音实时转换成文字,还可以区分说话人的主体,甚至可以保存文字记录,以备日后追查。
今年,一家来自英国的ar初创公司开了脑洞。
他们把语音转文字功能搬到了AR眼镜上,让改进后的文字可以快速直接地呈现给人们。
主要目的是为听障人士服务。
毕竟在很多情况下,即使有了助听器的帮助,听障人士仍然需要文字作为参考信息。
借助AR眼镜,字幕可以直接呈现在人们眼前,接收信息更加方便快捷。
具体效果如何。往下看~
有一种打开弹幕的感觉。
体验的效果大概如下左图所示会出现一个对话框,在这个对话框中会标注说话人和对应的语音内容
体验者西蒙·希利表示,当你刚戴上AR眼镜听对方说话时,它的转录准确度非常好。
效果有点像实时语音转文字的常用功能在语音结束之前,文本内容会一直调整最后,一段写完就会有最终版本
但是在对话的情况下,如果两个人聊一会儿,语音转写的速度会慢一些。
XRAI内部人士表示,这是因为语音转文本的计算是在云端进行的,有延迟是正常的。
而且不仅仅是实时转录该功能还支持搜索历史记录,在AR眼镜和手机上都可以搜索到感觉有点像聊天软件
录制的语音会在文字转录后立即删除XRAI还强调,这些文字只有用户自己才看得见
如果没有AR眼镜,也可以在手机上体验XRAI的功能。
也有网友戴着眼镜体验了一下,表示这个功能在语音转换的速度上还是很快的,在AR界面的呈现也不错。
缺点是需要选择要识别的语言类型在这里,她正在测试法语
除此之外,西蒙大哥也在自己的经历中发现了一些小问题。
例如,根据XRAI的设想,听障人士需要一副AR眼镜+一部Android手机才能使用该功能。
是的,该应用程序还不支持iOS。
两个设备加起来握起来很麻烦,尤其是AR眼镜的重量还没降下来听障人士要戴人工耳蜗和一副ar眼镜,舒适度肯定不高
西蒙说:
我无法想象如何带他们一整天。
以及语音对文字的影响,西蒙也提出了一些问题他说,对于听障人士来说,需要文字作为参考信息的场景很可能是嘈杂的地方,这对语音识别的算法提出了一定的要求
在体验XRAI的功能时,公司的CMO特意带他去了一个相对安静的环境演示,并承认在嘈杂的环境下效果不是很好。
以及价格方面,XRAI的AR眼镜为Nreal,国内售价2299元,海外售价379美元。
XRAI的服务也不是完全免费的基本免费版只能保存一天的通话记录,还有20美元/月和50美元/月两种套餐可供选择
如果选择50美元/月套餐,还会在基本功能上增加一个人工智能助手。
但西蒙表示,作为一个仍处于初级阶段的产品,存在可以理解的缺点。
更重要的是,令人欣慰的是,他们想从无障碍的角度帮助听障人士。
XRAI玻璃公司背后
提供这项服务的公司来自英国,名字叫XRAI Glass。
该公司的首席执行官是丹斯卡·傅,他曾担任Cognizant微软商业集团的首席问题官。
获得机器学习博士学位的CTO蒂姆·斯卡夫也曾在微软工作。
据LinkedIn介绍,该公司今年7月刚刚成立。
Nreal是一家合作的AR眼镜制造商,成立于2017年,创始人徐驰曾在Magic Leap工作。
参考链接: