AR眼镜语音转文字实测,效果像开了弹幕,对话记录可保存回溯

时间:2022-12-26       来源: IT之家       阅读量:12463   

AR眼镜字幕效果如何。

实测来了!

不仅可以将语音实时转换成文字,还可以区分说话人的主体,甚至可以保存文字记录,以备日后追查。

今年,一家来自英国的ar初创公司开了脑洞。

他们把语音转文字功能搬到了AR眼镜上,让改进后的文字可以快速直接地呈现给人们。

主要目的是为听障人士服务。

毕竟在很多情况下,即使有了助听器的帮助,听障人士仍然需要文字作为参考信息。

借助AR眼镜,字幕可以直接呈现在人们眼前,接收信息更加方便快捷。

具体效果如何。往下看~

有一种打开弹幕的感觉。

体验的效果大概如下左图所示会出现一个对话框,在这个对话框中会标注说话人和对应的语音内容

体验者西蒙·希利表示,当你刚戴上AR眼镜听对方说话时,它的转录准确度非常好。

效果有点像实时语音转文字的常用功能在语音结束之前,文本内容会一直调整最后,一段写完就会有最终版本

但是在对话的情况下,如果两个人聊一会儿,语音转写的速度会慢一些。

XRAI内部人士表示,这是因为语音转文本的计算是在云端进行的,有延迟是正常的。

而且不仅仅是实时转录该功能还支持搜索历史记录,在AR眼镜和手机上都可以搜索到感觉有点像聊天软件

录制的语音会在文字转录后立即删除XRAI还强调,这些文字只有用户自己才看得见

如果没有AR眼镜,也可以在手机上体验XRAI的功能。

也有网友戴着眼镜体验了一下,表示这个功能在语音转换的速度上还是很快的,在AR界面的呈现也不错。

缺点是需要选择要识别的语言类型在这里,她正在测试法语

除此之外,西蒙大哥也在自己的经历中发现了一些小问题。

例如,根据XRAI的设想,听障人士需要一副AR眼镜+一部Android手机才能使用该功能。

是的,该应用程序还不支持iOS。

两个设备加起来握起来很麻烦,尤其是AR眼镜的重量还没降下来听障人士要戴人工耳蜗和一副ar眼镜,舒适度肯定不高

西蒙说:

我无法想象如何带他们一整天。

以及语音对文字的影响,西蒙也提出了一些问题他说,对于听障人士来说,需要文字作为参考信息的场景很可能是嘈杂的地方,这对语音识别的算法提出了一定的要求

在体验XRAI的功能时,公司的CMO特意带他去了一个相对安静的环境演示,并承认在嘈杂的环境下效果不是很好。

以及价格方面,XRAI的AR眼镜为Nreal,国内售价2299元,海外售价379美元。

XRAI的服务也不是完全免费的基本免费版只能保存一天的通话记录,还有20美元/月和50美元/月两种套餐可供选择

如果选择50美元/月套餐,还会在基本功能上增加一个人工智能助手。

但西蒙表示,作为一个仍处于初级阶段的产品,存在可以理解的缺点。

更重要的是,令人欣慰的是,他们想从无障碍的角度帮助听障人士。

XRAI玻璃公司背后

提供这项服务的公司来自英国,名字叫XRAI Glass。

该公司的首席执行官是丹斯卡·傅,他曾担任Cognizant微软商业集团的首席问题官。

获得机器学习博士学位的CTO蒂姆·斯卡夫也曾在微软工作。

据LinkedIn介绍,该公司今年7月刚刚成立。

Nreal是一家合作的AR眼镜制造商,成立于2017年,创始人徐驰曾在Magic Leap工作。

参考链接:

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。