首  页 > 新闻动态 > 行业新闻 > 语音识别中的性别平等固有挑战
产品分类
face recognition temperature(3)
新品到货(26)
热门产品(12)
指纹扫描仪(22)
手持机系列(14)
POS终端(5)
考勤系列(14)
门禁系列(6)
Personal Security Protection(4)
Sales Promotion(35)
门锁系列(11)
摄像机系列(11)
Explosion Models
联系我们
电话:+ 86-23-67305242:
手机:+ 86-13667681778
电子邮件:info@hfcctv.com
网址:http://www.hfteco.com/
Facebook:汇帆科技
Youtube:汇帆科技
联系我们

新闻动态

语音识别中的性别平等固有挑战

voice-biometrics-large1
根据AI语音识别创始人R7 Speech Sciences的联合创始人Delip Rao的说法,语音识别技术在应用于女性时比男性更不准确,部分原因是由于语音系统的设计,而且还因为固有的生理差异。
来自男性和女性讲话者的语音样本的差分错误率使得训练AI系统识别同样困难的Rao写入,并且这个问题通常由诸如MFCC(Mel频率倒谱系数)的常用技术加剧。
平均基频或平均F0与男性感知有关,通常男性为120Hz左右,女性为200Hz左右,也可以依赖种族,吸烟,疾病等因素。拉奥还指出,平均F0中的性别概念仅限于青春期时的生物性别。
他写道:“设计时没有考虑到这个问题的程度的语音系统会使已经非常困难的问题变得更糟。 “幸运的是,利用最近的语音深度模型,我们可以构建模型,直接从原始波形中学习,投射大量数据并进行计算,并希望模型具有足够的容量来可靠编码特定于类别的变体。这是吸引人的,但也比那些一直推出新技术的小型创业公司更受青睐。但是有足够的想法,许多这些过度配置的深层模型可能会被更简单的深层模型所取代。“
Kaggle数据准备分析师Rachael Tatman告诉The Registerthat表示,虽然MFCC对女性言语建模的本质不是那么低效,“女性的听觉信号稍差,它更容易被噪音掩盖,如粉丝或背景中的交通,这使得语音识别系统更难。这会影响你用于声学建模的任何东西,这就是MFCC的用途。“
Rao认为,随着像苹果Siri这样的语音激活数字助理的日益普及,应该寻求女性言语研究者关于生产语音模型的意见,以及如何改进它们。
面部识别系统已被证明对女性和肤色较暗的人表现较不准确,导致国会小组委员会为指导政府应用AI而考虑到这个问题。