科创中心“核”动力|得意音通:用声音“解锁”更智能的生活
2023-06-28 21:19 来源:  北京号
关注

在生活中,语音识别技术的用途已经很广泛,比如智能家居产品、汽车导航等。在语音识别技术愈加成熟的同时,声纹识别技术也获得更多关注。声纹识别是生物识别技术的一种,也称为说话人识别,是一种通过声音判别说话人身份的技术。

近日,记者走进来到北京得意音通技术有限责任公司,了解这家聚焦声纹识别技术的企业,是如何将这项技术应用在日常生活中的。

据清华大学人工智能研究院听觉智能研究中心主任、得意音通创始人郑方介绍:“声纹识别在生物识别分类里,属于行为特征,相对于静态的生物特征,比如指纹、人脸、虹膜等这些基本不变的特征,声纹识别有一个特别之处,在于它需要跟语音有结合,所以往往声纹是蕴含在整个语音当中的。在这种情况下,声纹就会有一些更多的、更丰富的分类。一般的生物特征讲有辨认和确认,对声纹来讲就有文本相关、文本无关、文本提示等,我们得意音通做的就是基于动态码的声纹识别,属于文本提示的声纹确认。”

声纹识别与其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,除具有不会遗失和忘记、不需记忆、使用方便等优点外,由于不涉及敏感特征信息,隐私程度低,用户接受度高,利用语音进行身份识别可能是最自然和最经济的方法。

郑方说:“清华大学和得意音通有联合实验室,清华也是知识产权入股得意音通,有了核心的国际领先的自主可控的算法之后,得意音通进行了产品的进一步开发。”

得意音通主导起草了截至目前声纹识别领域所有的国家和行业标准,包括颁布于2008年的中国第一个声纹技术应用标准,并推动了声纹识别产业化进程。公司以自主可控、国际领先的“声纹+”可信身份认证技术体系为核心,深度融合源自清华大学的声纹识别、语音识别、语义理解、情感识别、面部识别、声学感知、声音诊断等技术。

“我们针对不同的场景,把一些需要攻关的核心技术,做了长期积累和提前布局,比如说‘声密保’,它面向的场景是做身份确认,也就是可信身份认证,它的要求第一个就是准确性和唯一性。同时,在无监督情况下的身份认证,它还需要有抗伪造,抗攻击的能力。在有人监督情况的认证场合,还要看是否是这个人的真实意愿,就是他是否知情,是否同意。”郑方解释说。

随着声纹识别技术日益成熟,已被广泛应用到各个领域,比如信息、公共安全、金融、智能安防等。得意音通的“声纹+”身份认证SAAS服务首先成功应用于中国建设银行手机银行,并以“零事故”和“零投诉”通过数亿次验证。

与此同时,作为身份验证手段,声纹识别技术正加速应用于高级智能安防设备中,很多高级智能安防设备已经搭载了声纹识别系统,部分高级智能门禁、智能识别系统也已实现应用。

据了解,得意音通自用的声纹+人脸识别的智能终端产品——声颜通,其内核技术就是“声密保”,即动态声纹密码。“声密保”产品是以“基于动态密码语音的身份确认系统及方法”专利技术为核心的远程声纹认证产品,该专利技术方案将动态密码语音内容认证与请求人语音身份认证两者相结合,实现了对用户身份的双重验证。在此基础上又加入了“防时变”、“防录音攻击”、真实意图检测等技术,有效提高了远程身份认证的准确性、安全性和可靠性。

得意音通核心算法部语音算法工程师李志攀告诉记者:“我们在做防攻击系统的时候,采集了大量说话人的原始语音和重放语音,去进行比对,然后用我们目前最先进的人工智能深度学习方法,训练了一个防攻击模型,就可以有效提取出这个攻击语音和原始语音之间的深度特征以及其中的差异,分辨出来二者之间的区别。”

“基于动态密码语音的无监督身份认证系统(声密保)”于2018年5月被中国电子学会组织的科技成果鉴定评价为“整体处于国际领先水平”,2021年8月该系统及其应用再次通过中国电子学会科技成果鉴定被评价为 “技术与应用达到国际领先水平”。

随着“声纹+”技术成果的创新融合,人们只需要直接说一句话,就可以完成身份验证及功能实现,对于帮助老年人、视障人群等特殊群体跨越“数字鸿沟”、打造信息无障碍体系具有重要意义。

海淀企业加油!

《科创中心“核”动力》挺你!

《科创中心“核”动力》

指导单位:北京市海淀区人民政府

出品单位:北京市海淀区融媒体中心

本期视频《得意音通:致力于成为远程可信身份认证领导者》

出品人:佟志伟

总策划:张庆洁

总编导:卫东

总监制:张东旭

监制:范杰 杨凯博

统筹:韩娟娟

编导:谢春阳

主持人:龚可涵

摄像:高子旗

配音:龚可涵

本期推文

记者:谢春阳 编辑:陈乃禾


作者:

北京海淀官方发布


打开APP阅读全文
特别声明:本文为北京日报新媒体平台“北京号”作者上传并发布,仅代表作者观点,北京日报仅提供信息发布平台。未经许可,不得转载。