一等奖裁判文书|北京互联网法官赵瑞罡:自然人声音权益保护及于经人工智能技术处理的声音
2026-02-14 20:59 来源:  北京号
关注

为加强和规范裁判文书释法说理,促进法律适用统一,助推北京法院审判工作高质量发展,北京法院组织开展了第十一届优秀裁判文书评选工作。经过初评、复评、总评三个阶段的评审,共评选出获奖裁判文书100篇,其中一等奖10篇、二等奖20篇、三等奖30篇、优秀奖40篇。

今日展示的一等奖裁判文书是

殷某某与北京某智能科技公司等人格权纠纷案

承办人是北京互联网法院赵瑞罡法官

民法典人格权编首次以立法形式保护声音权益,明确参照适用肖像权的规则保护自然人的声音,是立法对技术发展的前瞻性回应,体现了对人格权益的全面尊重和保护。在裁判文书撰写过程中,要妥善审理好新类型、新业态、新技术案件,必须把握好裁判文书和案件事实的关系,以及裁判文书说理和情、理、法的关系,才能有效做到裁判树规则、促治理、助发展。

——北京互联网法院

赵瑞罡

裁判文书回顾

文书名称:殷某某与北京某智能科技公司等人格权纠纷案

案 号:(2023)京0491民初12142号

审理法院:北京互联网法院

承办法官:赵瑞罡

案件类型:民事

基 本 案 情

原告殷某某是一名配音演员,发现他人利用其配音制作的作品在多个知名APP广泛流传。经溯源,上述作品中的声音来自于被告一北京某智能科技公司运营的平台中的文本转语音产品,用户通过输入文本、调整参数,可实现文本转化成语音的功能。原告曾接受被告二北京某文化传媒公司的委托录制录音制品,被告二为录音制品的著作权人。后被告二将原告为其录制的录音制品的音频提供给被告三某软件公司,允许被告三以商业或非商业的用途使用、复制、修改数据用于其产品及服务。被告三仅以原告录制的录音制品作为素材进行AI化处理,生成了涉案文本转语音产品并在被告四上海某网络科技公司运营的云服务平台对外出售。被告一北京某智能科技公司与被告五北京某科技发展公司签订在线服务买卖合同,由被告五向被告三下单采购,其中包括了涉案文本转语音产品。被告一北京某智能科技公司采取应用程序接口形式,在未经技术处理的情况下,直接调取并生成文本转语音产品在其平台中使用。殷某某诉至法院,请求判令被告一北京某智能科技公司、被告三某软件公司立即停止侵权、赔礼道歉,五被告应当赔偿殷某经济损失和精神损失。

精 彩 段 落

原告声音权益是否及于案涉AI声音。《民法典》第一千零二十三条第二款规定:“对自然人声音的保护,参照适用肖像权保护的有关规定。”肖像是通过影像、雕塑、绘画等方式在一定载体上所反映的特定自然人可以被识别的外部形象。自然人声音是由声带振动产生的机械波,以声纹、音色、频率为区分,具有独特性、唯一性、稳定性特点,能够给他人形成或引起一般人产生与该自然人有关的思想或感情活动,可以对外展示个人的行为和身份。声音与肖像均是以具有可识别性作为法律保护的前提条件,相较于肖像,声音具备无形性、不可视的特征,其识别性相对较弱,一般建立在反复多次或长期聆听特定声音的基础上,他人才能通过该声音特征识别出特定自然人。对于从事配音等特定职业的自然人,若一定范围内的听众能够将声音与该特定自然人建立一一对应关系,则可认定该声音具备识别性。

自然人的声音经人工智能技术处理后,是否落入自然人声音权益保护范围,关键在于通过该声音是否仍能识别出该特定自然人。本院认为,对于人工智能技术处理后的声音,只要一般社会公众或者一定范围内的公众根据音色、语调和发音风格,能够识别出特定自然人,则该自然人声音权益可及于该AI声音。具体到本案中,某软件公司仅使用了原告一人的声音开发案涉文本转语音产品,且经庭审中进行文本转语音操作,生成的AI声音与原告的音色、语调、发音风格等具有高度一致性。综上,可以认定,一定范围内的听众能够将案涉AI声音与原告本人建立一一对应的联系,因此,原告的声音权益及于案涉AI声音。

专 家 点 评

刘燕,北京大学法学院教授、博士生导师。

兼任中国财富管理五十人论坛(CWM50)学术成员,上海国家会计学院注册会计师创新发展中心学术顾问(2021-2026),北京市高级人民法院及上海金融法院等咨询专家,中国注册会计师协会法律援助与维权委员会委员,中国证券投资基金业协会法制与自律监察委员会委员,北京国际仲裁中心及深圳国际仲裁院仲裁员、上市公司独立董事。

主要从事法律与会计交叉研究,出版《公司财务的法律规制——路径探寻》《会计师民事责任研究——公众利益与职业利益的平衡》《会计法》等著作,并参与《合伙企业法》《公司法》《保险法》《注册会计师法》等多项法律的修订工作。

本案较为清晰地展现了自然人声音经人工智能处理形成智能文化服务产品,继而服务于文化艺术市场的全过程。法院准确理解适用相关法律法规,充分保护自然人的声音权益,通过本案明确了声音亦属于自然人的标识之一,体现着自然人人格尊严,包含着一定的经济价值,在使用他人声音时应当负担较高的注意义务,否则,在无合法理由的情况下擅自使用他人声音构成侵权。我们也应看到,声音权益的保护将不断受到新技术发展所带来的挑战,如何在声音权益与其他权益交织的复杂情形下平衡声音权益的利用与保护,还需要在实践中不断加强研究。

法 官 感 言

赵瑞罡,北京知识产权法院审判委员会专职委员,曾在二中院、市高院、互联网法院任职,获评北京市审判业务专家、北京法院司法实务研究专家等荣誉称号。先后参与“民事诉讼程序繁简分流改革试点跟踪研究”“加强司法公信力建设”“生成式人工智能发展的司法应对”等国家社科基金项目、全国法院重点调研课题等11项。出版专著《司法改革背景下合议制度研究》、合著《侵犯知识产权犯罪司法适用》《涉众型经济犯罪剖析与治理》《刑法学原理与案例教程》等,在《政治与法律》《法学杂志》《行政法研究》《法学论坛》《法律适用》等刊物发表论文20余篇。

习近平总书记强调:“要加强人工智能发展的潜在风险研判和防范,维护人民利益和国家安全,确保人工智能安全、可靠、可控。”实践中,声音被收集、合成、制作、模仿甚至篡改的现象较为普遍,这对声音权益的保护提出挑战。随着网络、人工智能等信息技术快速发展,声音作为人格权益予以保护显得更加必要。民法典人格权编首次以立法形式保护声音权益,明确参照适用肖像权的规则保护自然人的声音,是立法对技术发展的前瞻性回应,体现了对人格权益的全面尊重和保护。在裁判文书撰写过程中,要妥善审理好新类型、新业态、新技术案件,必须把握好两层关系才能有效做到裁判树规则、促治理、助发展:

一是必须把握好裁判文书和案件事实的关系,案件事实是裁判文书的制作“地基”。本案案情较为复杂,涉及AI声音产品产业链上游供应商、中间经销商以及下游购买商,相对应的责任划分亦有所不同。为推动相关产业规范发展,聚焦案件关键性事实,在裁判文书中详细还原了自然人声音通过人工智能技术转化为智能文化服务产品,并进一步融入文化艺术市场的完整流程,并清晰划分各方责任,有助于规范行业健康发展。

二是必须把握好裁判文书说理和情、理、法的关系,本案系全国首例“AI生成声音侵权案”,对于激活民法典具体条款的生命力具有重要意义。面对“经人工智能技术处理后的声音是否受声音权益保护”这一争议焦点,在裁判文书撰写过程中,从声音权益“可识别性”这一核心特征出发,明确对于人工智能技术处理后的声音,一般社会公众或者一定范围内的公众根据音色、语调和发音风格,能够识别出特定自然人的,则该声音属于自然人声音权益的保护范围。未经自然人许可使用经人工智能技术处理的声音,构成对自然人声音权益的侵权。这既是对自然人声音独特人格价值的尊重,也为新业态、新技术的应用划定了行为界限,有助于规范和引导人工智能技术沿着为民、向善的方向发展。


作者:

京法网事


打开APP阅读全文
特别声明:本文为北京日报新媒体平台“北京号”作者上传并发布,仅代表作者观点,北京日报仅提供信息发布平台。未经许可,不得转载。