“潭柘智空”大模型,解锁视听产业AI新可能
2025-10-09 18:47 来源:  北京号
关注

为深入贯彻落实“人工智能+”行动部署,北京市发展改革委已在多个关键领域布局建设示范标杆场景,持续推动人工智能技术赋能实体经济融合发展。在“AI+广电传媒”领域,重点支持门头沟区依托京西智谷国产算力底座和央视网超高清视听领域海量音视频数据资源,打造“潭柘智空”文生视频大模型及AI数字人应用创新平台。

近日,“潭柘智空”文生视频大模型阶段性成果亮相发布。作为北京市发展改革委支持的首个“AI+广电传媒”领域示范标杆场景,该模型以“千亿参数+时代语料”为双轮驱动,打造覆盖产业链、内容链、技术链与安全链的综合生态,已具备连续15秒4K/60帧超高清视频生成等行业领先能力,可灵活支撑自然风景、科幻场景等多类型创作,为内容生产提供有力支撑,助力影视特效、AI短剧等新业态的培育,成为人工智能与视听产业深度融合的生动实践。日前,“潭柘智空”文生视频大模型在第四届广播电视和网络视听智能应用创新大赛中荣获全国三等奖。

“潭柘智空”文生视频大模型有哪些硬核本领?发改君带你揭秘核心功能↓

“潭柘智空”文生视频大模型通过构建“创意生成—跨域传播—智能交互”全链路能力,创新视听体验。目前已实现多种功能:

AI创作生图功能

具备高语义对齐能力,通过内置海量生图模板和提示词资源,支持生成多风格、多比例高清图片,精准满足广电内容制作、文旅场景等领域初期创意可视化需求。

视频生成功能

提供文生视频、图生视频等多种创作模式,可输出4K/60帧超高清内容,并支持视频无限续写。基于中文语料训练的底层优势,该模型能够更好地理解内容文化内涵,更加契合中文场景下的创作需求。

多语言翻译功能

支持全球100多种语言快速翻译与交互,实现多种语言场景下的连续对话、翻译、搜索等功能,为国际传播和跨文化合作搭建坚实技术桥梁。

其中,特色打造汉藏双语模块,填补藏语智能处理空白,支持汉藏双语多轮连续对话、实时翻译、文档识别、图像转换等功能,树立多民族语言AI落地标杆。

AI数字人形象制作与直播管理功能

“一站式”整合数字人创建、视频生成与直播三大核心创作能力,支持通过少量真人资料快速克隆数字分身,结合大模型知识库,轻松实现视频播报、直播互动等应用,让交互更具情感与效率。

智能剪辑与风格化转化功能

可自动识别视频内容,完成智能切片、打标与剪辑,并提供国风、卡通等多元风格化处理,大幅降低专业视频制作门槛。

智慧媒体资产管理系统

汇聚央视网海量高质量视听数据资源和内容编目数据,实现内容快速检索与精准定位。同时,依托央视网审核经验,打造智能审核系统,有效识别并拦截多种违规不良信息,保障内容生产的安全与质量,构建健康可靠的内容生态。

发改君还了解到,“潭柘智空”大模型首个应用案例——《山河家书》系列短片同步上线,展示了大模型在历史影像还原方面的强大能力。此外,还与金鸡奖导演开展合作,利用“潭柘智空”大模型为影视剧生成大量特效镜头,探索国产大模型在影视工业化中的应用。

聚焦“人工智能+”落地,以新业态树产业标杆。未来,北京将布局更多技术与产业深度融合项目,构建协同发展生态,将“人工智能+”蓝图转化为实体经济高质量发展的强劲动能。


作者:

发展北京


打开APP阅读全文
特别声明:本文为北京日报新媒体平台“北京号”作者上传并发布,仅代表作者观点,北京日报仅提供信息发布平台。未经许可,不得转载。