当前位置 > 首页 >>资讯 >>科技 >>智启山海,交互无界——云知声山海·知音 2.0 重磅发布
智启山海,交互无界——云知声山海·知音 2.0 重磅发布
随着智能体时代到来,云知声在“山海·Atlas”通用智算基座持续演进基础上,年前实现了“山海·知医”5.0医疗大模型升级,今天迎来了“山海·知音”2.0的重磅发布,正在完成“一基两翼”技术战略升级的能力拼图。
“山海·知音”大模型 2.0——依托“山海·Atlas”的多模态、跨语言基座能力,让“山海·知医”等垂直专业智能体,惠及千家万户——听懂专业与乡音、聊出亲情与温度、极致机敏反应,是本次升级的三大能力进化。
01 听懂专业与乡音——ASR全景升级
此次模型ASR能力在公开测试集和自有全场景测试集中,均显现了领先的语音识别能力,在评测中实现了从通用到极端全面的领先水平,超过了国内主流的开源和闭源语音大模型,达到业界最高水平。特别是在高难度的复杂噪音与方言口音场景下,相比主流ASR模型性能提升了2.5%至3.6%,在复杂背景音环境下识别准确率更是在业内首次突破90%。

公开测试集

自有测试集
真实的语音识别环境中,还经常会面临专业术语识别不清、逻辑混乱等挑战。作为此次升级中最大的亮点,即模型“能够听得懂专业话”,它可结合上下文和行业术语,听懂专业场景中的每一个术语与指令,识别精度提升 30%。“它不是在‘听字’,而是在‘理解事’”。
例如在汽车4S店试驾场景中,当销售提及“方向盘”相关描述时,即使上下文未明确出现“半幅方向盘”,模型仍能通过逻辑推理准确识别。
而在严肃的医疗场景,模型能显式注入“依帕司他”“二甲双胍”等术语进行定向增强,确保识别结果更精准。
同时,模型支持30余种中文方言及14种国际语言的识别转写,无论是晦涩的粤语、闽南语、上海话,还是英、日、韩、法、德、泰等国际语言,均能实现精准转写。更进一步,模型还能融合讲义等视觉语义,构建“视听融合”闭环交互,进一步提升识别结果。
02 聊出亲情与温度——TTS声动进化
如果说ASR能力是“耳朵”,那么TTS能力便是“嘴巴”。山海·知音-TTS以“高度拟人+创意多元”为核心,让语音合成兼具真实感与创造力,使科技更有温度。
它目前支持12种方言(粤语、四川话、上海话全拿下)+ 10种外语,清嗓、笑声、呼吸声都自然还原,甚至能切换 12种普通话风格,温柔、干练、亲切随你选。“科技不该高高在上,而该用你最舒服的方式说话。”
目前模型已支持粤语、四川话、上海话等12种方言,以及日语、韩语、泰语等10种外语。可实现跨方言、跨语种、跨情感的组合生成,针对小语种的语音韵律也进行了专项优化——如日语的“促音”、泰语的“声调变化”,合成自然度接近母语使用者。
此外,还支持一句话声音复刻以及播客级长文本合成,赋能有声内容创作与互动娱乐。
基于大模型的语音合成通常采用流匹配(Flow Matching)将大语言模型预测的语音Token转换为梅尔谱,再通过神经声码器(Neural Vocoder)重建为最终语音。但该方案普遍存在延迟较高的问题。业界常通过流匹配分段处理来降低延迟,但效果有限,且容易牺牲音质。
为实现真正高质量、低延迟的流式语音生成,云知声创新性地设计了基于纯因果注意力机制的流匹配模块,并与神经声码器进行联合优化,构建出端到端的纯流式推理架构。该方案在不损失合成质量的前提下,显著降低系统延迟——在低并发场景下,首包延迟已压缩至90毫秒以内,达到业界领先的实时交互水平。

因果注意力机制
03 极致机敏反应——端到端全双工交互
真正的智能交互,在于“理解语境、感受情绪、自然回应”。端到端模型实现流畅全双工面临的核心挑战是:需在流式收声时同步完成理解、决策与生成,并在任意打断瞬间保持对话状态连贯。山海·知音2.0基于端到端交互大脑攻克了这一难题,将全双工能力提升至新高度。
支持随时打断、即时接话、连贯追问,就像和一个真正聪明的朋友聊天,行云流水,毫无卡顿。“这不是问答,是对话。”
背后是谁在支撑这一切?
答案是云知声独创的 “山海·Atlas”智算一体基座,将通用多模态大模型底座与Atlas基础架构深度整合,既是专业智能体的基础,也是感知AI中枢的根基——将传统的ASR、TTS和全双工能力,有效整合到端到端大模型中,做到传统模块级联无法实现的极致交互体验和效率。
智起山海,知音万物
从手术室到乡间小路,从驾驶舱到老人床头,
云知声相信:真正的智能,不是炫技,而是融入生活。
山海·知音 2.0,
相关文章更多资讯 >>
- ·高通获颁“2024新消费创新案例”,5G-A推动数字消费高质量发展11-08
- ·2024IKCEST国际大数据竞赛在西安交大收官12-10
- ·品牌天猫双11大爆发,阿里妈妈助力尊乐、FANCL等商家人货精准布局,锁定全店生意新增量!11-04
- ·系统级"AI+服务",右滑就玩,快来参与负一屏「鸿运马上来」02-22
- ·1688会员产品“实力商家”全面升级:能力极致表达,爆款轻松孵化,生意更确定06-08
- ·千万曲库沉浸唱:鸿蒙版云视听全民K歌全新升级,重塑大屏在线K歌体验10-13
- ·三思×开源鸿蒙战略签约,开启千行百业数智化国产化共建之路10-17
- ·世界读书日,飞天云动联合南京文投共同发布“文枢元宇宙”生态平台!04-25
- ·老派?新派?我要做“青年一派”!09-29
- ·双11为用户创新!央视直播海尔领先的原创科技11-01
行业要闻更多>>
消费要闻更多>>
- ·深入贯彻职代会精神 奋进“百年成达”发展新征程
- ·续写绿茵情缘,焕新主场体验!华润万家旗下苏果超市成为2026“苏超”南京赛区赞助商
- ·郭广昌的“舍得”,与舍得的“复兴”
- ·全友家居设计丨125㎡宋式美学,极致的东方韵味!
- ·从全国最大高速展,看科华如何助力高速充电网络提质升级
- ·声声快板燃青春朝气蓬勃展风采 ——中国化学工程成达新员工快板献礼2026“开门红”
- ·达仁堂亮相跨国企业圆桌会 以中医药智慧书写全球健康新答卷
- ·勇担进口替代使命 坚守实业强国初心 边锋机械铸就中国隔膜泵民族品牌标杆
- ·全友家居丨122㎡原木奶油风,实现人宠共居,温暖治愈
- ·0扣点、最高激励10万!京东生鲜2026年新商扶持计划发布,助力商家“稳增长”
金融要闻
- 中水物资电气及火电事业部助力大唐郓城项目1号锅炉顺利点火
- 鸿蒙版微信读书新增书架分类、导入PDF文件等功能,陪你假期沉浸式阅读
- 匠心筑家 载誉前行|上海圣都整装荣膺上海住宅装饰企业服务能力五星级企业
- AI 赋能提质增效,盈康生命 2025 年费用率下降 1.2 个百分点
- 推动城市更新!九牧“省心焕家中国行”广州站正式启动!
- 技嘉京东自营购指定产品赢《生化危机9》或《银河破裂者》游戏码
- 巡检快、处置准 七腾机器人携创新解决方案亮相北京石油展
- 双展双赢!CMES华机展|上海国际机床展与上海国际工业自动化及机器人展圆满落幕
- 全友家居案例丨129㎡简约风,客餐厅+书房一体好敞亮!
- 超级码云RFID解决方案:以智能识别技术重塑仓储物流行业新生态
证券要闻
- 银企携手共拓海外市场
- 申万宏源发布2025年年度业绩——乘势而上 笃行致远
- 临榆炸鸡腿蝉联“炸鸡十大品牌”:全国签约门店突破6000家,高质量发展领跑中式炸鸡赛道
- 聚势谋远,智启新章:2026中粮餐饮供应链生态共创大会聚势启新
- 烹饪新星技耀南粤,李锦记希望厨师斩获中餐、西餐双项桂冠
- “慧相链,欣价值——慧择控股·齐欣云服走进保司系列活动”第二站游学中英人寿深圳前海高客中心,共研分红保险生态升级
- 抖音宝藏生活家年度盛典收官,解锁日化行业“以心换量”增长密码
- 中国化学工程成达公司基层党支部开展“四新”大讨论
- 百年传承 源乳新生 Hero金钻Pedialac+5HMOs新品发布会重庆圆满举办
- 追觅AURORA启动“AURORA高校先锋共振计划” 首站落地清华大学

