平安科技申请情感语音合成专利,能在无专业音频素材或情感标注下获得高度情感表达力的语音输出
金融界 2025 年 4 月 2 日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“情感语音合成方法、装置、计算机设备及可读存储介质”的专利,公开号 CN 119741911 A,申请日期为 2025 年 1 月。
专利摘要显示,本发明涉及人工智能及语音合成技术领域,公开了一种情感语音合成方法、装置、计算机设备及可读存储介质,包括:获取待进行语音合成的目标文本,识别所述目标文本的情感向量表示;对所述情感向量表示进行情感风格预测,得到情感风格权重;基于预训练的声学模型,确定所述目标文本的音素嵌入序列,以及控制所述声学模型采用所述情感风格权重对所述音素嵌入序列进行调整,以使所述声学模型利用调整后的所述音素嵌入序列生成所述目标文本的情感语音。即使在没有专业音频素材或情感标注的情况下,也能获得具有高度情感表达力的语音输出,提升了模型的泛化能力。
天眼查资料显示,平安科技(深圳)有限公司,成立于2008年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本531031.58万人民币,实缴资本531031.58万人民币。通过天眼查大数据分析,平安科技(深圳)有限公司共对外投资了4家企业,参与招投标项目279次,财产线索方面有商标信息76条,专利信息5000条,此外企业还拥有行政许可19个。
本文源自:金融界
作者:情报员