从模型体验到开发训练,本文将演示如何通过modelscope魔搭体验达摩院预训练模型,并手把手演示定制一款语音合成模型的训练过程。
目前达摩院语音实验室在ModelScope魔搭社区已经上线了13个语音合成模型,其中男女声发音人模型各4个,多发音人模型5个,整体MOS评分在4.5分左右,达到了接近真实录音的水平,模型支持中文、英式英文、美式英文、中英混这几类语言,适用于朗读、视频配音等多种场景。
🌟定制步骤🌟
Step 0. 登陆ModelScope账号☝,未登陆无法使用定制功能
Step 1. 录制音频🎤,点击下方音频录制并朗读左上角文字, 请至少录制10句话
Step 2. 点击 [开始训练] ⏳,启动模型训练,等待约10分钟
Step 3. 切换至 [模型体验] 🔊,选择训练好的模型,感受效果
💡友情提示💡
😋 已支持英文合成
💬 朗读时请保持语速、情感一致
🔇 尽量保持周围环境安静,避免噪音干扰
🎧 建议佩戴耳机,以获得更好的录制效果
数据统计
数据评估
关于ModelScope特别声明
本站TKTOC运营导航提供的ModelScope都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由TKTOC运营导航实际控制,在2023年9月16日 下午7:05收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,TKTOC运营导航不承担任何责任。