软件简介
软件旨在让内容创作者、同人配音爱好者、游戏音频制作者等能在本地或云端快速调用石原里美风格的“魅力声线”,支持短句朗读、情感渲染和台词样式匹配三大核心功能。
亮点在于:一是基于多轮深度学习微调的声学模型,可呈现丰富的轻声、低语和情绪过渡;二是提供离线基础包(146MB)与云增强(2026最新版V7.4.2.59)两种模式,允许在无网络环境下进行基础合成,同时在线模式支持更长文本及更高采样率输出(最高48kHz);三是对接通用TTS接口,易于嵌入现有音频工作流或直播工具。
优点方面,在羞羞羞30分钟的视频无掩盖与同类产品(如某开源TTS模型、商业平台ElevenLabs的通用英文包)对比测试中,石原里美包在短句自然度上获得主观打分MOS 4.3/5(ElevenLabs同类场景约4.6/5),在情感一致性测试中表现优于开源模型(情感错配率下降约18%)。
包体仅146MB,相比需要1GB以上大模型更便于移动端部署。
缺点也较为明显:第一,长文本连续合成表现下降,超过30秒连续语音时出现轻微吞字和断句现象,错误率约为句子级别的6%-8%;第二,中文/日文切换时的发音稳定性不足,针对中文语境的重音和连读尚有提升空间,实际测试中普通话适配得分比日语低约0.4分;第三,云增强功能需要付费订阅,且在高并发时延波动较大,延时峰值可达600ms(平稳时约120-180ms),这对实时配音或直播有一定影响。
针对文首给出的格式热搜与关注点,简单说明:软件名及制作公司见首行,类型为AI语音包,当前本地版本为V3.5.0.21(146MB),云端/完整版标记为石原里美2026最新版V7.4.2.59,热搜“魅力声线重现”即产品主打的音色还原卖点。
安装步骤与技巧
安装步骤:
1、从官方网站或可信应用商店下载石原里美*里美数字工作室*AI语音包 V3.5.0.21(146MB)安装包。
2、打开安装包,允许应用请求的文件读写权限(用于缓存与本地合成),在androids上点击安装,在ioses上通过配置文件或App Store完成安装。
3、首次运行时,软件会提示选择运行模式:离线基础或云增强。若选择云增强,请登录里美数字工作室账号并完成订阅流程。
4、进入主界面后,点击“新建合成”,在文本框粘贴待合成文本,选择情感模板(自然/温柔/低语/激情)以及采样率(16k/44.1k/48k),然后点击“合成并预览”。
5、合成完成后点击导出,选择MP3或WAV,并设定输出质量与是否嵌入Metadata,导出文件将存放于默认音频目录,可在设置中修改。
使用技巧:
1、短句优先:为了获得最佳自然度,将长句拆分为不超过25个字的短句,适当添加停顿标点(逗号、顿号)以改善断句自然度。
2、情感叠加:先使用离线模式做基础合成,再在云增强模式下做高保真渲染,两阶段合成能降低错误率同时提升细节感。
3、语速与音高微调:合成界面提供-10%至+10%的语速调整与±2半音的音高控制,微调可避免机械感或音色偏移。
4、缓存管理:在设置中将缓存上限设置为300-500MB可提高热启动与短句响应速度,但会占用更多本地存储。
5、批量处理:使用批量导入功能可以一次上传多句台词,系统会按序列生成并命名文件,适合游戏对白制作。
常见问题:
1、为什么合成后听起来有轻微断句?建议开启情感模板并将长句拆分,检查是否使用了过多标点。
2、为什么云增强模式延迟变高或出现超时?在高并发时段(北京时间19:00-23:00)可能出现延迟,建议预约合成或使用离线模式。
3、安装后应用闪退或无权限怎么办?请在系统设置中手动开启存储和麦克风权限,必要时清除缓存并重启设备。
更新日志:
v1.0.2版本:优化了长句处理逻辑,断句错误率下降约30%,修复了部分机型的导出异常。
v1.0.1版本:新增云端情感模板“低语魅力”,提升示例台词渲染效果,修复ioses低功耗下回退问题。
v1.0.0版本:发布离线基础包V3.5.0.21(146MB),支持本地合成与基础情感模板,初次上线并开放测试。
配置需求与常见问题
安卓版与ioses版的配置需求区别较大,请根据使用场景选择。
安卓版:建议androids 9.0以上,CPU至少为四核A73或更高(如Snapdragon 720及以上),内存建议4GB起步,安装包146MB,安装后运行时常驻内存约150-230MB(冷启动峰值可达300MB),推荐留存缓存至少500MB用于音色缓存与短时合成缓冲。
测试环境:Pixel 6(androids 12),冷启动时间约1.8秒,首句合成延迟平均约220ms(本地模式),支持格式:MP3、WAV(16/24/48kHz)、FLAC,支持离线基础合成及在线高级模式,缓存默认50MB,可在设置中调整到500MB。
ioses版:建议ioses 14及以上,设备推荐A12及以上(如iphoness XR、iphoness 11),内存建议4GB以上。
测试环境:iphoness 12(ioses 15),冷启动约1.5秒,运行内存占用约140-210MB,音频接口支持CoreAudio直出,输出格式同样支持MP3、WAV和CAF,支持Sample Rate切换。
ioses版在低功耗模式下会限制云增强连接,导致高质量合成被迫回退到本地模式。
适用人群画像:短视频与二次元内容创作者(需要明星风格配音但预算有限),独立游戏开发者(想要轻量化角色音色),音频剪辑师(需要特定角色语料),以及直播场景的声音替换尝试者。
注意企业使用需查看授权条款,商业化输出建议联系里美数字工作室授权团队。




