找了好久终于找到的一款超好用的文本转语音合成软件
本帖最后由 gennc 于 2025-8-6 13:22 编辑可以将文本内容合成为Mp3音频,拥有中文普通话和粤语、台湾话、东北话等12种语音选择,并有50多种外语语音可选,还可以调节语速/音调/音量那些抖音、小视频、小说的音频全是这样做出来的挺好用的,有兴趣的小伙伴们可以下载使用
OmniSpeaker全能语音生成器专业版https://lestore.lenovo.com/detail/L120116
《字语千音》全能语音生成器个人版https://lestore.lenovo.com/detail/L120117
百度网盘下载地址
https://pan.baidu.com/s/1VLB-SKLESJIu-syjArZBrA?pwd=e2j7提取码:e2j7
:):):) 2个版本 的基本功能是一样的,只是外观有所区别
专业版的页面布局更紧凑
个人版的使用更方便 gennc 发表于 2025-8-4 18:14
可以将文本内容合成为Mp3音频,拥有中文普通话和粤语、台湾话、东北话等12种语音选择,并有50多种外语语音 ...
老哥有没有 语音转文字 的软件? 会议记录用的那种 radio777 发表于 2025-8-5 10:45
老哥有没有 语音转文字 的软件? 会议记录用的那种
你说的这个功能用微信的语音转文字可以实现,所以暂时没有做。
不过你要有特殊的要求可以讲一下,都不难。
比如:
详细的要求是什么?
有什么特殊的功能要求?
比如精度,时长,等等 gennc 发表于 2025-8-5 10:51
你说的这个功能用微信的语音转文字可以实现,所以暂时没有做。
不过你要有特殊的要求可以讲一下,都不难 ...
有很多现成的软件,就是用起来转换的不够准确。 radio777 发表于 2025-8-5 10:45
老哥有没有 语音转文字 的软件? 会议记录用的那种
推荐飞书妙记 豆粕苍穹 发表于 2025-8-5 15:39
推荐飞书妙记
谢谢,我搞了个讯飞的API,已经在用了 收藏^g^ 本帖最后由 gennc 于 2025-8-6 13:30 编辑
语音转文本的已经开发出来了
正在测试中...
语音转文本的需要处理方言/口音,背景,对话,专业术语,还有同音不同意的发音问题
这个需要的电脑 硬件 要求较高,
要达到较高准确度,需要配置专业Cuda加速器,
需RTX4090或专业大显存24G以上高算力显卡,不然准确度达不到
有需要的吗? 试用了下,总体还可以,但阅读时断句和停顿过度这些东西听起来不太完美的样子。 xb78 发表于 2025-8-7 11:11
试用了下,总体还可以,但阅读时断句和停顿过度这些东西听起来不太完美的样子。 ...
把原始文本中的空格,多余字符,以及标点符号 处理准确,删除掉多余的影响发音的多余空格,换行,以及像*&@#¥%~《》?“:}|等不可发音的字符。如果是停顿感,可能原始文本中有多余空格符。 复制进去的文字,最前面的三四个字不会转换成语音。
我说的停顿的意思是转换出来的语音,句号和逗号以及段落间的间隔基本上没区别,要是长短有区别就好了。
谢谢热心回复! 本帖最后由 gennc 于 2025-8-7 15:50 编辑
xb78 发表于 2025-8-7 15:02
复制进去的文字,最前面的三四个字不会转换成语音。
我说的停顿的意思是转换出来的语音,句号和逗号以及段 ...
明白,你说的是需要有语气,
以及语音发音语气能实现情绪的表现
这个在下一版本中会出现,
会加上 惊喜,吃惊,愤怒,这些可以调整的改变发音情绪的参数
xb78 发表于 2025-8-7 15:02
复制进去的文字,最前面的三四个字不会转换成语音。
我说的停顿的意思是转换出来的语音,句号和逗号以及段 ...
关于你说的 最前面的三四个字不会转换成语音的问题,我试了无数次一直没有出现这个问题
最好原始文本一定要是没有杂码的纯.txt文本,utf-8格式
不要用word复制,word文本最前面有控制符,word专用的格式,这些都不是可发声的字符,不可见,但程序运行的时候会影响。
gennc 发表于 2025-8-7 15:52
关于你说的 最前面的三四个字不会转换成语音的问题,我试了无数次一直没有出现这个问题
最好原始文本一定 ...
谢谢,我试试看。
原来你就是开发者啊! xb78 发表于 2025-8-7 16:09
谢谢,我试试看。
原来你就是开发者啊!
哈哈,不是我开发的
不过可以反馈给开发团队{:1_252:}
页:
[1]