sillytavern吧 关注:25,721贴子:84,287
  • 7回复贴,共1

新人求教语音交互相关

只看楼主收藏回复

新人没有玩过酒馆慕名而来。请问各位大佬酒馆目前可以实现接入第三方文本生成音频模型,在特定的世界观下与角色卡进行语音对话吗?


IP属地:湖北1楼2025-03-27 22:31回复
    扩展里有tts语音,应该可以文本生成语音吧,但我没用过,我只用过文生图


    IP属地:广东来自Android客户端2楼2025-03-28 09:51
    回复
      2025-12-29 20:53:55
      广告
      不感兴趣
      开通SVIP免广告
      可以接语言模型的api,如果有的话可以接进去也比较容易操作
      本地模型用gpt SoVITS v2什么的挺好的,唯一的缺点就是只能在电脑的酒馆上玩(我不会内网穿透到手机上面)


      IP属地:河南来自Android客户端3楼2025-03-28 16:44
      收起回复
        新出了个Spark-TTS,听起来很厉害。可以到b站找下教程视频,或者直接搜bv号BV1fJQgYhEjT


        IP属地:福建4楼2025-03-28 21:59
        回复