微软VibeVoice开源AI文本转语音模型VibeVoice是微软开源的前沿语音AI模型系列,聚焦于长文本语音合成(TTS)与长音频语音识别(ASR)。其核心创新在于采用7.5Hz超低帧率的连续语音分词器(声学+语义),结合大语言模型与扩散头,在保证音质的同时大幅提升长序列处理效率。090AI语音生成# AI语音工具# 文本转语音# 语音助手