SpeechSynthesisUtterance无法导出语音生成mp3文件,详细见:https://stackoverflow.com/questions/18902789/can-web-speech-api-be-used-in-conjunction-with-web-audio-api

但是,可以使用js TTS库,如mespeak(详细:https://www.masswerk.at/mespeak/)。它输出可以通过网络音频缓冲节点播放的缓冲区。