参考录音:这是参考录音,用于合成语音
合成文本:大家好,我是凤鹏超,来自上海交通大学电子信息与电气工程学院二零二二级人工智能班。我迷恋乒乓飞舞的韵律、楚河汉界的玄机,更爱执笔绘就丹青、行至山河万里。虽然我不会说方言,但是我正在说方言。你们觉得我说的像不像呢?
KeSpeech 数据集
NFE | Time (s) | Quality | DialectSense |
---|---|---|---|
16 | 5.46 | 3 | 4.5 |
32 | 7.53 | 4 | 4.5 |
48 | 8.79 | 4.5 | 4.5 |
64 | 12.03 | 4 | 4.5 |
FT | α (Enhance) | Quality | DialectSense |
---|---|---|---|
0 | 1 | 4 | 1 |
60k | 1 | 4 | 1.5 |
60k | 2+ | 4 | 4 |
60k | 3+ | 4 | 4.5 |
80k | 1 | 4 | 3.5 |
80k | 2+ | 3 | 3.5 |
80k | 3+ | 2.5 | 4 |
100k | 1 | 3 | 2 |
100k | 2+ | 3.5 | 3.5 |
100k | 3+ | 1 | 2.5 |
上海方言展示:
(FT = 60 k steps, NFE = 32)
(FT = 80 k steps, NFE = 32)