開源虛擬人技術流派對比
虛擬人核心技術流派與商業落地評估表
技術流派 (代表作)
社群開源數量
核心特點
算力需求與併發能力 (落地評估)
應用場景
MuseTalk
近期熱門
結合 Whisper 與 UNet,單機畫質與同步率極佳。但模型過於厚重,吞吐量極低。
高 (多路併發極易卡頓)
單機本地端高品質展示、非即時離線生成。
NeRF / 3D Gaussian
成長中
體積渲染,畫質極佳、立體感強,但訓練與推理極慢。
極高 (無法即時多路)
高階數位孿生、影視級虛擬人。
3DMM / SadTalker
很多
透過單張圖片建立 3D 係數,能控制全臉甚至頭部擺動。
高,難以多路實時
照片說話、虛擬主播。
Wav2Lip 家族
極多 (開源王者)
直接用 2D