人工智能已經(jīng)突破了一項聲音障礙。麻省理工學(xué)院(MIT)的研究人員開發(fā)了一款人工智能系統(tǒng),可以“觀看”無聲的視頻并且生成一段聲音,效果十分逼真,以至于多數(shù)觀眾無法分辨出這些聲音是否是計算機生成的。
MIT計算機科學(xué)和人工智能實驗室(MIT Computer Science and Artificial Intelligence Laboratory)稱,其“深度學(xué)習(xí)算法”是頭一個通過“聲音圖靈測試”的,生成的聲音能夠以假亂真。
這款視覺指示聲音系統(tǒng)(Visually Indicated Sounds,簡稱Vis)受到訓(xùn)練,能夠?qū)髯訐舸颉⒐尾粱蛘咄币幌盗形矬w(從樹葉、水到土壤和鋼鐵)時發(fā)出的聲音進行分析。
您已閱讀26%(303字),剩余74%(853字)包含更多重要信息,訂閱以繼續(xù)探索完整內(nèi)容,并享受更多專屬服務(wù)。