本文作者是Bramble Intelligence的人工智能研究員,參與了《2025年人工智能現(xiàn)狀報告》(State of AI Report 2025)的編寫
直到最近,構(gòu)建一個能進行逼真的電話交談的人工智能系統(tǒng)仍是一項艱巨的任務。開發(fā)者必須將語音識別、語言處理和語音合成等相互獨立的工具整合在一起,并通過脆弱的電話通訊軟件把它們連接起來。
如今情況已不同。隨著實時原生語音AI模型的出現(xiàn)——例如OpenAI去年推出的RealTime API——曾經(jīng)需要多個組件才能構(gòu)建的系統(tǒng),如今只需數(shù)分鐘即可完成創(chuàng)建。
您已閱讀19%(252字),剩余81%(1072字)包含更多重要信息,訂閱以繼續(xù)探索完整內(nèi)容,并享受更多專屬服務。