一年之前的國內春節假期期間,OpenAI在當地時間2024年2月15日發布了文生視頻大模型Sora,在幾段sora生成的視頻中,絲滑的運鏡和幾可亂真的呈現效果,讓當時仍處于模仿和跟隨階段的國產大模型界陷入巨大的震驚和悲觀情緒中。一時之間“投降論”甚囂塵上,投資人和大廠們紛紛出來勸說創業者們放棄幻想,轉攻應用,大模型創業是“死路一條”。
誰又能想到,在短短一年之后的這個春節,大家討論的是一款名叫DeepSeek國產大模型。除了科技圈的討論和刷屏之外,其應用開始深入千家萬戶,有更多的普通人開始使用DeepSeek定制減肥食譜、編輯節日祝福、寫藏頭詩,甚至算命。
到現在為止,DeepSeek一共推出了三代模型。去年5月,幻方量化旗下的DeepSeek發布了DeepSeek-V2,能力號稱對標GPT-4,價格卻僅為GPT-4的近1%,低廉的價格引發了國產大模型長達一整年的價格戰;到了12月,DeepSeek發布了新大模型DeepSeek-V3,將訓練成本降到幾百萬美元,被譽為“價格屠夫”;而這次發布的DeepSeek-R1,直接對標OpenAI o1.其中“深度思考”和“聯網搜索”功能的上線,讓DeepSeek成功登頂中美兩區免費榜第一。
您已閱讀32%(521字),剩余68%(1109字)包含更多重要信息,訂閱以繼續探索完整內容,并享受更多專屬服務。