DeepSeek是AI原生應(yīng)用的臨界點嗎?未來企業(yè)的護城河在哪? | 直播回顧第三彈
2025-03-19
隨著DeepSeek的持續(xù)火熱,企業(yè)對AI的期待與困惑并存。AI原生應(yīng)用是否已經(jīng)迎來臨界點?在大模型時代,企業(yè)如何構(gòu)建真正的護城河?DeepSeek的能力邊界又在哪里?近日,明略科技高級技術(shù)總監(jiān)吳昊宇受邀做客51CTO直播間,分享了他對行業(yè)問題的深度思考。
直播干貨已整理為系列文章,歡迎點擊近期文章閱讀。
吳昊宇:從推理模型引起的熱潮和社會反響來看,DeepSeek R1的影響力遠超之前OpenAI o1,其歷史意義怎么夸贊都不為過。然而,是否是AI原生應(yīng)用的臨界點,仍有待商榷。目前,DeepSeek R1在應(yīng)用層面的直接幫助有限,它的核心價值在于推理邏輯給大家?guī)淼恼鸷场?/p>
AI作為工具的plus功能,與完全構(gòu)建在AI之上的工具,是兩種截然不同的應(yīng)用。目前大多數(shù)AI應(yīng)用仍需要人類主導(dǎo)思路調(diào)整和糾錯,未來AI編程工具是否會完全取代人類干預(yù),成為真正的AI原生應(yīng)用,這不僅是技術(shù)問題,更是對工程師的嚴峻挑戰(zhàn)。
吳昊宇:用數(shù)學(xué)公式Y(jié) = f(X)來類比,其中X是數(shù)據(jù),f是大模型,Y是最終結(jié)果。過去,各企業(yè)掌握的f(模型能力)存在差異,但如今,當(dāng)大家的f趨同,決定結(jié)果的關(guān)鍵就變成了X。
X主要是指場景或者行業(yè)數(shù)據(jù),在其他因素趨同的情況下,企業(yè)擁有的數(shù)據(jù)將成為影響結(jié)果最大的變量。誰掌握了垂直行業(yè)中的獨特數(shù)據(jù)或獨家數(shù)據(jù),誰就能在行業(yè)中占據(jù)先機,而更多的垂直行業(yè)經(jīng)驗和場景可以帶來更多的垂直行業(yè)數(shù)據(jù)。未來,數(shù)據(jù)將成為企業(yè)的核心護城河。
吳昊宇:能力邊界是一個復(fù)雜問題。我們看到,網(wǎng)上有人直接讓DeepSeek推薦股票,這其實就是錯用了DeepSeek的能力邊界,因為它并不對結(jié)果負責(zé)。在不同的場景下,能力邊界要進行嚴格的測試。
大模型在發(fā)布時要通過各種標(biāo)準(zhǔn)數(shù)據(jù)集,進行數(shù)學(xué)能力、常識能力、推理能力,以及編程能力等多項評測,但這些測試集是否能完全代表其真實能力,需要大家在實際場景中驗證。
目前的測試多以填空題、選擇題為主,只能證明模型在標(biāo)準(zhǔn)化問題上的表現(xiàn)。實際業(yè)務(wù)場景卻往往并不是以標(biāo)準(zhǔn)化問題的形式出現(xiàn)。模型的回答能否滿足企業(yè)需求,需要在不同場景中不斷測試。此外,如何通過提示詞或提供更好的上下文消除幻覺,也是需要在實際應(yīng)用中不斷評測模型的方向。
吳昊宇:我們主要進行了針對R1的適配工作。包括在內(nèi)部的Agent Builder平臺、知識庫管理平臺,以及企業(yè)級一站式大模型應(yīng)用“小明助理”上,將R1的推理過程進行了明確展示。無論是底層架構(gòu)、中間件平臺,還是上層應(yīng)用,我們都圍繞推理模型進行了相關(guān)適配工作。
DeepSeek的出現(xiàn)無疑為AI應(yīng)用帶來了新的機遇和挑戰(zhàn),在推理邏輯上的突破已經(jīng)為企業(yè)提供了新的思路。
未來,企業(yè)需要在數(shù)據(jù)積累、行業(yè)洞察和技術(shù)創(chuàng)新上持續(xù)發(fā)力,才能構(gòu)建真正的護城河。AI原生應(yīng)用的臨界點或許尚未到來,但企業(yè)已經(jīng)在路上。
信息填寫