自適應(yīng)和智能計(jì)算的企業(yè)賽靈思18日宣布已經(jīng)完成對深鑒科技的收購。深鑒科技是一家總部位于北京的初創(chuàng)企業(yè),擁有業(yè)界領(lǐng)先的機(jī)器學(xué)習(xí)能力,專注于神經(jīng)網(wǎng)絡(luò)剪枝、深度壓縮技術(shù)及系統(tǒng)級優(yōu)化。 深鑒科技成立于2016年,是一家專注于深度學(xué)習(xí)處理器研發(fā)與推廣的公司。以深度學(xué)習(xí)處理器DPU為核心,其主要業(yè)務(wù)有如下兩個方面:為深度學(xué)習(xí)提供端到端的解決方案——基于神經(jīng)網(wǎng)絡(luò)深度壓縮技術(shù)和DPU平臺;基于神經(jīng)網(wǎng)絡(luò)與FPGA,應(yīng)用于安防與數(shù)據(jù)中心——嵌入式端與云端的推理平臺。 2016年4月,深鑒獲得了高榕資本、金沙江創(chuàng)投的天使輪融資。2017年5月,獲得了賽靈思、聯(lián)發(fā)科、清華控股、方和資本領(lǐng)投的數(shù)千萬美元A輪融資。2017年10月,完成了由螞蟻金服與三星風(fēng)投領(lǐng)投的約4000萬美元A+輪融資。 深鑒科技 CEO (首席執(zhí)行官)姚頌表示:“我們非常高興能夠進(jìn)一步深化深鑒科技與賽靈思的合作,讓雙方能夠更加緊密地聯(lián)手為中國乃至全球用戶提供領(lǐng)先的機(jī)器學(xué)習(xí)解決方案。 深鑒科技 CTO (首席技術(shù)官)單羿表示:“作為早期投資者之一,賽靈思一路陪伴深鑒科技共同發(fā)掘機(jī)器學(xué)習(xí)的潛力,并見證了我們在這一領(lǐng)域的創(chuàng)新與發(fā)展。我們期待通過此次交易,合力將我們的機(jī)器學(xué)習(xí)解決方案提升到一個全新的性能水平! 摩爾定律失效,芯片發(fā)展何去何從? 兩年拿到三輪融資,成為芯片初創(chuàng)企業(yè)中的第一梯隊(duì),深鑒在一眾起跑的芯片企業(yè)中已經(jīng)占領(lǐng)了先機(jī),而它的創(chuàng)始人姚頌則是一位年輕的創(chuàng)業(yè)者。在清華讀本科時,姚頌結(jié)識了AI專家汪玉博士,后來又與韓松與單羿兩位清華學(xué)長結(jié)緣。2016年,畢業(yè)不到一年的姚頌果斷放棄出國讀博,與老師還有兩位學(xué)長一起創(chuàng)立了深鑒科技。 “我是一個比較有激情比較有闖勁,享受有挑戰(zhàn)的生活的人,我覺得這樣的生活好像不那么適合我!币虼耍炏胍獩_破那層透明的天花板,給自己更多地可能性。 與亟待沖破自己內(nèi)心天花板的姚頌一樣,當(dāng)時的芯片行業(yè)也正面臨著自己的天花板。 芯片行業(yè)一直在基于摩爾定律發(fā)展,1956年,戈登·摩爾提出:當(dāng)價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18-24個月便會增加一倍,性能也將提升一倍。換言之,隨著集成電路上可容納的晶體管的不斷變小,芯片的性能便會成倍提高,同時成本不斷下降。 但目前制造CPU的晶體管已經(jīng)小到10納米級別,繼續(xù)做小越來越難。 因而,姚頌認(rèn)為,在通用芯片的發(fā)展上,摩爾定律已經(jīng)無以為繼,想要獲取更高性能,更低功耗,只能做得越來越專用。越來越專用,就要牽扯到跟算法跟應(yīng)用場景,要了解應(yīng)用和場景。此時,很多的事情就是算法軟件給定的。 而深度學(xué)習(xí)的興起正好為芯片的打開了這樣一扇窗。深度學(xué)習(xí),通過深度神經(jīng)網(wǎng)絡(luò),模擬人腦的機(jī)制來學(xué)習(xí)、判斷、決策。在深度學(xué)習(xí)處理器的運(yùn)行當(dāng)中,計(jì)算系統(tǒng)的運(yùn)算能力提升是決定深度學(xué)習(xí)處理效率的關(guān)鍵。 “我們一直做的是一個深度學(xué)習(xí)處理器,是有指令集的處理器,而不是將某幾個算法寫死到一顆芯片上,或者在 FPGA 上。雖然GPU平臺并行度很高,在算法訓(xùn)練上非常高效,但在應(yīng)用時,一次性只能處理一張輸入圖像,并行度的優(yōu)勢并無用武之地。而DPU產(chǎn)品可以實(shí)現(xiàn)相對于GPU有1個數(shù)量級的能效提升。我覺得這肯定是一個非常大的趨勢,未來一定是系統(tǒng)決定芯片! FPGA解決芯片業(yè)的難點(diǎn),加速量產(chǎn) 而在深度學(xué)習(xí)中,深鑒為何選擇FPGA架構(gòu)呢? 眾所周知,研制一個處理器級別的芯片,核心架構(gòu)至少也要3-4年,而要量產(chǎn)的話,還要再經(jīng)過一年半到兩年,這對創(chuàng)業(yè)公司來說,是一場漫長的消耗戰(zhàn)。并且,芯片的一次性研發(fā)投入很高。一個 28 納米的芯片,純技術(shù)性的研發(fā)投入可能就高達(dá)400 多萬美金。盡管人工智能這個賽道十分吸金,但初創(chuàng)企業(yè)依然承受不起這個成本。并且研制芯片,還需要面臨全行業(yè)都遇到的挑戰(zhàn):如何去定義芯片?如較為成熟的芯片 X86 的 CPU,藍(lán)牙芯片、wifi 芯片的芯片功能和協(xié)議已經(jīng)固定了下來,只需要再做芯片優(yōu)化就可以了。但要重新打造芯片,就要重新進(jìn)行定義。 而FPGA 能解決這幾個問題。1984年,賽靈思發(fā)明了現(xiàn)場可編程門陣列FPGA,F(xiàn)PGA作為半定制化的ASIC(專用集成電路),順應(yīng)了計(jì)算機(jī)需求更專業(yè)的趨勢,成為神經(jīng)網(wǎng)絡(luò)算法中的主流芯片。對于初創(chuàng)公司而言,F(xiàn)PGA 芯片已經(jīng)有賽靈思的研發(fā)在前,芯片研發(fā)已經(jīng)結(jié)束,不必經(jīng)歷一年半到兩年的量產(chǎn)周期,把研發(fā)的新品結(jié)構(gòu)融入進(jìn) FPGA 后就可以直接生產(chǎn)產(chǎn)品,上市時間可能僅需三個月。 另外,較為成熟的芯片可以按需購買,不用一開始就投入 400 多萬美金,所以,也沒有一次性投入太高的問題。并且FPGA 是可重構(gòu)的,上一代架構(gòu)寫的程序,還能在新一代架構(gòu)上運(yùn)行,能很好的解決定義芯片的問題。 但是,F(xiàn)PGA 還存在兩個痛點(diǎn):在量大的情況下,成本高,量需要達(dá)到幾十萬片,才能實(shí)現(xiàn)了盈利;另外,在 FPGA 上實(shí)現(xiàn)處理器芯片, 必須考慮它可以不斷擦寫、可以運(yùn)行各種各樣的芯片的通用性的問題。 關(guān)注安防,做深度學(xué)習(xí)解決方案提供商 雖然在技術(shù)上有足夠多的考慮,但研發(fā)和商用上的邏輯其實(shí)并不相同。姚頌對這一點(diǎn)深有體會!白黾夹g(shù)的人通常有一種對于技術(shù)的自傲,會有一種技術(shù)的清高,或者說這是一種自己的天賦。這其實(shí)給了我們非常多的教訓(xùn)。” 因而,在重新審視行業(yè)之后,深鑒選擇安防和數(shù)據(jù)中心這兩個賽道,并將提供安防解決方案作為主攻方向。姚頌表示:“深鑒科技是一個深度學(xué)習(xí)解決方案的提供商,而非一家只是賣芯片的公司!边@樣的定位源于他對市場端的深度思考,單獨(dú)只做一個芯片公司,周期比較長、資金消耗大,風(fēng)險(xiǎn)很高。而從單純的芯片涉及到一個系統(tǒng),再到可以運(yùn)行一個整體的解決方案,公司的前景就會更廣闊。 因此,深鑒科技更像一個制作Drive PX2的英偉達(dá),所有的產(chǎn)品都是針對于某個行業(yè)的方案,用戶最終看到的產(chǎn)品是一個板卡,它包含一些推理、設(shè)計(jì)和算法,可以提供支持,但性能和功耗不同,用戶還可以自行開發(fā)。目前,深鑒切入AI+安防行業(yè)的方式包括前端嵌入式攝像頭和安防的后處理,提供的安防芯片模組上內(nèi)嵌了人臉識別、視頻結(jié)構(gòu)化等參考算法。 2017年10月,深鑒科技在宣布4000萬美元A+輪融資的同時,推出了8款A(yù)I新品,其中包括2款自研AI芯片“聽濤”與“觀!,今年第三季度上市,現(xiàn)在已經(jīng)在量產(chǎn)當(dāng)中。今年3月,深鑒科技宣布在亞馬遜AWS正式上線基于深鑒Descartes稀疏神經(jīng)網(wǎng)絡(luò)處理架構(gòu)的自動語音識別引擎DDESE上,開始面向全球用戶提供加速試用服務(wù)。 |