專訪融數(shù)聯(lián)智袁曄:隱私計(jì)算爆發(fā)的原因是全球算力的增長嗎?
“安全加密、低時延的數(shù)據(jù)交換網(wǎng)絡(luò)可突破數(shù)據(jù)孤島!
作者:羅賓 出品:財經(jīng)涂鴉
當(dāng)數(shù)據(jù)規(guī)模達(dá)到一定量級,只有數(shù)據(jù)“流通”起來,各類數(shù)據(jù)能交匯,每一類數(shù)據(jù)的價值才能充分發(fā)揮。在這樣的共同認(rèn)知下,隱私計(jì)算賽道的創(chuàng)業(yè)者和投資人正在推動底層技術(shù)在很多場景的商業(yè)化。作為具有技術(shù)和投資背景的創(chuàng)業(yè)者,袁曄對《財經(jīng)涂鴉》表示,數(shù)據(jù)分析從“加法”變成“減法”的時代正在到來,減法時代底層范式的大變革,使得數(shù)據(jù)的上層應(yīng)用都會顛覆。這也是他在2019年從投資轉(zhuǎn)做創(chuàng)業(yè)的初衷。融數(shù)聯(lián)智創(chuàng)始人兼CEO袁曄曾任水木清華基金執(zhí)行董事,也是一位數(shù)據(jù)行業(yè)專家。
《財經(jīng)涂鴉》獨(dú)家對話了袁曄,他從技術(shù)和產(chǎn)品的商業(yè)化路徑等方面分享了如何實(shí)現(xiàn)數(shù)據(jù)的“可用不可見”。
融數(shù)聯(lián)智專注于隱私計(jì)算,公司面向數(shù)據(jù)安全和隱私保護(hù)的數(shù)據(jù)解決方案已廣泛應(yīng)用于大型金融機(jī)構(gòu)和品牌營銷公司的數(shù)據(jù)驅(qū)動決策中。公司已經(jīng)獲幾千萬人民幣投資。融數(shù)聯(lián)智核心團(tuán)隊(duì)來自PayPal、阿里、螞蟻金服、華為等行業(yè)巨頭,在芯片、密碼學(xué)、大數(shù)據(jù)、分布式計(jì)算等領(lǐng)域有深厚經(jīng)驗(yàn)。
2021年3月22日,國家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部、國家市場監(jiān)督管理總局四部門聯(lián)合發(fā)布《常見類型移動互聯(lián)網(wǎng)應(yīng)用程序必要個人信息范圍規(guī)定》。其中明確地圖導(dǎo)航、網(wǎng)絡(luò)約車、即時通信、網(wǎng)絡(luò)購物等39類常見類型移動應(yīng)用程序必要個人信息范圍,要求其運(yùn)營者不得因用戶不同意提供非必要個人信息,而拒絕用戶使用APP基本功能服務(wù)。袁曄表示,隨著數(shù)據(jù)量大規(guī)模增長以及數(shù)據(jù)隱私保護(hù)的監(jiān)管推進(jìn),簡單做數(shù)據(jù)“搬家”越來越不合規(guī),如果沒有隱私計(jì)算,還會產(chǎn)生更多數(shù)據(jù)孤島。
融數(shù)聯(lián)智運(yùn)用了PSI(隱私保護(hù)集合交集)、密碼學(xué)等多種底層技術(shù)并完善技術(shù)的工程化,使數(shù)據(jù)在加密前提下實(shí)現(xiàn)跨機(jī)構(gòu)間的數(shù)據(jù)的聯(lián)合分析聯(lián)合建模,客戶從而獲得對用戶更精準(zhǔn)的畫像,實(shí)現(xiàn)獲客成本、營銷成本的下降。并且通過自研芯片的加速,使得更多算法在現(xiàn)實(shí)場景落地應(yīng)用。
袁曄認(rèn)為,要解決數(shù)據(jù)孤島問題,就需要構(gòu)建一種單一數(shù)據(jù)交換網(wǎng)絡(luò),越來越多的公司正在為這樣的底層網(wǎng)絡(luò)而努力。而為了使分布在異地的服務(wù)器在做加密聯(lián)合運(yùn)算分析時像在使用本地數(shù)據(jù)時一樣便捷,就需要通過網(wǎng)絡(luò)加速解決網(wǎng)絡(luò)帶寬問題,同時還要提升算力。但目前CPU的算力無法適應(yīng)隱私計(jì)算的高運(yùn)算量。因此,融數(shù)聯(lián)智自主設(shè)計(jì)了隱私保護(hù)計(jì)算芯片(PPU),它也是目前業(yè)內(nèi)唯一一家為隱私計(jì)算打造芯片的公司。
以下是部分采訪內(nèi)容:
Q:財經(jīng)涂鴉
A:袁曄 融數(shù)聯(lián)智創(chuàng)始人兼CEO
Q:數(shù)據(jù)確權(quán)(所有權(quán)、管理權(quán)、使用權(quán)等)方面,法律明確和有望進(jìn)一步明確的分別是哪些?
A:上個月,網(wǎng)信辦等四個部門發(fā)布公告對幾類APP到底能采集哪些個人隱私數(shù)據(jù)做了非常清晰的界定。《個人隱私保護(hù)法》《數(shù)據(jù)安全法》在草案階段對數(shù)據(jù)確權(quán)都有一些規(guī)定;《民法典》也在構(gòu)建系統(tǒng)的數(shù)據(jù)保護(hù)體系。這些都是一個漸進(jìn)的過程,我們看到確權(quán)問題目前在具體場景下逐漸清晰。
我一直從事數(shù)據(jù)行業(yè),在2018年關(guān)注到了隱私計(jì)算,當(dāng)時歐洲頒布GDPR(《通用數(shù)據(jù)保護(hù)條例》),它的一個很大的影響在于要求個人隱私數(shù)據(jù)完全歸個人所有,不再屬于任何一家機(jī)構(gòu),這是一個很嚴(yán)格的要求。當(dāng)時在中國也有相關(guān)法規(guī),但在一些具體執(zhí)行環(huán)節(jié),數(shù)據(jù)一方面歸屬于個人,另一方面也歸屬于相關(guān)合作機(jī)構(gòu)。這仍然會產(chǎn)生問題,例如一些做爬蟲的公司,利用爬蟲獲取用戶信用卡賬單、通話詳單等信息,未經(jīng)個人授權(quán),但這些數(shù)據(jù)又存儲于銀行、運(yùn)營商等機(jī)構(gòu)系統(tǒng)內(nèi)。這類問題會是法律未來需要更加明確的。
Q:先有PSI技術(shù)還是先有隱私計(jì)算的場景?
A:PSI技術(shù)在理論上已經(jīng)很成熟,但在工程上還不夠成熟,要把它寫成一個穩(wěn)定的代碼可執(zhí)行的程序,還有一個漸進(jìn)的過程。它不是一個新技術(shù),但要把它商用需要過程,就像電動汽車沒有什么特別的技術(shù)是全新的技術(shù),但是你要把它做成一個穩(wěn)定的汽車,跑很長的公里數(shù)等,就是一個工程化問題。
Q:我們現(xiàn)在看到有三個技術(shù)路線,聯(lián)邦學(xué)習(xí)、MPC、TEE,從現(xiàn)在創(chuàng)立的一些公司看,聯(lián)邦學(xué)習(xí)是未來的大方向?
A:MPC(多方安全計(jì)算)和TEE(可執(zhí)行環(huán)境)在學(xué)術(shù)上有明確的定義,但聯(lián)邦學(xué)習(xí)沒有。聯(lián)邦學(xué)習(xí)最早由谷歌提出,最初想法是解決隱私問題,因?yàn)樵瓉懋?dāng)安卓系統(tǒng)上的信息都傳到谷歌服務(wù)器上,隱私就被暴露了,于是谷歌希望通過聯(lián)邦學(xué)習(xí)在安卓手機(jī)終端完成分布式計(jì)算和訓(xùn)練,很少量的信息會被傳到谷歌中心化服務(wù)器上。如果進(jìn)一步結(jié)合幾億人的手機(jī)去做手機(jī)端的訓(xùn)練,就可以把用戶體驗(yàn)做得很好。而這是一種橫向聯(lián)邦學(xué)習(xí)。
國內(nèi)最早的聯(lián)邦學(xué)習(xí)由微眾銀行的楊強(qiáng)老師提出,他所指的主要是縱向聯(lián)邦學(xué)習(xí),例如對一個人的銀行借貸歷史、運(yùn)營商的通話歷史或電商的支付信息同時做分析。這是對同一個用戶的多維度分析;而橫向聯(lián)邦學(xué)習(xí)是針對多用戶的同一維度的分析。
聯(lián)邦學(xué)習(xí)沒有要求加密,也就是說數(shù)據(jù)或計(jì)算中的參數(shù)值等是可以做明文傳輸?shù),但不做加密處理就會有隱私暴露風(fēng)險,純粹的聯(lián)邦學(xué)習(xí)是有問題的,要引入密碼學(xué)才可以完善技術(shù)框架。
Q:那怎么看融數(shù)的底層技術(shù)路線?
A:我們整合了多種隱私計(jì)算技術(shù)。我們用到了聯(lián)邦化過程的數(shù)據(jù)傳遞,而且是做了同態(tài)加密后進(jìn)行數(shù)據(jù)傳遞,只傳遞一些參數(shù)值,不會傳遞任何一方的哪怕加密的業(yè)務(wù)數(shù)據(jù)。我們還用到了MPC中的一些技術(shù)點(diǎn),如秘密分享、不經(jīng)意傳輸,它們主要用于解決不同公司數(shù)據(jù)尋求共有用戶群。
Q:數(shù)據(jù)所有者的數(shù)據(jù)在我們服務(wù)的用戶的本地,要經(jīng)過我們的加密,再去做傳輸。
A:可以這么理解。
Q:隱私計(jì)算爆發(fā)的原因是全球算力的增長嗎?或者說,算力是限制隱私計(jì)算的主要原因?
A:觸動大家用隱私計(jì)算的因素一方面是數(shù)據(jù)安全相關(guān)法規(guī)對于隱私保護(hù)的明確;從執(zhí)行環(huán)節(jié),之所以今天能夠這樣進(jìn)行隱私計(jì)算,確實(shí)是因?yàn)樗懔υ鲩L,網(wǎng)絡(luò)帶寬也在增加,因?yàn)楦鱾機(jī)構(gòu)進(jìn)行這種聯(lián)合運(yùn)算需要用網(wǎng)絡(luò)傳輸。
Q:所以算力還是主要的限制。算力的提升要靠芯片的訓(xùn)練,隱私計(jì)算的算力現(xiàn)在發(fā)展如何?
A:問到了很底層的問題。今天不管服務(wù)器、PC、手機(jī)、筆記本終端也好,這些算力都是靠CPU在跑,另外一類是深度學(xué)習(xí)的人工智能GPU,但這些芯片“天生”都不是做隱私計(jì)算的。所以隱私計(jì)算對算力要求其實(shí)很高,它的底層每時每刻都在做大量的加解密。大量的密態(tài)數(shù)據(jù)的運(yùn)算跟普通的CPU上運(yùn)行的1+2=3是不同的,在CPU上加法的底層指令是“ADD”;而密文中的加法不是簡單相加,而是有專門的密態(tài)加減乘除方法,這些方法對CPU、GPU來說都耗時非常多。并且密文下的計(jì)算運(yùn)用了聯(lián)盟化的方法,很多數(shù)據(jù)又要做拆分,這主要是為了做混淆,不被人反解,F(xiàn)有芯片的算力難以覆蓋各種環(huán)節(jié)所需的巨大運(yùn)算量。
我們提供給客戶軟件方案的同時發(fā)現(xiàn)了芯片的性能瓶頸,所以我們自己開發(fā)了專門用于隱私計(jì)算的芯片PPU(Privacy Preserving Unit)。芯片里的指令完全是去做加解密運(yùn)算,把原來在CPU上要跑1萬甚至100萬個clock的運(yùn)算縮減到這種芯片中,該芯片中一個clock就可以完成同等運(yùn)算。我們認(rèn)為PPU未來跟目前服務(wù)器的CPU、GPU是并行的關(guān)系,意味著未來服務(wù)器出廠時就可以原置這樣的隱私保護(hù)芯片。
Q:我了解到英特爾基于TEE的運(yùn)算是將數(shù)據(jù)先接到芯片里再解密,涉及到另一個技術(shù)路線。
A:對,英特爾、AMD還是ARM芯片也好,都有安全區(qū)域,區(qū)域里的數(shù)據(jù)是明文計(jì)算的,這會產(chǎn)生幾個數(shù)據(jù)安全的隱患。第一是假設(shè)交匯后的數(shù)據(jù)在芯片上運(yùn)算,我們能否確保掌握芯片的機(jī)構(gòu)的所有人都“不作惡”?第二,我們在中國使用了英特爾、AMD等美國的芯片,而美國的芯片公司能否保證我們的數(shù)據(jù)安全?第三,這個安全區(qū)域空間很有限,所以每次能處理、運(yùn)算的數(shù)據(jù)量也是很有限的。
Q:現(xiàn)在是在做一種更高效的適應(yīng)場景的算力解決方案?
A:對。
Q:數(shù)據(jù)孤島是怎么成為數(shù)據(jù)行業(yè)共同的一個瓶頸的?
A:因?yàn)樵?014年以前沒有產(chǎn)生那么多數(shù)據(jù),大家通;谧约旱臄(shù)據(jù)做分析,那個時代就是所謂的“BI時代”。后來移動互聯(lián)網(wǎng)快速發(fā)展,數(shù)據(jù)海量增長,大家希望跨公司做分析,當(dāng)時的解決方式就是“數(shù)據(jù)搬家”,比如銀行想用客戶的淘寶交易數(shù)據(jù),就直接將淘寶數(shù)據(jù)買過來,或用網(wǎng)絡(luò)明文傳輸,也就是我們現(xiàn)在說的“加法”。但從2017年起數(shù)據(jù)行業(yè)的監(jiān)管不斷推進(jìn),數(shù)據(jù)加法也就越來越不合法、不合規(guī),而且也會產(chǎn)生利益糾紛,因?yàn)椴煌趯?shí)物資產(chǎn),數(shù)據(jù)資產(chǎn)可能被復(fù)制,用于重復(fù)交易。而如果沒有隱私計(jì)算,數(shù)據(jù)孤島問題會越來越嚴(yán)重。
因此2018年我認(rèn)為數(shù)據(jù)的“減法”時代正在到來,也就是各方數(shù)據(jù)不用搬家,還能實(shí)現(xiàn)跨公司的數(shù)據(jù)聯(lián)合運(yùn)算,運(yùn)算結(jié)果與把各路數(shù)據(jù)歸集一處進(jìn)行明文運(yùn)算的結(jié)果一致。我覺得這是能突破數(shù)據(jù)孤島的底層范式的大變革,這也是我從投資轉(zhuǎn)創(chuàng)業(yè)的原因。
Q:融數(shù)正在做一個平臺嗎,把數(shù)據(jù)通過加密的方式共享?
A:是的,我們想把數(shù)據(jù)交易的買方和賣方都納入到我們的平臺里,相當(dāng)于做了一個數(shù)據(jù)市場。
Q:提供的不是單純的技術(shù)。不知道投資人會不會問一個問題,就是這個平臺的終局會是什么?
A:我認(rèn)為是構(gòu)建一個單一的數(shù)據(jù)合作網(wǎng)絡(luò)。必須且只有一個才能徹底解決數(shù)據(jù)孤島問題。當(dāng)然這個網(wǎng)絡(luò)不一定是我們一家公司建立的,可能是多家建立的。而正是因?yàn)檫@件事情的終局很吸引人,我們的團(tuán)隊(duì)都愿意加入進(jìn)來,而且是低薪甚至不拿薪水來加入。
Q:目前公司如何獲客,取得增長?
A:商業(yè)執(zhí)行上我們是to B的方式獲客,但底層邏輯是要組網(wǎng)絡(luò)。
Q:產(chǎn)品需要為客戶定制嗎?
A:我們的產(chǎn)品是標(biāo)準(zhǔn)化的,不做定制?梢钥闯晌覀冊诮o每家公司安裝上路由器,這樣我們可以很快復(fù)制。垂直的行業(yè)里面要解決的一些上層應(yīng)用的問題,如銀行的風(fēng)控,我們做到了交付狀態(tài),客戶可以看到可視化的界面,這是為了讓客戶能夠直接使用。但后期我們會和第三方合作,他們完成上層應(yīng)用,我們的角色是基礎(chǔ)設(shè)施的搭建,去做偏底層的技術(shù)架構(gòu)。如果以智能手機(jī)的例子去理解,我們今天把手機(jī)做了,把操作系統(tǒng)、系統(tǒng)上所有的APP及功能都做了,這樣用戶可以用起來。但長遠(yuǎn)來看我們的定位是做操作系統(tǒng),硬件加速,上層應(yīng)用由合作方完成。那么我們的目標(biāo)是讓這個系統(tǒng)性能、安全性更好,所以一是保證各方的隱私;二是讓服務(wù)器分布于不同地點(diǎn)的多家公司數(shù)據(jù)能夠進(jìn)行加解密、聯(lián)合分析,并實(shí)現(xiàn)不卡頓或低卡頓。
本文由公眾號財經(jīng)涂鴉原創(chuàng)撰寫
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市