百度ai系列研究之自研圖數(shù)據(jù)庫BGraph
每周一篇原創(chuàng),關(guān)注5G、物聯(lián)網(wǎng)、人工智能,跟著我堅持利用碎片時間學習
簡介
今天我們進入知識圖譜的學習,知識圖譜是人工智能的一個重要分支,當前場景應(yīng)用正在不斷豐富。其中最核心的是圖數(shù)據(jù)庫,百度自研商業(yè)圖數(shù)據(jù)庫 BGraph 支持業(yè)界流行 Property Graph 模型和Gremlin語言(并進行擴展),在檢索和實時深度連接分析上具有極高的性能。BGraph 具有高可用性,提供復(fù)制和分片技術(shù)進行分布式擴展,支持批量加載和實時更新,從而使您能夠輕松構(gòu)建基于圖數(shù)據(jù)庫的企業(yè)級應(yīng)用,實時分析關(guān)聯(lián)數(shù)據(jù),挖掘數(shù)據(jù)價值。
圖來自百度官網(wǎng)
應(yīng)用場景
欺詐檢測:通過深度關(guān)聯(lián)分析實時的檢測欺詐模式,從而構(gòu)建反欺詐應(yīng)用。例如分析購買和轉(zhuǎn)賬關(guān)系是否有環(huán),判斷是否刷單作弊或惡意套現(xiàn)
企業(yè)圖譜:企業(yè)圖譜應(yīng)用將企業(yè)的董監(jiān)高等信息以及企業(yè)之間關(guān)系存儲在圖數(shù)據(jù)庫中,然后使用圖查詢?nèi)娴姆治錾虡I(yè)機會和商業(yè)風險
公共安全:構(gòu)建公共安全領(lǐng)域知識圖譜,挖掘人物、事件、地點及其關(guān)聯(lián)數(shù)據(jù),利用專家經(jīng)驗和機器學習技術(shù),支撐公安機關(guān)開展嫌犯追蹤、案件分析和重大事件預(yù)警等工作
智能運維:智能運維平臺將網(wǎng)絡(luò)設(shè)備和服務(wù)關(guān)聯(lián)等信息存儲在圖數(shù)據(jù)庫中,可以通過圖查詢和圖計算來規(guī)劃路由、診斷故障和收斂報警等
技術(shù)特點
高性能:自研的圖存儲和計算引擎,針對檢索和深度連接分析做優(yōu)化,并用C++ 實現(xiàn),具有毫秒級查詢響應(yīng),并能支持數(shù)萬的QPS
高擴展:能支持數(shù)億級頂點的圖數(shù)據(jù),能通過分片和副本分布式可擴展,滿足業(yè)務(wù)的快速增長
高可用:BGraph 支持多實例副本,具有實時容錯能力,單實例的故障不會影響查詢服務(wù),旨在提供超過 99.99% 的可用性
開放性:支持業(yè)界流行的 Property Graph 數(shù)據(jù)模型和 Gremlin查詢語言,并對Gremlin進行擴展,支持特色的高性能圖算法
常見圖數(shù)據(jù)庫
Neo4j是一個流行的圖形數(shù)據(jù)庫,它是開源的。最近,Neo4j的社區(qū)版已經(jīng)由遵循AGPL許可協(xié)議轉(zhuǎn)向了遵循GPL許可協(xié)議。盡管如此,Neo4j的企業(yè)版依然使用AGPL許可。Neo4j基于Java實現(xiàn),兼容ACID特性,也支持其他編程語言,如Ruby和Python。
FlockDB是Twitter為進行關(guān)系數(shù)據(jù)分析而構(gòu)建的。FlockDB迄今為止還沒有穩(wěn)定的版本,對于它是否是一個真正的圖形數(shù)據(jù)庫,尚有爭議。FlockDB和其它圖形數(shù)據(jù)庫(如Neo4j、OrientDB)的區(qū)別在于圖的遍歷,Twitter的數(shù)據(jù)模型不需要遍歷社交圖譜。盡管如此,由于FlockDB應(yīng)用于Twitter這樣的大型站點,以及它相比其它圖形數(shù)據(jù)庫的簡潔性,仍然值得我們值得關(guān)注。
AllegroGrap是一個基于W3c標準的為資源描述框架構(gòu)建的圖形數(shù)據(jù)庫。它為處理鏈接數(shù)據(jù)和Web語義而設(shè)計,支持SPARQL、RDFS++和Prolog。
GraphDB是德國sones公司在.NET基礎(chǔ)上構(gòu)建的。Sones公司于2007年成立,近年來陸續(xù)進行了幾輪融資。GraphDB社區(qū)版遵循AGPL v3許可協(xié)議,企業(yè)版是商業(yè)化的。GraphDB托管在Windows Azure平臺上。
InfiniteGraph基于Java實現(xiàn),它的目標是構(gòu)建“分布式的圖形數(shù)據(jù)庫”,已被美國國防部和美國中央情報局所采用。除此之外,還有其他一些圖形數(shù)據(jù)庫,如OrientDB、InfoGrid和HypergraphDB。Ravel構(gòu)建在開源的Pregel實現(xiàn)之上,微軟研究院的Trinity項目也是一個圖形數(shù)據(jù)庫項目。
百度開源的分布式圖數(shù)據(jù)庫。支持標準的Apache Tinkerpop Gremlin圖查詢語言,支持屬性圖,可支持千億級規(guī)模關(guān)系數(shù)據(jù);支持多種后端存儲(Cassandra,HBase,RocksDB,MySQL,PostgreSQL,ScyllaDB);支持各類索引(二級索引、范圍索引、全文索引、聯(lián)合索引,均無需依賴第三方索引庫);提供可視化的Web界面,可用于圖建模、數(shù)據(jù)導入、圖分析;提供導入工具支持從多種數(shù)據(jù)源中導入數(shù)據(jù)到圖中,支持的數(shù)據(jù)源包括:CSV、HDFS、關(guān)系型數(shù)據(jù)庫(MySQL、Oracle、SQL Server、PostgreSQL);支持REST接口,并提供10+種通用的圖算法;支持與Hadoop、Spark GraphX等大數(shù)據(jù)系統(tǒng)集成。
免責聲明:
本公眾號為個人研究專題學習分享,非商業(yè)公眾號無任何商業(yè)目的,如果文章內(nèi)容有侵權(quán)或者非法信息,請立即與本號聯(lián)系刪除謝謝
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市