欧美日韩激情_美女国产一区_国产精品久久久久影院日本_69xxx在线

北京大學化柏林:多源數據融合方法與應用

互聯網IDC圈4月28日報道,互聯網的發展使得大數據引起人們廣泛關注。現如今大數據技術早已滲透到金融、通訊等行業以及生物學、物理學等領域。大數據在容量、多樣性和高增速方面的爆炸式增長全面考驗著現代企業的數據處理和分析能力,與此同時也為各個行業帶來了準確洞察市場行為的機會。迄今為止大數據技術與產品有哪些創新,工業大數據應用面臨哪些挑戰,金融行業大數據應用現狀如何等。圍繞這一系列問題,4月27日至28日,由工業和信息化部指導、中國信息通信研究院主辦的"2016大數據產業峰會"在北京國際會議中心盛大召開。28日上午大數據推動金融創新分論壇北京大學信息管理系研究員、助理教授化柏林做了主題演講。 

成都創新互聯是專業的惠安網站建設公司,惠安接單;提供網站設計、成都網站設計,網頁設計,網站設計,建網站,PHP網站建設等專業做網站服務;采用PHP框架,可快速的進行惠安網站開發網頁制作和功能擴展;專業做搜索引擎喜愛的網站,專業的做網站團隊,希望更多企業前來合作!

500-333文章照片-大數據推動金融創新-化柏林

北京大學信息管理系研究員、助理教授化柏林

以下是化柏林演講實錄:

化柏林:很高興有這樣一個機會對多源數據融合的研究跟大家做一個交流,剛才聽了工行和建行兩位老總的介紹,我感覺心里特別踏實,為什么說踏實?因為我的工資在工行里,我的公積金在建行里,我的主要收入都在這兩個銀行里。大家通過這兩個PPT可以發現一些共性,這個共性就是他們是在文地中談創新,這是銀行特別是國有銀行的風格。我們談互聯網談大數據創新的新型企業不是這樣的思維模式,上來就是講顛覆,就是拋棄一切。前面那種技術平臺的架構都是從過去的技術開始逐步演進過來,錢放在這兩個銀行里我是放心的。

他們的差異性和信息安全的問題。我先舉一個例子,前年斯諾登事件爆出來之后,很多新聞媒體都在說個人隱私信息泄露的問題,一個國家一個組織花這么多錢關注數據和媒體,他會關注一個普通網民的個人信息嗎?我覺得是不會的。除非作為用戶的群體去分析這個群體的特征。棱鏡計劃主要關注什么,第一是恐怖,第二宗教文化變遷的戰略影響。第三,中國與發展中國家的科學技術與軍事轉型,我們國家每年的863計劃、973計劃、十一五重大專項等等項目,每當我們公布出名單,國外就會迅速地跟蹤和分析。國內搞科技情報,我們也是一樣,美國每年出來一些新項目,他們的大飛機、航空航天領域的技術也會迅速地被我們跟蹤。還有能源和環境的目標任務。要實現一些目標的基礎,像谷歌、Facebook的數據,基于這樣的數據類型,我們在想僅僅有這樣的數據無法實現剛才的目標,要實現這樣的目標就得把這些信息融合起來,通過谷歌的檢索日志可以看出關注信息點的興趣及變化,根據Facebook、paltalk可以看出社交。把所有信息融合到一起,對一個用戶的畫像,對恐怖分子的頭會有更加清晰的認識。這對于我們金融大數據也有一定的借鑒和參考意義。

再來看一個例子,這是在網上廣泛流傳的例子,根據丹麥的統計數據,截止到2002年42萬人中有14249人被確診患癌癥,按照流行病的預測有1.5萬例,預測使用手機和癌癥的發生并無直接關聯。只看這個案例好像沒什么問題,根據WHO的統計,全球前十名癌癥發病率的國家分別為丹麥、愛爾蘭、澳大利亞等,看這個指標,發病率是一個好的指標,排在前邊幾位的都是非常發達國家的國家或者是國民福利比較好的國家。但是我們把這兩個數據放在一起,第一個數據42萬人里有14249,概率是3.4%。第二個數據10萬人里有326,數據僅為0.33%,這兩個數據放在一起我們可以斷定肯定有一個數據是錯的,因為差了一個數據級。我們查了原文,第一個例子是錯的,這個例子在網上流傳得很多,單看單個數據沒有問題,但是在不同數據放在一起做交叉驗證和融合,可能會有一些問題和發現,對于金融大數據也有借鑒和參考意義。我把不同類型的數據放在一起去做融合、交叉和比對就會發生一些新的問題,對于風險的防控會有更好的監測。

大數據特點與分析理念,三年前談還有人聽,現在再談已經沒有人聽了。除了這三個理念的轉變,數據的基礎、過程、目標上還有一點很重要的,過去我們注重單一的數據,現在我們需要多元的數據,我們用單一的數據去寫數字報告已經很難吸引人,去得到領導的肯定和關注了。不同的企業在尋求跨界和融合,去打通數據,使數據的價值有倍增的效應。為什么這么說?一方面是單一的數據有失全面性,無法全面刻畫事物及事物運動的變化。單一數據的可靠性和真實性有時候難以判定,通過多源數據的交叉引證有助于對數據的真偽性辨別,數據越來越大,我們辨別數據真偽的能力有待于提高。從單一數據里發現的洞察是非常單一的。多元數據可以有更多的發現。

多元數據的理論。融合過去起源于軍事領域,在傳感器、地理空間就是我們所說的硬數據里得到了應用和發展,但是隨著社會網絡的發展,隨著人際交際數據獲取的越來越容易,所以注重軟數據的融合也開始走向了新的應用和發展。我們通過形式表現方面,多元表示,工行叫機構建行叫單位,指的同樣的事物,不同的數據融合的時候涉及到表示的問題,語法結構層次做相關的分析和揭示。邏輯語義層,意義建構理論解釋它的內容。

現在的多源數據融合,包括三方面,多源、異構、多語種,多語種現在說得比較少,真正做多源數據融合,我是搞科技情報的,所以我們經常關注國外的文獻。昨天有人講到一帶一路,一帶一路一定會涉及到多源數據,獲取土庫曼斯坦的數據,無論是中文還是英文的數據非常少,像這些國家一定要把多語種的數據融合到一起,這里面帶來很多技術的問題。同型異源,比如都是消費的數據、存款的數據。還有異質異構,比如理財產品。

科技情報里經常用期刊論文、會議項目、著作專利、學術論文,電子商務文獻的發現,發現電子商務最高的高峰是2000年,電子商務產業是2010年后才有爆發式的增長,通過文獻和產業有十年之久,通過學術論文的文獻來預測專利,通過專利來預測一些技術的市場,根據不同類型的信息的時間差的規律,去尋找這種規律,利用這種規律來進行預測。我用產業的數據去預測產業是預測不出來的,用同一個數據去預測同一個數據是很難的。數據的融合涉及到線上與線下,歷史的數據和實時的數據,金融行業積累了大量的歷史數據,和實時數據的融合也非常關鍵。

現在大家強調大數據的實時性,我突然感覺有時候歷史的數據特別重要,比如今天早上開車過來開會,我并不關心今天早上的路況,我更關心上一周今天早上的路況,因為我需要決定我幾點出發比較合適,6點多出門肯定是不堵的,但是來的太早了,8點出門有可能晚了,所以我需要關注上一周的今天的數據規律,從7點到8點半的時間段的路況如何,來換算時間的關系,計算出行需要花多少時間。我經常看下周五要去哪兒,這個周五去看一下路況,決定要花半小時還是四十五分鐘,歷史數據是非常重要的。實時數據比較容易獲取,但是歷史的數據,看交通局的網站、百度、搜狗都是看不到的。外部和內部的數據融合。

融合的層次,數據級、特征級、決策級,要看面向的應用場景。融合問題,字段映射、字段拆分,有些地址分析,有區有路有門牌號,這樣的東西我們要做拆分,做分級管理,然后才能做一些融合。不同的數據庫里,不同的系統里,我們對于同一個地址的描述有時候是不一樣的。還有數據率重的問題,不同的數據融合到一起,有些數據是互補的,有些數據是重復的,重復的會涉及到這樣一些問題。異構加權的問題,VIP數據跟普通用戶數據融合到一起需要加權的問題,這樣做產品的時候才會有更好的效果性。

融合清洗的時候會涉及到很多問題,數據統一標識、數據脫敏處理、數據更新與同步、數據交換與共享、數據清洗與比對、數據記錄濾重、字段映射與互補。基于這些多源數據可以做哪些分析?基于關聯關系的融合是空間的維度,基于時間關系的融合、基于關聯關系的融合。基于關聯關系主要是通過相關性的分析,物與物的關聯、人與物的關聯、產品與需求的關聯,現在是可以計算的,可以算出需求,產學研的分析、上下游的分析。

我們常用的企業有時候想找競爭對手的核心技術,A企業和某個學校的教授合作,你不太方便再跟他合作,那我們招聘這個教授畢業帶的博士來工作,因為這個博士對博導的工作方式非常了解。通過這樣的非直接的方式,這個在大數據時代是可以的。通過論文預測專利,通過專利來預測市場。基于空間關系的融合,聚類分析,看用戶聚類與畫像、產品聚類、人員聚類。社會網絡分析,看合作網絡、關系網絡、引文網絡、鏈接網絡。異常分析,孤立點分析、突然消失分析。

就國家二胎的政策,這個經過很多的計算,通過公安統計、民政、衛生、財稅、教育、勞動與社會保障,把所有數據融合在一起,當然現在這個政策的推出有一些詬病,本來是做社會的承受力壓力、教育、保障、人口老齡口等等一系列問題,我覺得這個系統做得沒有問題,但是少了一個因素,只是從行政者管理的角度,沒有考慮老百姓生孩子的意義,特別是在北上廣的城市很多人不想要那么多孩子,因為壓力太大了,所以沒有考慮用戶的需求。如果把這樣的數據融合在一起,我覺得政策推出得會更合適、更受歡迎,因為這個政策推出稍微晚了一些。

提到政策,大數據可以做的事情就更多了,比如反腐,我們有金融大數據,現在打虎的成本蠻高的,現在的反腐都是主動的。很多腐敗的事件和案例,貪污受賄不會放在自己的名下,如果我們把人口的數據融合上,把行政的數據,通過家人或者秘書會發現,把工程項目的數據跟他融合在一起,可能會有更好的監測。前段時間我們給一個政府去做多源數據的融合,他是綜合治理部門,他的數據融合的渠道有很多,和垂直系統的交換,還有網絡信息采集、共享平臺的交換,現在的系統越來越多,不同的系統中數據如何來共享和對接,還有空間的數據,有些社區的臺賬,社區的基層工作人員報的數據可能不是網絡的,就像我們在銀行填申請單一樣紙版的數據,包括移動終端采集的數據。對這些數據驅做建模和整理。

對于一個企業來講,我們的數據包括三方面,我們自有的數據、我們購買合作的數據和交易的數據、公開信息來源的數據,把這些不同類型的數據融合在一起,這是電子商務里的一些交易數據的融合,歷史的信息、檢索日志的信息、上網行為的信息、地址的信息。現在大部分電子商務公司還是不去搜集你的收貨信息,如果搜集這種信息的話用戶畫像就更清楚了,現在可以知道你什么時候在單位什么時候在家,這些數據是可以分析的。整個的多源數據融合,從理論方面有這樣一些。D-S證據和深度學習的算法,去處理一些重名的情況,對技術的問題實現歷史數據和外部數據的融合,線上線下的融合、傳感器硬數據與軟數據的結合,實現這樣一些應用,這是整個的體系。

多源數據融合整體上是實踐驅動的領域,和大數據一樣。社會人文的數據和物理信號的數據同樣重要,商務領域更加重視多源信息進行交叉印證與關聯分析。我的演講就到這里,謝謝!

本文題目:北京大學化柏林:多源數據融合方法與應用
文章源于:http://m.kartarina.com/article18/sojedp.html

成都網站建設公司_創新互聯,為您提供云服務器網站收錄App開發網站排名品牌網站設計微信小程序

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

微信小程序開發
欧美日韩激情_美女国产一区_国产精品久久久久影院日本_69xxx在线
国产精品福利一区| 亚洲国产毛片aaaaa无费看| 在线观看一区二区精品视频| 丁香婷婷综合网| 精品一区二区三区av| 免费精品视频在线| 午夜一区二区三区视频| 亚洲超碰精品一区二区| 香蕉加勒比综合久久| 日韩高清不卡一区| 蜜桃精品视频在线观看| 久久99国产精品麻豆| 国产精品自拍三区| 国产精品一区二区x88av| 国产成人av电影免费在线观看| 成人在线视频首页| 91蝌蚪porny成人天涯| 欧美视频在线不卡| 欧美电视剧在线看免费| 久久伊人蜜桃av一区二区| 欧美激情一区二区三区四区| 综合欧美亚洲日本| 天堂一区二区在线| 国产精品资源在线看| 91丨porny丨户外露出| 欧美日韩亚洲不卡| 26uuu亚洲婷婷狠狠天堂| 国产精品无码永久免费888| 一区二区三区四区亚洲| 久久精品国产亚洲高清剧情介绍 | 国产伦精品一区二区三区免费迷 | 自拍偷拍国产亚洲| 日韩精品一级中文字幕精品视频免费观看 | 国产综合久久久久影院| 91在线精品秘密一区二区| 欧美日韩国产片| 国产欧美日韩综合精品一区二区| 亚洲视频免费在线| 久久99国内精品| 色狠狠av一区二区三区| 亚洲在线免费播放| 国产成+人+日韩+欧美+亚洲| 欧美日韩激情一区| 国产精品三级久久久久三级| 欧美日本不卡视频| 欧美经典一区二区| 日韩高清不卡一区二区三区| 99久久精品免费看| wwww国产精品欧美| 亚州成人在线电影| 色综合天天综合网天天看片| 欧美大片拔萝卜| 天天综合网天天综合色| fc2成人免费人成在线观看播放 | 51久久夜色精品国产麻豆| 中文字幕av资源一区| 美女在线视频一区| 欧美日韩精品一区二区在线播放| 国产欧美日韩综合精品一区二区| 麻豆91在线观看| 欧美日韩大陆一区二区| 一区二区三区在线看| 中文字幕成人av| 国产呦精品一区二区三区网站| 欧美日韩成人综合| 一区二区三区日韩精品视频| 成人福利视频网站| 国产亚洲欧美激情| 国产在线精品免费| 自拍偷拍亚洲欧美日韩| 成人午夜视频网站| 国产亚洲综合性久久久影院| 久久av资源网| 精品久久久久久久久久久久久久久久久 | 亚洲欧洲综合另类在线| 国产91精品一区二区| 久久一日本道色综合| 国产福利一区二区三区在线视频| 精品福利二区三区| 国内久久婷婷综合| 国产日韩欧美一区二区三区综合| 国产一区二区三区在线观看免费| 精品国产伦一区二区三区观看体验| 日韩av成人高清| 亚洲精品在线一区二区| 久久精品欧美一区二区三区不卡| 国产福利一区二区三区在线视频| 久久久久久久久久电影| 成人精品高清在线| 亚洲欧美激情视频在线观看一区二区三区 | 国产精品一级片| 欧美极品少妇xxxxⅹ高跟鞋| 成人av电影免费在线播放| 亚洲欧美日韩综合aⅴ视频| 欧美亚日韩国产aⅴ精品中极品| 一区二区三区四区中文字幕| 欧美一区二区二区| 久久综合久色欧美综合狠狠| 成人高清免费观看| 性欧美疯狂xxxxbbbb| 精品国产伦一区二区三区免费 | 欧美三级三级三级| 久久99精品久久久久婷婷| 久久精品一区二区三区不卡 | 国产乱码字幕精品高清av| 国产精品卡一卡二卡三| 欧美性猛交xxxx黑人交| 激情五月激情综合网| 日韩一区中文字幕| 日韩一区二区三区高清免费看看| 国产一区二区三区最好精华液| 91福利精品视频| 久久99国产精品尤物| 亚洲欧洲精品一区二区三区不卡 | 亚洲高清免费观看| 日韩欧美成人午夜| 色天天综合色天天久久| 毛片一区二区三区| 尤物av一区二区| 久久久av毛片精品| 777奇米成人网| 99re这里只有精品6| 麻豆精品新av中文字幕| 亚洲精品成人在线| 国产午夜精品福利| 欧美另类高清zo欧美| 亚洲国产精华液网站w| 欧美军同video69gay| www.亚洲色图.com| 激情图区综合网| 亚洲高清免费视频| 亚洲欧美二区三区| 国产日产欧美一区| 精品噜噜噜噜久久久久久久久试看 | 国产91在线观看| 麻豆精品视频在线| 亚洲国产va精品久久久不卡综合 | 美女在线视频一区| 亚洲成人在线观看视频| 亚洲三级久久久| 欧美激情综合在线| 国产人妖乱国产精品人妖| 久久精品国内一区二区三区| 天天色天天操综合| 亚洲成人黄色小说| 亚洲五码中文字幕| 亚洲精品免费在线| 亚洲狼人国产精品| 一区二区三区在线观看欧美| 亚洲视频在线观看三级| 亚洲欧美日韩电影| 亚洲黄色性网站| 亚洲美女偷拍久久| 一区二区三区四区不卡在线 | 久久久午夜电影| 26uuu国产电影一区二区| 欧美一区二区视频免费观看| 欧美日韩一级片在线观看| 在线免费视频一区二区| 欧美少妇xxx| 欧美精品vⅰdeose4hd| 538prom精品视频线放| 日韩精品一区二区三区三区免费| 91精品国产综合久久蜜臀| 日韩欧美一级二级三级久久久| 欧美一区二区精品久久911| 日韩精品一区在线| 精品国产伦一区二区三区观看方式| 久久这里只精品最新地址| 欧美激情综合五月色丁香小说| 亚洲色欲色欲www| 亚洲国产日日夜夜| 老司机精品视频在线| 国产91精品在线观看| 在线观看亚洲精品视频| 日韩一区二区三区视频在线| 国产日本欧美一区二区| 亚洲一区二区三区四区的| 日韩av一区二区三区| 成人高清免费观看| 777奇米四色成人影色区| 国产日产亚洲精品系列| 亚洲一二三区在线观看| 极品少妇一区二区| 91香蕉视频污在线| 国产精品毛片久久久久久久| 亚洲电影第三页| 国产一区二区免费看| 色av成人天堂桃色av| 日韩午夜激情免费电影| 中文字幕制服丝袜成人av | 国产人成亚洲第一网站在线播放| 亚洲天堂免费在线观看视频| 日韩和欧美一区二区| 成人综合激情网| 久久99精品久久久久久久久久久久| 成人av电影在线观看| 精品国产一区二区三区久久影院 | 在线精品视频一区二区三四| 久久免费偷拍视频|