首页
学习
活动
专区
工具
TVP
发布

海外人才的创新黑科技(上)

天道有常,這個“”指的是“規律、邏輯”,是歷史車輪的前路,是世態發展的前行腳步,她“不為堯存,不為桀亡”。

我們來看近年次第興起的“熱詞”,其中便暗含了這“常”:

首先是“信息大爆炸”,使得世界變成“平”的,地球上任何地方,尤其是技術發展領先的區域出現了一個新的成果,很快就能傳遍業界,繼而形成轉化落地。這加速了人類社會文明的進步與科技的發展。

信息多到令人窒息,吾生有崖而學海無涯,我們沒有閒暇去看雜亂的虛假信息、陳南往事……我們對資訊質量的要求越來越高,一個有價值的訊息被美譽為“乾貨”,因此接下來我們的時代出現了一句口號:“內容為王”。

人越來越務實,“乾貨”一詞越來越多以“模型”、“調研結果”、“數據分析報告”等數字化形態來被表現,陳述客觀事實而非抒發胸臆與闡述願景。這時,核心詞彙變成了“數據”,繼而是“大數據”,仿佛調查的樣本越多,結果越有參考價值。

大數據”給人一種假象,即因為樣本的龐大,調研似乎已經從抽樣調查變成了全樣本調查,從而得出一個“事實”而非“估計”。這樣龐大的數據量人無法處理,於是人想到了“機器換人”。

新時代的AI提法由此誕生了。我們稱之為“深度學習”,而我們要教會她啥呢?她得學習如何幫助人類處理海量的數據。

12月末在廣州召開的中國海外人才交流大會(第20屆中國留學人員廣州科技交流會)留海海歸黑科技產品推介的舞臺上,“大數據”的使用再度成為創新關注的焦點問題。

BADiS智能機器學習平臺

如上所言,BADiS也認為,進入大數據時代後,工作的重心已從數據的獲取轉移到數據的篩選,而目前存在一個痛點,縱然是運用計算機,研究人員仍需花費90%時間用於預處理、提特征、調參上。根據業界現狀,數據處理一般遵循以下流程:

導入數據

缺失值處理、類型轉換、特征規劃化、採樣過濾

構造特征、特征選擇

GBDT隨機森林、SVM lr建模

參數搜索、驗證評估

結果呈現

BADiS的創新在於將AI引入數據分析環節,將流程調整為:

選擇場景,導入數據

自動預處理

建模評估

分佈式訓練

自動調參

結果呈現

分行業場景,利用常模訓練AI,由AI來代替人作信息篩選,而人從一個“運動員”身份轉為“教練”,職責從“檢查”變為“監督”,對結果不是校準而是從分析方法上作調整,由AI基於方法而自行得出結果。

這其實是一個思維模式的極大轉變:如果計算機只是幫我們加速,那她永遠只是個計算機而已,惟有當計算機能獨立把事情做完,這才是AI。我們是“授AI以漁”而非“魚”。

熵商鏈

熵商鏈關注房地產,這是一個湧現眾多大企業的行業,但同時出現馬太效應:富者愈富,窮者愈窮。熵商鏈希望通過這個平臺整合針對房地產行業的金融環節,從而幫助房地產供應鏈上游中小企業融資。

目前,房地產供應鏈上游中小企業融資難、成本高的問題,匯票使用場景受限,轉讓難度較大,金融機構需要投入人力物力去驗證交易信息的真偽是行業痛點。對此,熵商鏈利用了區塊鏈技術,做出了以下創新:

簡化信息交互方式,解決傳統不擅長數據共享的問題:

多節點維護同一個賬本,依靠智能合約生成賬本內數據,減少過往企業之間大量的、複雜的數據接口對接工作

提供去中心化平臺,解決傳統不能夠讓各參與方互信的問題:

區塊鏈技術具有去中心化、時序數據、集體維護、可編程的智能合約和安全可信五大特點,解決傳統平臺信息不對稱而影響供應鏈的效率問題

海量數據支撐,解決傳統數據維度單一不作為的問題:

整合廣聯達等第三方數據與通過物聯網設備監控現場施工狀況,建立由“人工智能+大數據+物聯網”支撐的供應商信用體系

歸根結底,熵商鏈平臺的本質依舊是解答“大數據如何處理與篩選”的問題,這個平臺注重數據的真實性,區塊鏈等技術看似減慢了效率,但是“磨刀不誤砍柴工”,從整體來看成本遠低於對海量數據進行事後審查的工作。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181225G0E1NS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券